V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 73 页 / 共 133 页
回复总数  2641
1 ... 69  70  71  72  73  74  75  76  77  78 ... 133  
2020-05-04 10:33:56 +08:00
回复了 qianyealone 创建的主题 Python Python 文本采集替换图片的问题
@llsquaer #9
我代码贴上来以后不知道 http 前面为什么多了空格, 反正在本站贴代码基本就是脑补
https://paste.ubuntu.com/p/M4Q3QwnZRs/
2020-05-03 23:32:11 +08:00
回复了 bandian 创建的主题 分享发现 b 站到底用了啥黑科技,油管的视频加载速度都比 b 站快
@1835407125 #9 前几天确实出现过大范围的... 我看的吃货请闭眼, 打开了一个很老的视频(当初有声音), 结果一上来就没声音, 弹幕里都炸开锅了... 今天打开同一个视频又有声音了...

平时 B 站视频加载很快啊, 也没任何卡顿过, 坐标山东联通, 不过工作时候折腾他们家的 cdn 把我折腾疯了, 就那么三四个域名的 cdn 是最稳定的, 后来不需要解析只需要提供 m3u8 以后就没怎么折腾他们家 cdn 了

不过目前体验过的所有视频网站, 由管 渲染时候感觉是最快最轻量的, 交互也各种 smooth(顺滑如狗), 其他站点就算开了最高的去广告, 看后台还是几百个奇怪请求打出去, 太离谱了... 播放器用户体验也差距甚大
1. 先定时访问, 判断出 Cookie 实际有效期. 在 Cookie 字段里的 expire 或者 max age 是给浏览器看的, 有时候不是服务端那边的, 所以不保险.

2. 长期有效方面, 如果你能用 Headless 或者正常的方式成功登录, 那只要有一步验活请求, 就知道 Cookie 失效时候刷新 Cookie 就好了.

验证码方面大部分都用的机器视觉那些库做的, 滑动验证码我在 Headless 里用 dispatch Event 的方式拖拽每次都被反爬, 用 pyautogui 去拖拽就不会, 头疼...
2020-05-03 18:04:29 +08:00
回复了 NGPONG 创建的主题 Visual Studio Code vscode 有什么插件可以一键生成工程模板所需的文件
听起来像 Cookiecutter... 虽然从来没用过
2020-05-03 18:03:39 +08:00
回复了 enzo1205 创建的主题 程序员 网站 ssl 证书过期问题
我是每年申请一次新证书, 然后去 nginx 上覆盖... 网站里只要所有 ajax/link/css 之类的请求都走 https 就好了
2020-05-03 18:01:28 +08:00
回复了 clockOS 创建的主题 音乐 我写的曲子上架到 QQ 音乐了
很抱歉,您查看的歌曲已下架

到 QQ 音乐反馈平台向我们投诉或提出建议

很抱歉,您查看的歌曲已下架

到 QQ 音乐反馈平台向我们投诉或提出建议

很抱歉,您查看的歌曲已下架

到 QQ 音乐反馈平台向我们投诉或提出建议
2020-05-03 17:22:37 +08:00
回复了 qianyealone 创建的主题 Python Python 文本采集替换图片的问题
我热晕了, 两次答非所问...

html = '<img alt="" src="http://img.baidu.com/2020/05/20200503105830041.jpg"/>'
print(re.sub('(?<=src=") http[^"]*/', '', html))
# <img alt="" src="20200503105830041.jpg"/>
2020-05-03 17:17:41 +08:00
回复了 qianyealone 创建的主题 Python Python 文本采集替换图片的问题
2020-05-03 17:06:11 +08:00
回复了 qianyealone 创建的主题 Python Python 文本采集替换图片的问题
本地开个 static/images 文件夹下载图片, 然后路径用相对路径, 记得别用 windows 的反斜杠, 用 as_posix 的

大致用的就是:

requests 的 Response.content 写入 file
pathlib 的 as_posix

没什么其他信息, 就这样吧

PS: 图片名字如果不重要的话, 最简单的就是图片地址转 md5 名字, 避免文件名重复, 也不用处理不同路径同名文件
2020-05-03 17:02:14 +08:00
回复了 LUREN 创建的主题 JavaScript 能否使用 JavaScript 选中网页里的指定文字?
我就感觉一开始需求就解读有问题...

这种情况先把 DemoA 的数据结构化成 map, 然后再迭代 DemoB, 从 map 里取 Google 什么的, 取到就塞
住了 3 年多自如, 倒真没遇到过, 一年和管家聊不了三四次, 基本都是修灯泡...

一般有任何事情都是直接微信找管家, 管家不管就找客服了
2020-05-03 16:33:49 +08:00
回复了 LUREN 创建的主题 JavaScript 能否使用 JavaScript 选中网页里的指定文字?
听起来像 jQuery 的 contains...
2020-05-03 16:27:05 +08:00
回复了 LUREN 创建的主题 JavaScript 能否使用 JavaScript 选中网页里的指定文字?
看楼主的意思... 就是根据文字然后选中它, 这个选中是找到节点就行, 还是框选 createTextRange 那样?

PS: 能直接给例子或者描述完整需求么, 有可能一开始方向就歪了啊...
2020-05-03 12:19:08 +08:00
回复了 xmlf 创建的主题 问与答 Chrome 自动填充后无法切换
lastpass 以后倒是遇不到这问题了, 然后... 手势一直用系统级的全局手势(linux 上只要不是 Wayland 就没啥问题), 去广告用的 ublock...

不过我遇到个问题就是平时电脑睡眠唤醒以后, 地址栏的自动补全书签的功能似乎有时候不灵不灵的...
python37.zip 这东西么, 可以参考下 Python 标准库里的 zipapp 部分, 也就是 PEP 441 那里讲的, 也就是 shiv 所使用的把整个项目和依赖打包成单个 zip / pyz 文件那套方案, 当然也可以放依赖


sys.path 什么的不如 print(sys.executable) 看看解释器路径

然后依赖这方面问题, anaconda 貌似用他们自己家的虚拟环境, 所以走的和你外面的全局 Python 解释器不一样的, 所以用 print(sys.executable) 看到解释器路径(估计是个虚拟环境里的路径), 用这个代替 @python 执行试试看
2020-05-03 00:12:20 +08:00
回复了 yeqizhang 创建的主题 生活 结婚挺复杂的
看了这么多楼, 感觉剧情走向都有点超出我的想象力了, 简直刷三观...

遇到这种家务事, 我 99% 是不敢插手的, 更别说插嘴了, 楼主加油
人生总有那么一段:

面向考试编程
面向简历编程
面向薪水编程
想编程就编程
2020-05-02 22:15:20 +08:00
回复了 saximi 创建的主题 Python 请问安装 pyperclib 时报这个错误是怎么回事呢?
pyperclip
2020-05-02 18:28:23 +08:00
回复了 zhengfan2016 创建的主题 Python 有大神研究过 36kr 的视频栏目接口吗?
pageCallback 是个 base64, 解码就明白什么规则了, 总体不是太复杂吧, 翻页就是通过这参数搞的

{"firstId":2918165,"lastId":2916690,"firstCreateTime":1588221046000,"lastCreateTime":1588136451000}

{"firstId":2919576,"lastId":2918231,"firstCreateTime":1588413629000,"lastCreateTime":1588224626000}

怎么抓一个问一个... 如果不擅长 js 什么的, 不如考虑直接 Headless chrome 算了......
1 ... 69  70  71  72  73  74  75  76  77  78 ... 133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   722 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 22:04 · PVG 06:04 · LAX 15:04 · JFK 18:04
Developed with CodeLauncher
♥ Do have faith in what you're doing.