V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 68 页 / 共 133 页
回复总数  2649
1 ... 64  65  66  67  68  69  70  71  72  73 ... 133  
想起当年解析 B 站的逆天 CDN 支配的时候了... 老被用户反馈怎么播放这么卡啊~
2020-06-25 23:41:34 +08:00
回复了 Colorful 创建的主题 Python 请教一个 Python 爬虫,抓取 JS 变量的问题
@Colorful ... 你是把 Tag 对象给正则了... 我以为提前已经 outerHTML 或者 text 了, 早点休息吧, 大过节的能不写代码就不写代码
2020-06-25 23:29:51 +08:00
回复了 Colorful 创建的主题 Python 请教一个 Python 爬虫,抓取 JS 变量的问题
我自己写框架调用无头浏览器拿变量也就三四行...

正则的话, 你正则写错了吧? 没原始代码不容易拼,

r' window\._xxxx = ([\s\S]*?)</script>'

你这又 xxx 又空 {} 的, 还是好好学学正则吧, 最怕盲猜需求
2020-06-25 10:43:30 +08:00
回复了 azev 创建的主题 Python pypi 这个仓库好简陋
某些第三方有统计下载数的

https://pypistats.org/packages/ichrome

我用的 Github badge 工具也有 https://shields.io/#your-badge

上个版本更简陋, 没准人家设计就是要去马太效应呢, 再说, 下载量并不是合理选票, 如果被 SEO 了再被刷了, 建站初衷都没了, 换个领导再来个竞价排名什么的, 风气全歪了

想看热门什么的, Awesome XXX 上都有(就同名项目看到过七八个了), 也算给 MD 项目留了条活路不好么, 每个月总有那么几个帖子被顶起来也该看的到

就像四大周报之一的 Awesome Python: https://python.libhunt.com/newsletter/212
去年大火的: Genymobile/scrcpy: Display and control your Android device - https://github.com/Genymobile/scrcpy

一直很火的: Welcome | Frida • A world-class dynamic instrumentation framework - https://frida.re/docs/home/

不纠结 python 的话选择更多, 稍微会点 adb shell 的命令, 很多东西可以做, 就像 Tasker, 价格特别便宜( 2 顿饭?), 主要是可以把自动操作的脚本做成 apk, 脱离电脑自己执行挺方便的
2020-06-21 10:16:18 +08:00
回复了 patx 创建的主题 Linux ssh config 是否安全?
没有绝对的安全, 跳板机, LDAP 登录, 动态口令, 各种东西都敌不过一行代码漏洞
2020-06-17 20:37:53 +08:00
回复了 JieS 创建的主题 程序员 关于 HTTP 请求, POST 请求为什么有的接口还在 url 里传参数呢?
1. 设计
2. 日志分析
3. 历史遗留
2020-06-04 22:21:37 +08:00
回复了 istill 创建的主题 Python 怎么实现多个域名共享 cookie?
这种一般在后端更简单点

前端的话, 别用 Cookie 用 localStorage sessionStorage 试试?
2020-06-02 22:41:06 +08:00
回复了 chaleaoch 创建的主题 Python 求助,求推荐 celery 的轻量级替代方案
这种量级没什么必要走消息队列吧
这就个位数的任务, 也不用非得启动 celery 那么重吧
最最简单的, 生产者消费者模式:
启动服务的时候丢一个多线程后台跑着消费 Python 自带的 queue, 然后 api 被调用的时候把相关参数传入 queue 里去, 又线程安全, 又避免高并发出问题(可以加个 sleep 避免触及第三方 api 的 rate limit)
如果需要并发, 那这个 background 就可以换成 thread executor, api 被调用的时候无脑给 pool 里 Submit 一个函数+参数就可以异步启动了

不过如果 Django 经常要重启, 这就没法持久化 Callback 的参数了, 确实该用 celery 或者消息队列...
2020-05-31 13:37:42 +08:00
回复了 dallaslu 创建的主题 问与答 你的个人项目放在哪儿,阿里云还是腾讯云?
话说阿里云上注册的域名, 去腾讯云上用不用重新备案吧...
2020-05-31 13:37:10 +08:00
回复了 dallaslu 创建的主题 问与答 你的个人项目放在哪儿,阿里云还是腾讯云?
288 阿里云三年还剩不到一年, 再过半年打算薅良心云的毛, 这几天 599 三年的和 288 三年的比, 内存减半五倍带宽
2020-05-31 13:26:49 +08:00
回复了 yuban10703 创建的主题 Python 关于爬虫异步多线程的问题
前几天刚看到的...
Guide to Concurrency in Python with Asyncio ⋆ Mark McDonnell - https://www.integralist.co.uk/posts/python-asyncio/

其他的搜索结果 https://www.clericpy.top/newspaper/articles.query.html?query=asyncio&date=&start_time=&end_time=&source=&lang=ANY&order_by=ts_create&sorting=desc&limit=10&offset= 只看四星以上结果吧, 这个过滤器当初忘了写... 过几天再补

然后, asyncio 用的时候和多线程有点像, 但是又很多区别, 官方如果能设计的像 gevent 那种就好了... 不吐槽了, 大致要看的就是 Future 的思想, 然后知道 asyncio.Task 是一个已经在执行的协程任务, 如果你的数据库操作库不支持协程, 就只能丢到一个 "线程 executor" 里面做一个协程包装(也就是丢给线程, 但可以被 await)

至于你说的从上一步结果里取, 那就是个串行关联了, 因为第二步可能也要用协程, 所以就尽量别用 add_done_callback, 做好 await 就行了

多数人用协程的时候很少会开多个线程然它单独跑一个事件循环, 因为一不小心通信过程会遇到 different loop thread 之类的 runtime error, 所以用 executor 包装下更省心

没代码也说不了太多了
2020-05-26 11:21:50 +08:00
回复了 GrapeCityChina 创建的主题 推广 在线表格文档系统开发,五大技术难点及解决方案
哈哈哈, 其实做在线表格没什么别的要求, 照 Google sheets 复制一份我就挺知足了

往上一翻, 还真是三个月前的...
2020-05-26 10:33:47 +08:00
回复了 huazhaozhe 创建的主题 Python Python 如何实现一个和属性值相关的单例?
纠正下 #4

后半句说的是单例模式... new 里做的就是用元组 (attr1, attr2) 做 key 去缓存里找

上半句是说可以参考下 Borg 模式
2020-05-26 10:31:02 +08:00
回复了 huazhaozhe 创建的主题 Python Python 如何实现一个和属性值相关的单例?
Borg 模式? 缓存字典放到类属性里, 在 `__new__` 里做类似单例的事情
用 psutil 迭代出来挨个排除吧... 我清理 Chrome 就是这么干的...
2020-05-23 15:31:18 +08:00
回复了 szyp 创建的主题 Python Python 有没有什么好用的命令行图形库 ?
上面提过的 terminal table 工具都挺不错的, 我想顺路问下, 有没有带刷新的 panel 版本的表格啊... 类似 htop 那种不断刷新的控制台的
2020-05-23 13:50:55 +08:00
回复了 songdg 创建的主题 Python 请教如何对齐
@songdg #5 不齐的原因可能你不是等宽字体?

对齐的话, 直接用在终端里打印 table 的库算了
2020-05-23 12:16:35 +08:00
回复了 ran1ever 创建的主题 职场话题 公司来了个"大佬" 大家来判断下是不是真大佬
@Tumblr #33 跑题了... 别纠结这个了啊, 用的 Chrome 扩展 "划词翻译" 选的 Google 中国的源
1 ... 64  65  66  67  68  69  70  71  72  73 ... 133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1125 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 53ms · UTC 23:29 · PVG 07:29 · LAX 15:29 · JFK 18:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.