jeffreychiu95's recent timeline updates
jeffreychiu95

jeffreychiu95

V2EX member #237110, joined on 2017-06-25 16:00:37 +08:00
jeffreychiu95's recent replies
双因子认证啊
手机看 v 站,点进了楼主给出的第一个博客链接,Bootstrap 写的前端,移动端都没适配的吗,会不会给人第一印象就不太好啊
Apr 15, 2018
Replied to a topic by yixiugegegege Python 爬虫的几个问题,请教一下大佬,
1. 搜索引擎、github 上面找一下是否已有关于目标网站验证码的代码实现。如果没有,可以看看有没有别的网站用同类型的验证码,再搜索。如果有研究的兴趣,学习图像处理和机器学习的相关知识。接入打码平台很便宜,同时你可以获取到标注好的数据集。之后自己训练模型去识别。
2. 如果是像微博、知乎用户动态等 feed 流的,有明显的先后顺序的,可以考虑每次取出已有的最新的 id(或者其它标识),开始爬取,当爬到这个 id 时就停止。如果想获取像 v 站新发的帖子,新发布的网页这种的。数据量小的话,可以将已有的 url/id 读取到内存,看是否已经有。数据量大的话,Redis 了解一下~
3. corntab
Apr 7, 2018
Replied to a topic by cdlixucd Linux gce 国外的节点用 ssh 连接老爱断开
@cdlixucd 暴躁老哥?谁跟你说 mosh 就是要拿着手机弄了?
@iyaozhen 嗯明白,就是说如果数据库和代码都在同一服务器的话,服务器被拿了相当于就可以完全复现对吗?
@sw10 谢谢您回复。感谢您给出的参考项目,你提示了我签到这个和我的需求确实是异曲同工的。我会去参考您的实现方案,谢谢😁
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2443 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 08:10 · PVG 16:10 · LAX 01:10 · JFK 04:10
♥ Do have faith in what you're doing.