首页   注册   登录
 fy 最近的时间轴更新

fy

https://github.com/fy0
V2EX 第 21834 号会员,加入于 2012-06-03 21:35:36 +08:00
今日活跃度排名 5207
根据 fy 的设置,主题列表只有在你登录之后才可查看
fy 最近回复了
3 天前
回复了 ghostsmile 创建的主题 问与答 双拼真的快很多吗?
是快很多。初中学会,用到现在,血赚了
主要是术语各有各的说法,很多没法令人信服,好的翻译也比较少。

但好的翻译还是不排斥的,例如个人认为 firefox 调试器和 mdn 的一些翻译就很不错。
32 天前
回复了 springmarker 创建的主题 硬件 世纪难题,选什么 CPU 比较好
虚拟化没啥问题啊?用的啥虚拟机?
@flowfire #8 其实我当年看的也是这个译名,印象中是诸神字幕组吧。我还挺喜欢这个名字的
这都好久了啊 我看的那时候,还是我高考完那个暑假
40 天前
回复了 Buffer2Disk 创建的主题 程序员 Python 和 Go 在循环时候的性能对比
看到 2.7,吓得我赶紧看看日历,怀疑自己穿越了
> 不少人 base64 编码 email 或者 WX 等联系方式,那是骗爬虫的,爬虫是根据文本特征提取文本的,base64 只不过隐藏了 email 地址等的文本结构特征。 然而照样可以抓 base64 编码,然后解码判断提取。

那又如何?我来告诉你这个操作对爬虫意味着多了什么:
1. 提取出页面上疑似 base64 编码的文本
2. 尝试使用 base64 解码,如果解码失败则跳过,或尝试其它解码算法
3. 如果解码成功,那么判断是否包含联系方式
4. 定位到原文本,结合原文本上下文获取辅助信息,例如是微信 /手机号 /某某 IM 的 ID 还是其它

无 base64 情况:
1. 一条正则带走,数据入库,下一个。
理由举了好几条,但是唯独最重要的东西没说:
好用吗?方便吗?

好用就用 不好用就不用
59 天前
回复了 legao5kzhen 创建的主题 宠物 求获取养猫知识的途径
半年的猫了,奶制品什么啊,普通猫粮就行了。不过五只有点多啊
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3424 人在线   最高记录 5043   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 9ms · UTC 05:35 · PVG 13:35 · LAX 22:35 · JFK 01:35
♥ Do have faith in what you're doing.