V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  whatsmyip  ›  全部回复第 22 页 / 共 22 页
回复总数  436
1 ... 13  14  15  16  17  18  19  20  21  22  
2017-08-03 16:36:01 +08:00
回复了 hellolinux 创建的主题 问与答 刚接到朋友的微信请求,不过内容却无语
就算把密码给你 也看不到以前的聊天记录啊。

云存储压根就没对用户开放权限。
2017-08-02 20:52:08 +08:00
回复了 tianxiacangshen 创建的主题 PHP 这段防 CC 攻击代码如何?
设置 COOKIE 只是发出了一个 http header,浏览器禁用 COOKIE 就不会执行。

你可以把 COOKIE[] 看作是一个普通变量,自然可以在写入后读取了。

真想用 COOKIE 的话,可以先让跳转到某一页面种 COOKIE。

不过话说这种手段基本防君子不防小人。
2017-08-02 18:29:32 +08:00
回复了 klausgao 创建的主题 程序员 微信、微博的点赞功能是怎么实现的?
redis list 就可以做到吧
2017-07-31 18:51:48 +08:00
回复了 AlexLJ 创建的主题 程序员 即将步入大三的学长给 CS 专业新生的一些建议
一脸蒙蔽
2017-07-30 18:00:03 +08:00
回复了 xiandao7997 创建的主题 问与答 舍不得卖掉旧手机攒钱入新手机怎么破
备用机+1

旧手机从来不扔不卖,嫌抹掉数据麻烦
2017-07-25 13:16:13 +08:00
回复了 cheneydog 创建的主题 Docker Docker 镜像太太太大了。
alpine +1
不过目前过 G 的只见过 Hadoop
怎么解读还是咨询律师吧
2017-07-22 16:02:10 +08:00
回复了 satifanie 创建的主题 微信 如何恢复微信删除好友的聊天记录
1. 试试手机数据恢复软件(可能性太低了)

2. 从微信服务器上下(内部或 XX 渠道)

3. 从对方那拷 ^_^
2017-07-22 15:49:45 +08:00
回复了 Richardhtw 创建的主题 问与答 讨厌某些产品却不得不用
感觉每个行业还是一大一小比较好,既能保持创新的活力,用户也能得到实实在在的好处
2017-07-22 15:47:27 +08:00
回复了 Richardhtw 创建的主题 问与答 讨厌某些产品却不得不用
所以有垄断法呀,你看早期 IBM 还有现在的 GOOGLE 天天被人追着告。

然而国内。。。似乎还没有严格执行
2017-07-17 21:21:39 +08:00
回复了 tianxiacangshen 创建的主题 PHP 如何控制多 IP 低频率的采集
哦,对了。

googlebot 也是爬虫,不要误伤。
2017-07-17 21:20:07 +08:00
回复了 tianxiacangshen 创建的主题 PHP 如何控制多 IP 低频率的采集
有人愿意找这么多代理爬,看来不是小站而且数据应该还比较有价值?

先说结论吧,爬虫、反爬虫、反反爬虫。。。。。就是一个生生不息的过程,__具体能进行到哪一步就看双方能力和性价比了__(恩,还有最重要的代理数目,不过这是终极对决了)。要是公开数据,而且对方的爬虫行为没有影响系统运行的话,还是睁一只眼、避一只眼吧。。。

不过,攻防的过程确实是挺有意思的,能学到不少知识^_^

目前来看,比较容易上的一个措施就是在 js/css/img 文件上动手脚,找一个站点一定会加载的 js 文件。该 IP 请求 js 资源时做个标记,如果超过两次访问没有带标记则封杀。可能会有误伤

再进一步的话,可以是频率限制,周期长一点,具体的限制根据网站用户来决定,这样对方再多的 IP 也会被限制在一定的范围内。不过这样会消耗一定的资源,看具体日 IP 了,用 redis。

补一句,免费的代理数量是有上限的,而且可用性非常差,要是对方为了爬你的数据买了什么高大上的收费服务的话,不如沟通下,把数据打包卖给他**


之前写爬虫的时候总结的
[http://blog.newnius.com/stream-spider-several-strategies.html#反反爬虫]( http://blog.newnius.com/stream-spider-several-strategies.html#反反爬虫)
2017-07-17 20:57:09 +08:00
回复了 tianxiacangshen 创建的主题 PHP 如何控制多 IP 低频率的采集
@gidot 感觉这个反爬措施应该是最弱的吧,再入门的爬虫课程都会提到要改 UA。。。

而且,就这一条,感知后分分钟就能破了。
三个 41 号 已用,THX。

延迟似乎略高,超过一分钟了
1 ... 13  14  15  16  17  18  19  20  21  22  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1036 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 19:59 · PVG 03:59 · LAX 11:59 · JFK 14:59
Developed with CodeLauncher
♥ Do have faith in what you're doing.