服务器 curl 偶尔 http_code 返回 302 redirect_url 是 54.218.31.246/r.html
然后 54.218.31.246/r.html 其实就是这个 gen.xyz
被劫持了吗?
并不总是出现 偶尔会出现 没什么规律.
1
soha 2016-11-18 16:59:58 +08:00
也许是运营商干的
|
2
lhbc 2016-11-18 17:35:31 +08:00
被劫持
抓包看 TTL |
3
zhenhang 2016-11-19 12:03:48 +08:00
应该是被运营商劫持了,如果是托管在机房里的服务器,可以跟当地运营商投诉,如果是云服务器,也是直接找商家投诉。。。然而很多情况下并没什么用,因为被劫持的情况可能有很多,国内的网络情况确实很糟糕,很多网站比如百度这样的,也是因为被运营商劫持得多了,现在全部改用 https 了。所以,如果抓取的是自己的系统,能升级 https 自然是最好的。
说回你的问题,如果你是用 php 的 curl 写的抓取脚本的话,可以用 CURLOPT_FOLLOWLOCATION 属性设置自动跳转。 http://php.net/manual/en/function.curl-setopt.php |