1
skydiver 2016-06-10 16:49:00 +08:00 via iPad
为什么不能都访问两次
|
2
guolingbing OP @skydiver 因为我有强迫症啊=,=
|
3
skydiver 2016-06-10 16:51:20 +08:00 via iPad
@guolingbing 有病得治啊(^_^*)
|
4
gxustudent 2016-06-10 20:31:28 +08:00
如果有强迫症的话建议,进入百度的服务器,看看他的判断逻辑是什么,再先办法绕过。
|
5
mofeiwo 2016-06-11 13:36:29 +08:00
怎么简单怎么来啊。
|
6
hantsy 2016-06-11 14:17:44 +08:00
但是在这 100 次中第一次总是乱码,跟没解析一样,之后都正常。。。
应该可以设置默认页面编码的。 |
7
gonjay 2016-06-11 23:38:11 +08:00
有 docker 版本的可以用,能直接通过 api 来调
|
8
rale 2016-06-12 11:20:39 +08:00
我是这样理解的,百度的 js 对系统的默认解码算法进行了一下修改,导致在没有 js 的时候默认的解码算法出来的是乱七八糟的文字,所以我觉得你的是 selenium 第一次请求时, js 还未请求下来执行,而第二次有了第一次的缓存,所以未乱码。
你可以设置 implicitly_wait 多等待一下看下情况,或者你将 webdriver 换成 firefox , 这样你可以通过调试工具看是否有资源未被加载完。 |
9
alexapollo 2016-06-12 16:17:13 +08:00
代码还是格式化一下, markdown 规则
|