1
imom0 2013-12-29 23:31:19 +08:00 1
把登录了的cookies导出行么,然后给爬虫用。
|
2
Kjuly 2013-12-29 23:33:39 +08:00 1
mechanize 或者 selenium
|
3
kevinroot 2013-12-29 23:37:27 +08:00 1
requests不行?是有验证码?
|
4
geeklian 2013-12-29 23:50:45 +08:00 via iPad 1
想起来曾经单位内部网站上抓取数据,.net,的post请求里的一堆东西不知道干啥的。python抓不下来,结果我换的autoit+ie8...直接模拟鼠标键盘操作了。
|
5
fdsfsdfsdf3334 OP @imom0 软件需要长期在服务器上运行,cookies 3天过期
|
6
fdsfsdfsdf3334 OP @kevinroot 没有验证码,但不排除以后他可能增加验证码
|
7
fdsfsdfsdf3334 OP @Kjuly 哦 谢谢 我研究下
|
8
airyland 2013-12-30 00:29:51 +08:00 1
为了对付某站验证码在用的采集方法:
NodeJS + socket.io + phantomjs 1.建socket服务端 2.phantomjs 打开目标网站,执行表单填写,如果有验证码,则render一张图,调用stdin来手工输入验证码。在phantomjs里每隔一段时间执行get页面操作保持会话。与服务端建立socket连接 3.用NodeJS或者浏览器端javascript连接到socket服务端并发送采集请求,phantomjs里面收到请求并获取数据发送到客户端 done... |
9
fdsfsdfsdf3334 OP @airyland 3Q
|
11
Stile 2013-12-30 11:55:30 +08:00
来个投机取巧的,这网站有手机版的么?有的话直接模拟手机不得了,改下UA就好,想咋弄咋弄!
|
12
fdsfsdfsdf3334 OP 木有手机版的
@Stile |
13
Stile 2013-12-30 15:50:57 +08:00
@fdsfsdfsdf3334 地址呢?我换UA试试。。嘿嘿 好奇中
|
14
fdsfsdfsdf3334 OP @Stile 淘宝
|
15
Stile 2014-01-01 22:35:18 +08:00
@fdsfsdfsdf3334 淘宝啊 ,你是想编辑商品?那用淘宝助理就可以了,没必要抓来抓去的。。。
|
16
Stile 2014-01-01 22:37:35 +08:00
@fdsfsdfsdf3334 淘宝也有手机版的啊,你可以登录 m.taobao.com 试试
|
17
ibopo 2016-12-19 01:04:43 +08:00
scrapy-js
|