V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  dedewei  ›  全部回复第 2 页 / 共 3 页
回复总数  55
1  2  3  
2015-04-03 14:01:23 +08:00
回复了 dedewei 创建的主题 Python 浏览器正常浏览,爬虫出错,都有哪些可能性?
@wdd2007
@willsplashing 没有cookie,其他复制粘贴上去了
@txx 等什么时候用上全套苹果了,再尝试上手...
@breestealth 略夸张.....筒子也好给力,现在2500了....其实500就够我用了..........
@li2150 其他都是GTD型的效率应用,这个工具口号是organize your brain,主打功能不太一样。主楼说了,有人用来写作,作笔记,清理思路等等.....
@txx Omni系列的软件对我来说上手难度略高...........
@txx 立马google............不过真的大爱workflowy的,很少碰到工具自己第一次用就喜欢上。Evernote算一个..........
2015-03-25 08:30:24 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@AnyOfYou mark.....等再熟练点再好好看看......
2015-03-25 08:29:02 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@happywowwow 哈哈哈〜,提供很好的素材,这就爬去!!!!!!!!!!
2015-03-25 08:28:22 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@caoz 多谢,当时顺手google了下,没找到,就放弃了。还没用过api,打算这就试试。非常感谢。
2015-03-25 08:22:49 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@lerry lxml and Requests 似乎大家都在推荐这样,继续学习。谢谢指点!
2015-03-25 08:20:03 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@terrychang 没看懂,不过谢谢,以后遇到再试试
2015-03-24 13:13:03 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@xiaogui 我好像理解错你说的频率了?
2015-03-24 13:09:28 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@dedewei 尝试了下,直接urllib2.urlopen(url)都返回403,应该不是频率问题吧
2015-03-24 13:06:03 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@xiaogui 会不会是之前ip被屏蔽,等了很久,添加cookie再试的时候刚好解封了,所以才运行了几分钟? 频率是设置爬取的时间间隔?爬一个网页等5秒这样子?我试试。
2015-03-24 12:58:56 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@terrychang
@messense
@jarlyyn 我想问的是,是不是如果上面模拟浏览器的步骤不出错,就肯定能继续爬?还是说上面即使模拟浏览器成功了,依然有其他方式导致403?
2015-03-24 12:57:02 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@terrychang 运行了两分钟.....又403了.....
2015-03-24 12:53:18 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@messense 谢谢给的建议
2015-03-24 12:51:41 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@terrychang 非常感谢,带上cookie运行成功了
2015-03-24 12:48:13 +08:00
回复了 dedewei 创建的主题 Python 爬豆瓣相册遇到 403,伪装浏览器不成功,呼叫总部...
@jarlyyn 试过把所有header除了cookie都copy一遍,也不行。添加了Referer也还是不行。

小白,现在目标是先把脚本运行起来。所以cookie等知识打算一边学一边补。非常感谢你的回答。
2015-03-19 10:10:20 +08:00
回复了 dedewei 创建的主题 Python 想爬豆瓣电影,用正则匹配出错,不清楚哪里不对,求搭救
@frankzeng 小白,一切以运行成功为目的.....不过正则真的很痛苦.....
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5956 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 02:23 · PVG 10:23 · LAX 18:23 · JFK 21:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.