我是一名大学 Python 小白,我一次偶然的机会接触到了 Python 爬虫,感觉很是喜欢,所以我现在真心想了解和学习这方面技能,不知道前辈有什么推荐书籍或者其他学习方式吗?
1
linvaux 2019-09-19 00:15:53 +08:00 via Android
先把 requests 库看明白
|
3
MrZhaoyx 2019-09-19 09:00:19 +08:00
最近在看《 Python 网络数据采集》,写的挺不错的
|
4
Leigg 2019-09-19 09:14:57 +08:00 via Android
requests,beautifulsoup,scrapy,lxml,re,这几个是爬虫必知必会的库,先用熟,再看源码掌握其原理就是中高级了。
|
5
aaronhua 2019-09-19 09:37:33 +08:00
哔哩哔哩上一搜一大把的视频教程。个人觉得,新手不建议看书。视频更容易入手些。
|
8
locoz 2019-09-19 10:18:25 +08:00
先定义一下爬虫的两种方向:
垂直爬虫指只爬特定的某些网站,且对所需数据都进行标准化、格式化的爬虫 通用爬虫指做搜索引擎、新闻聚合等用的那些爬虫,什么网站都爬,但只需要提取一些浅层的数据 然后你可以先看看崔庆才的书,现在他那个书的第一版已经免费了,在博客上就能直接看,虽然不算很深,但广度基本足够了,入门的时候用来了解一下还是可以的。 然后看方向决定是深入哪方面,如果想往垂直爬虫方向发展就深入逆向,如果想往通用爬虫方向发展就深入算法、机器学习。 |
11
locoz 2019-09-19 10:22:07 +08:00
偷偷打个广告,我之前发的文章也可以看看。我现在和几个号主一起组建了 NightTeam 团队(微信公众号沿用了之前的 [小周码字] ),未来发布的文章也可以看看,都是高质量文章,跟那些一天到晚标题搞噱头、内容纯水的号不一样。
|
16
hackxing 2019-09-19 13:34:24 +08:00
自己学 Python 爬虫的笔记: https://meowv.com/category/python/
|
17
wangkai0351 2019-09-19 13:38:44 +08:00
@hackxing 大多是照本宣科,看不出有自己的理解见解,库源码分析都没有,就不要拿出来了吧
|
19
SjwNo1 2019-09-19 13:48:03 +08:00
反爬 反反爬 反反反爬 。。。。
|
20
DOUWH 2019-09-19 17:31:58 +08:00
真心劝你别学爬虫~
|
21
337136897 2019-09-19 21:06:42 +08:00
你悠着点,已经不少学爬虫 的进了看守所了
|
22
cherbim 2019-09-20 05:47:30 +08:00
实战效率最高,找视频跟着爬
ps:对了,讲个笑话,搞爬虫的最后归宿永远是看守所 |