1
abelyao 2014-12-10 16:41:28 +08:00
抵制一切爬站采集的行为!
我愿意在 v2ex 发帖交流,但我不愿意我发表的内容,被复制到一个我不知道的网站去! |
2
Livid MOD OP |
3
tinyhill 2014-12-10 16:45:15 +08:00
被爬了说明有价值,只能这么安慰自己。
|
5
kurtrossel 2014-12-10 16:48:20 +08:00
爬到数据也不会珍惜的,真能发掘出更大价值也算,各种滥用
|
7
abelyao 2014-12-10 16:50:07 +08:00
@Livid 真蛋疼,这些站就该倒闭光了才好。
之前在自己的网站 或 cnblogs 写过几篇热门博客,也都 “被发表” 到一些大论坛大网站去,有些好点的在角落里留个署名,大多数什么来源都没标注。 |
8
kmvan 2014-12-10 16:50:15 +08:00 via Android
這并发略吊…
话说Karma是…? |
9
jiang42 2014-12-10 16:53:15 +08:00
就是说之前v2ex不稳定是爬虫的原因?
|
11
herozzm 2014-12-10 17:30:32 +08:00
这个爬虫不合格啊,这个密集采集,都会被管理员K的
|
12
Showfom 2014-12-10 17:31:52 +08:00
这爬虫太明显了吧。。。。
|
13
learnshare 2014-12-10 17:34:02 +08:00
垃圾站:我们不生产内容,我们只是内容的搬运工。
互联网的内容不应该复制来复制去,有必要的话,一个链接过来就好了。<a> 不是互联网的核心? |
14
raincious 2014-12-10 17:41:21 +08:00
|
15
lincanbin 2014-12-10 17:43:30 +08:00
这写爬虫都不知道换个baiduspider的header
|
16
xieguobihaha 2014-12-10 17:55:09 +08:00
good job
|
17
abelyao 2014-12-10 18:31:53 +08:00
|
18
matrix67 2014-12-10 18:57:39 +08:00 via Android
不过贵站那个收藏回复值应该开放出来
|
21
matrix67 2014-12-10 20:03:32 +08:00 via Android
|
24
matrix67 2014-12-10 20:17:30 +08:00 via Android
不是 ╯﹏╰ 哎,不用这个小号了。
|
26
lifechan 2014-12-10 20:52:31 +08:00
国内环境如此,比技术比创意,都是在比剽窃,不脚踏实地早晚掉到深沟。
|
27
v2014 2014-12-10 22:06:45 +08:00
@Livid http://v2ex.com/my/nodes/sorted ,打印traceback了
|
31
ericls 2014-12-11 00:52:09 +08:00 via Android
有一天我发现我的博客全部发到了百度文库 还分好了类 排好了版
|
32
karma 2014-12-11 09:17:36 +08:00
咋感觉....躺枪_(:з」∠)_....
|