脚本包括绕过反爬、模拟用户行为等功能。
PS:自己学习研究目的写的
1
evill 2020-09-29 10:05:54 +08:00 1
只要你收钱,或者指使别人使用就问题
难道卖菜刀给别人,别人杀了人 你有责任? |
2
thefack 2020-09-29 10:10:04 +08:00 2
反正是有责任的,就看处不处理你的问题了,这绕过反爬就是有问题
|
5
wangkun025 2020-09-29 10:16:28 +08:00 26
“寻衅滋事”
|
6
crclz 2020-09-29 10:18:18 +08:00 4
难说。
卖菜刀不犯法,但是卖枪犯法。 如果你写一个程序,运行这个程序就发射核弹,那么即使是别人运行你的程序,你也得背锅。 |
7
silerLee 2020-09-29 10:24:38 +08:00
把这些东西去掉不行吗。就非要上传
|
8
loginbygoogle 2020-09-29 10:27:28 +08:00 12
“犯没犯法不是你说了算!”
|
9
nekochyan 2020-09-29 10:35:13 +08:00
看楼上的意思就是说你脚本如果本身就是用来做犯法的事,那你肯定是有责任的
|
10
coderluan 2020-09-29 10:35:48 +08:00 5
功能要是通用的没针对性就没啥问题, 但是你要在文档或者注释写了爬 XXX 时用, 那你绝对是侵害了 XXX 的利益, 也就说你卖刀可以, 但是你要是吆喝, 我这刀, 一把就能砍断 XXX 的狗头, 那就有问题了.
|
11
FantaMole 2020-09-29 10:40:36 +08:00 3
这个不好说,提供侵入、非法控制计算机信息系统的程序、工具罪,这个罪毕竟是个口袋罪。完全看法院心情
|
12
SecureCode 2020-09-29 10:43:10 +08:00 via Android 9
你姓赵的话就没责任
|
13
Chry3anthemum 2020-09-29 10:49:31 +08:00
@FantaMole #11 原文:“这个不好说,提供侵入、非法控制计算机信息系统的程序、工具罪,这个罪毕竟是个口袋罪。完全看法院心情”
====== 回复:还有寻衅滋事。 我曾多次对社会上发生的某些事情向当地信箱反应是否构成寻衅滋事,得到的答案都不是。 比如今年年初发生在青岛崂山的事情。 |
14
c6h6benzene 2020-09-29 10:50:50 +08:00 via iPhone 6
“不要拿法律当挡箭牌”
|
15
laoyur 2020-09-29 10:53:02 +08:00 8
@Chry3anthemum 你再多咨询几次,你自己就成了
|
16
dunn 2020-09-29 10:53:07 +08:00 via iPhone
这跟你制作了一个病毒,然后别人运行了,一样的啊
|
17
xingshu1990 2020-09-29 11:00:34 +08:00 1
你这个绕过反爬,模拟用户行为,具体去搜搜抖音或者微信的爬虫代码,或者反编译,看看 github 有没有人去提供。
本身这种反编译技术,能对那些做坏事的人,有推动的嫌疑或者说可能。这个我不是律师,不能明确表示:哪个法律,哪个条例具体描述其违法行为。不过真要抓你的话,都能说的上。 |
18
redtea 2020-09-29 11:03:40 +08:00 via iPhone
怕就 Private
|
19
RangerWolf 2020-09-29 11:05:02 +08:00 2
我不是专业律师,但是楼上的回复,还是各种自行瞎想的成分居多。
至少没有看到比较专业、严谨的回答。 楼主真想知道, 去知乎问问吧,去那边主动 AT 几个律师,得到的回复我相信比在这里要靠谱得多。 有靠谱回答,欢迎再贴回来这边跟大家分享。 |
20
maxxfire 2020-09-29 11:17:59 +08:00 via iPhone
GitHub 在国外,是否遵循的是国外法律
|
21
InkStone 2020-09-29 11:19:17 +08:00 6
@RangerWolf 然而这并不是一个法律问题,咨询专业律师无疑南辕北辙。
|
22
chenzheyu 2020-09-29 11:19:29 +08:00
你加一个对现行爬虫脚本反爬行为研究不就行了
|
23
Cielsky 2020-09-29 11:20:50 +08:00 via Android 1
@Chry3anthemum 是否成立不完全取决于你,还依赖于起诉方,随便举个例子,比如南山必胜客
|
24
dhkjenfbfu 2020-09-29 11:26:22 +08:00
肯定会找到你,上面用菜刀举例毫无参考,跟互联网没有可比性。互联网是有连坐制度的,帮助 XX 活动罪有几个,比如你的网站别人用来犯罪,你提供的 VPN 、主机被别人用来犯罪,你都是被连坐的,可以去搜搜判决就知道了。
|
25
PopRain 2020-09-29 11:26:24 +08:00
本来觉得大陆法系比较好,都是成文法,清晰明了,没有想到还有口袋罪,随便解释。。。。。 真不如判例法
|
26
12101111 2020-09-29 11:29:08 +08:00 2
1.挂上开源协议,一般都有免责条款
2.1 是没有用的,不要在代码里写死或者透露出被爬的网站的信息.因为只有被爬的网站才会起诉你 3.由 2,你开发了一个爬虫框架,而不是爬某个特定网站的脚本,这时候危险性就大大降低了 4.我不是律师,上述均属扯蛋,可靠与否自行判断 |
27
mrhhsg 2020-09-29 11:29:42 +08:00
只想告诫楼主,法律不是挡箭牌!
|
28
kiroter 2020-09-29 11:31:00 +08:00
目标不要搞的太具体,X 音。 仅供学习使用。代码也不要写的太具体, 意思到就行了。
|
30
dhkjenfbfu 2020-09-29 11:42:47 +08:00
@PopRain 法律好坏跟是哪个法系关系不大,跟法治水平和贪腐程度相关
|
31
RangerWolf 2020-09-29 11:44:53 +08:00
@InkStone 难道这是一个道德问题?
|
32
Googlefan 2020-09-29 11:47:51 +08:00
自用吧,说不准哪天就喝茶了
|
33
zypy333 2020-09-29 12:03:18 +08:00
如果是通用型的爬虫技术,别人拿来根本没法直接爬具体某个网站,肯定得自己调试修改
|
34
Wincer 2020-09-29 12:06:25 +08:00 1
王欣:“技术无罪”,然后就进去了
|
35
SuujonH 2020-09-29 12:13:00 +08:00
爬虫写的好 牢饭吃到饱😂
|
36
Greatshu 2020-09-29 12:42:46 +08:00
应该不会,GitHub 上还有很多勒索病毒源码,可比爬虫恶劣多了。
|
37
hsuvee 2020-09-29 13:34:24 +08:00
假如脚本是用 py 写的,是不是得搞一搞 Guido
|
38
pkoukk 2020-09-29 13:45:29 +08:00
法无许可不可为 手动狗头
|
39
ljt1997 2020-09-29 13:49:49 +08:00 via Android
买菜刀的知道菜刀能犯罪所以会把菜刀管制好,你自己知道你自己的东西很可能被利用犯法,你还要放出来,那就是知法犯法,利用漏洞,罪加多等!
|
40
ljt1997 2020-09-29 13:52:02 +08:00 via Android
买菜刀的知道菜刀能犯罪所以会把菜刀管制好,你自己知道你自己的东西很可能被利用犯法,你还要放出来,那就是知法犯法,利用漏洞,罪加多等!
@maxxfire 你人在国内犯法,跟你用哪里的技术犯罪有啥关系呢? |
41
yolee599 2020-09-29 13:55:26 +08:00
github 是免费( free )的
|
42
soulmt 2020-09-29 14:06:41 +08:00
先搞清楚 2 件事情,犯法工具和犯法行为
拿非法工具做犯法的行为,你觉得要不要连带责任? 拿适法的工具做违法的事情,你觉得要不要连带责任? 那么问题来了,你写的爬虫是不是非法的。我也不知道,如果要连带,爬虫库的开发人员,也应该进去喝喝茶。 |
43
zengxs 2020-09-29 14:11:13 +08:00 3
参考世辉律师事务所的文章 http://www.shihuilaw.com/news/news/4424
绕过反爬显然是属于违法的,通过绕开对方计算机系统的限制进行数据获取,已经属于非法侵入计算机系统的范畴 这个构成非法侵入计算机信息系统罪 提供相关工具也构成提供侵入、非法控制计算机信息系统程序、工具罪 所以回到楼主的问题,这个行为确实是违法的,很多人在 GitHub 上提供类似的爬虫代码目前只是没人去追究而已 |
45
aloxaf 2020-09-29 14:19:00 +08:00
对国内网站就别做这种事情了,万一有人拿你的程序爬网站被人家公司抓 /告了,你肯定也跑不了的。不管你最终有没有罪,一趟折腾下来你也得够呛,何必呢。
你实在想分享技术就写几篇博文,不涉及具体代码以及网站名称。 |
46
howellz 2020-09-29 14:31:56 +08:00
@raaaaaar 看去报案的是谁啊?一般小公司肯定没啥事。碰到必胜客这种,非法经营、破坏计算机系统、窃取企业机密、传播病毒,再不济寻衅滋事,总能跟你安一条。
|
47
JB18CM 2020-09-29 14:37:11 +08:00
珍爱自由, 远离爬虫
|
48
imn1 2020-09-29 14:38:24 +08:00
首先,我不清楚“连带责任”是怎么判定的,所以没有确切结论
如果有指明网址或网站,建议还是撤了吧 如果你的例子只是爬 127.0.0.1,应该问题不大 |
49
beny2mor 2020-09-29 14:44:06 +08:00
行为定性的话, 是违法的, 一般有大量数据的网站都会有未经允许不得使用数据的条款。
|
50
Tyuans 2020-09-29 14:58:33 +08:00
真难说,你正常驾驶突然冲出来个人,撞了行人全责你不也得赔点么
|
51
TimPeake 2020-09-29 15:30:45 +08:00
GitHub 上不上有版权协议的吗
|
52
araraloren 2020-09-29 15:41:56 +08:00
如果你的代码中有针对 特定的网站 的话,一般都是有问题的
|
53
pmispig 2020-09-29 15:51:17 +08:00
协助破坏计算机信息罪
寻衅滋事罪 |
54
dingwen07 2020-09-29 15:54:00 +08:00 via iPhone 5
“犯没犯法不是法律说了算!”
|
55
ditel 2020-09-29 16:52:41 +08:00 via Android
只放核心,实际的应用去了,然后说只是研究完事
|
57
lysS 2020-09-29 18:47:34 +08:00
现在 reCAPTCHA3 不是没法破解吗?为啥那么多网站不用?还能被爬。。。
|
58
locoz 2020-09-29 18:50:13 +08:00 via Android 1
之前跟律师朋友聊过这个问题,答案是并不会。
因为你只是写了这么一个程序,平台方并没有证据能证明你有对对方平台进行实际的采集,所以即使有人用你的程序搞出了事情并且说是用了你的程序,你也不需要承担任何责任。 外包也是同理,如果采集的东西本身就是公开信息,且委托方没有说过具体用途,或者是说的用途没有什么问题,那么在这种情况下假设他去搞了一些会出事的事情,你也一样不需要承担任何责任,因为你对事情并不知情。 |
59
loryyang 2020-09-29 18:54:57 +08:00
让我想起了盗版影片字幕组后来会标注仅供学习
|
60
Semidio 2020-09-29 19:21:06 +08:00
@lysS #53 可能是因为商业版要收费? https://cloud.google.com/recaptcha-enterprise/pricing
|
61
IGJacklove 2020-09-29 20:14:29 +08:00 via Android
@wangkun025 这条罪名能抓百分之九十九的人。。。
|
62
wangkun025 2020-09-29 20:35:58 +08:00 1
@IGJacklove “不要拿法律当挡箭牌”, 剩下的 1%也解决了。
|
63
thtznet 2020-09-29 21:38:36 +08:00
如果肉身在国内,"法律不是当挡箭牌!"
|
64
Wicked 2020-09-29 21:42:54 +08:00 via iPhone
这完全取决于使用者用来干嘛,如果爬了惹不起的站惹了不该惹的人,估计凶多吉少。上面说找律师的,真被抓典型的话,律师都给你吊牌了。
|
65
greatbody 2020-09-29 21:58:35 +08:00
|
66
germain 2020-09-29 23:41:26 +08:00
首先你的代码能否被定义为 malicious code
其次你的代码是否是成品,是否拿下来改个 URL 微调下其它参数就能运行并达到“绕过反爬、模拟用户行为等”的效果。 符合以上,那么你违反了 Github 的 Community Guidelines Github 不禁止用户发布能够用来开发 malicious action 的 code (比如单独发布反爬模块的代码),很多情况这种 code 都是用来学习研究用。但是 Github 禁止用户发布 malicious 成品本身(成品爬虫,改个 URL 或微调下就能绕过反爬机制模拟用户行为等爬取目标服务上的内容)。 用上面一些朋友的比方来解释一下就是:你可以在平台上讲解炸弹的原理,但是你不能把做好的炸弹直接放在平台上面。 |
67
aguesuka 2020-09-30 07:38:27 +08:00 via Android
法不可知威不可测
|
68
anjingdexiaocai 2020-09-30 08:07:17 +08:00 via Android
@yolee599 free 大概是自由而非免费
|
69
joeyFuck 2020-09-30 08:49:19 +08:00
关键在于菜刀还是枪支
|
70
learningman 2020-09-30 09:02:53 +08:00
@PopRain 哪里的法律都有满足这种需求的方法。法律作为统治阶级的工具,哪个法系并不影响它发挥功能。
不要把法律当挡箭牌.jpg |
71
yolee599 2020-09-30 09:11:57 +08:00
@anjingdexiaocai #68 我玩梗呢
|
72
penll 2020-09-30 09:27:14 +08:00
是的关键在于,你的工具代码是否具有危险性。
比如:能爬 zf 的或者军事数据。 就相当于,你把玩具放地上,别人拿去用没事,但是,你把手雷放地上,那么你就有过失的罪名了 |
73
wupher 2020-09-30 09:28:02 +08:00
看了上面的回复,那要是谁设计了一个语言,方便学习+使用,结果有人拿去开发了爬虫、黑客工具,那我有罪吗? - 易语言
再抛开语言,有人基于 Linux 以及各种嗅探、扫描工具,整合一份分发版,这种我会有罪吗? -kali 最后,连代码都没敢写,设计了一份网络代理传输、加密、伪装工具,结果有人拿去 F(A)Q,这个又怎么说?-不敢写 好怀念当年学 Basic |
74
penll 2020-09-30 09:48:47 +08:00
|
75
tz894305532 2020-09-30 09:50:10 +08:00
参考快播王兴,技术有罪吗?
|
76
ScepterZ 2020-09-30 09:52:47 +08:00
口袋罪主要看有没有人想让你犯罪,分析法律是没用的,这些只能按做题思维,事后诸葛亮,强行分析
|
77
fallinlovewith 2020-09-30 10:00:27 +08:00
你最好声明一下,说要遵守法律法规,本 demo 只供学习交流,。。。。。。其他概不负责
就像水库立警示牌:水深,禁止游泳 |
78
zunceng 2020-09-30 10:10:40 +08:00
在 github 上看过到一个 点赞 /fellow 别人 github 的项目的项目 几分钟能 fellow 好几 w 然后被 github 关了 看不到源代码了
有没有法律责任不知道 |
79
Torpedo 2020-09-30 10:28:54 +08:00
难说,但理论上应该不算。
还是看你参与的程度 |
80
jaylee4869 2020-09-30 10:35:45 +08:00
开!源!协!议!是!做!什!么!的?
|
81
qq05629 2020-09-30 11:35:20 +08:00 1
老王在路上丢了一把刀, 被荆轲捡到了:
荆轲拿这把刀捅了一个流氓地痞, 被判 3 年, 老王一点事没有; 荆轲拿这把刀去通秦王, 被诛九族, 连带老王也被满门抄斩; |
82
hoyixi 2020-09-30 11:44:46 +08:00
在我国说不清,说你有罪你就有罪
|
83
ddefewfewf 2020-09-30 11:46:00 +08:00 via iPhone
GitHub 实名吗?不实名 让他慢慢找
|
84
ddefewfewf 2020-09-30 11:47:38 +08:00 via iPhone
GitHub 一堆带 ssr 也没事
|
85
bmwh123 2020-09-30 13:00:29 +08:00
那我用那种模拟浏览器行为的( puppeteer 这样的)做算犯法吗,抓取的是特定的网站。
|
86
Jooooooooo 2020-09-30 13:01:20 +08:00
警察抓人不看法律
再不济寻衅滋事肯定是可以安排上的 你自己掂量吧 |
87
515576745 2020-09-30 13:09:31 +08:00 via Android
本代码仅供学习使用
|
88
huangsw 2020-09-30 13:12:43 +08:00
欲加之罪 何患无辞
|
89
liulilte 2020-09-30 16:11:39 +08:00
别人用的东西造成的危害小,你就没有事情,危害大你就有连带责任。
------------------------- 在世界任何一个国家,甭管你有没有罪,只要上头说你有罪你就有罪。 |
90
hahaandyou001 2020-09-30 16:40:42 +08:00 via Android
@PopRain 因为你国从来就不是法治国家
|
91
mfi 2020-10-01 10:52:24 +08:00
爬虫不是问题,问题是绕过反爬做到什么程度了,以及最终造成的影响
没利益关系的话一般问题不大,快播和熊猫烧香都是有直接或者间接利益关系的 话说你担心这个的话为什么要做源码公开,私有仓库放着不行吗 |