V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coloz
V2EX  ›  程序员

想问下,我把爬虫脚本放到 github,别人使用了,我会受到连带责任么?

  •  2
     
  •   coloz · 2020-09-29 10:03:16 +08:00 · 11369 次点击
    这是一个创建于 1516 天前的主题,其中的信息可能已经有所发展或是发生改变。

    脚本包括绕过反爬、模拟用户行为等功能。

    PS:自己学习研究目的写的

    91 条回复    2020-10-01 10:52:24 +08:00
    evill
        1
    evill  
       2020-09-29 10:05:54 +08:00   ❤️ 1
    只要你收钱,或者指使别人使用就问题
    难道卖菜刀给别人,别人杀了人 你有责任?
    thefack
        2
    thefack  
       2020-09-29 10:10:04 +08:00   ❤️ 2
    反正是有责任的,就看处不处理你的问题了,这绕过反爬就是有问题
    raaaaaar
        3
    raaaaaar  
       2020-09-29 10:15:01 +08:00 via Android   ❤️ 1
    @thefack #2 有什么责任,谁来处理,什么法条,说清楚。
    zoharSoul
        4
    zoharSoul  
       2020-09-29 10:15:53 +08:00   ❤️ 2
    @raaaaaar 入侵计算机系统罪 /狗头
    wangkun025
        5
    wangkun025  
       2020-09-29 10:16:28 +08:00   ❤️ 26
    “寻衅滋事”
    crclz
        6
    crclz  
       2020-09-29 10:18:18 +08:00   ❤️ 4
    难说。
    卖菜刀不犯法,但是卖枪犯法。
    如果你写一个程序,运行这个程序就发射核弹,那么即使是别人运行你的程序,你也得背锅。
    silerLee
        7
    silerLee  
       2020-09-29 10:24:38 +08:00
    把这些东西去掉不行吗。就非要上传
    loginbygoogle
        8
    loginbygoogle  
       2020-09-29 10:27:28 +08:00   ❤️ 12
    “犯没犯法不是你说了算!”
    nekochyan
        9
    nekochyan  
       2020-09-29 10:35:13 +08:00
    看楼上的意思就是说你脚本如果本身就是用来做犯法的事,那你肯定是有责任的
    coderluan
        10
    coderluan  
       2020-09-29 10:35:48 +08:00   ❤️ 5
    功能要是通用的没针对性就没啥问题, 但是你要在文档或者注释写了爬 XXX 时用, 那你绝对是侵害了 XXX 的利益, 也就说你卖刀可以, 但是你要是吆喝, 我这刀, 一把就能砍断 XXX 的狗头, 那就有问题了.
    FantaMole
        11
    FantaMole  
       2020-09-29 10:40:36 +08:00   ❤️ 3
    这个不好说,提供侵入、非法控制计算机信息系统的程序、工具罪,这个罪毕竟是个口袋罪。完全看法院心情
    SecureCode
        12
    SecureCode  
       2020-09-29 10:43:10 +08:00 via Android   ❤️ 9
    你姓赵的话就没责任
    Chry3anthemum
        13
    Chry3anthemum  
       2020-09-29 10:49:31 +08:00
    @FantaMole #11 原文:“这个不好说,提供侵入、非法控制计算机信息系统的程序、工具罪,这个罪毕竟是个口袋罪。完全看法院心情”
    ======
    回复:还有寻衅滋事。

    我曾多次对社会上发生的某些事情向当地信箱反应是否构成寻衅滋事,得到的答案都不是。

    比如今年年初发生在青岛崂山的事情。
    c6h6benzene
        14
    c6h6benzene  
       2020-09-29 10:50:50 +08:00 via iPhone   ❤️ 6
    “不要拿法律当挡箭牌”
    laoyur
        15
    laoyur  
       2020-09-29 10:53:02 +08:00   ❤️ 8
    @Chry3anthemum 你再多咨询几次,你自己就成了
    dunn
        16
    dunn  
       2020-09-29 10:53:07 +08:00 via iPhone
    这跟你制作了一个病毒,然后别人运行了,一样的啊
    xingshu1990
        17
    xingshu1990  
       2020-09-29 11:00:34 +08:00   ❤️ 1
    你这个绕过反爬,模拟用户行为,具体去搜搜抖音或者微信的爬虫代码,或者反编译,看看 github 有没有人去提供。
    本身这种反编译技术,能对那些做坏事的人,有推动的嫌疑或者说可能。这个我不是律师,不能明确表示:哪个法律,哪个条例具体描述其违法行为。不过真要抓你的话,都能说的上。
    redtea
        18
    redtea  
       2020-09-29 11:03:40 +08:00 via iPhone
    怕就 Private
    RangerWolf
        19
    RangerWolf  
       2020-09-29 11:05:02 +08:00   ❤️ 2
    我不是专业律师,但是楼上的回复,还是各种自行瞎想的成分居多。
    至少没有看到比较专业、严谨的回答。 楼主真想知道, 去知乎问问吧,去那边主动 AT 几个律师,得到的回复我相信比在这里要靠谱得多。

    有靠谱回答,欢迎再贴回来这边跟大家分享。
    maxxfire
        20
    maxxfire  
       2020-09-29 11:17:59 +08:00 via iPhone
    GitHub 在国外,是否遵循的是国外法律
    InkStone
        21
    InkStone  
       2020-09-29 11:19:17 +08:00   ❤️ 6
    @RangerWolf 然而这并不是一个法律问题,咨询专业律师无疑南辕北辙。
    chenzheyu
        22
    chenzheyu  
       2020-09-29 11:19:29 +08:00
    你加一个对现行爬虫脚本反爬行为研究不就行了
    Cielsky
        23
    Cielsky  
       2020-09-29 11:20:50 +08:00 via Android   ❤️ 1
    @Chry3anthemum 是否成立不完全取决于你,还依赖于起诉方,随便举个例子,比如南山必胜客
    dhkjenfbfu
        24
    dhkjenfbfu  
       2020-09-29 11:26:22 +08:00
    肯定会找到你,上面用菜刀举例毫无参考,跟互联网没有可比性。互联网是有连坐制度的,帮助 XX 活动罪有几个,比如你的网站别人用来犯罪,你提供的 VPN 、主机被别人用来犯罪,你都是被连坐的,可以去搜搜判决就知道了。
    PopRain
        25
    PopRain  
       2020-09-29 11:26:24 +08:00
    本来觉得大陆法系比较好,都是成文法,清晰明了,没有想到还有口袋罪,随便解释。。。。。 真不如判例法
    12101111
        26
    12101111  
       2020-09-29 11:29:08 +08:00   ❤️ 2
    1.挂上开源协议,一般都有免责条款
    2.1 是没有用的,不要在代码里写死或者透露出被爬的网站的信息.因为只有被爬的网站才会起诉你
    3.由 2,你开发了一个爬虫框架,而不是爬某个特定网站的脚本,这时候危险性就大大降低了
    4.我不是律师,上述均属扯蛋,可靠与否自行判断
    mrhhsg
        27
    mrhhsg  
       2020-09-29 11:29:42 +08:00
    只想告诫楼主,法律不是挡箭牌!
    kiroter
        28
    kiroter  
       2020-09-29 11:31:00 +08:00
    目标不要搞的太具体,X 音。 仅供学习使用。代码也不要写的太具体, 意思到就行了。
    Hack3rHan
        29
    Hack3rHan  
       2020-09-29 11:32:46 +08:00   ❤️ 2
    @raaaaaar 处理不需要法条,随便套个口袋就行了。毕竟朋友圈里奶奶个腿都是寻衅滋事。
    dhkjenfbfu
        30
    dhkjenfbfu  
       2020-09-29 11:42:47 +08:00
    @PopRain 法律好坏跟是哪个法系关系不大,跟法治水平和贪腐程度相关
    RangerWolf
        31
    RangerWolf  
       2020-09-29 11:44:53 +08:00
    @InkStone 难道这是一个道德问题?
    Googlefan
        32
    Googlefan  
       2020-09-29 11:47:51 +08:00
    自用吧,说不准哪天就喝茶了
    zypy333
        33
    zypy333  
       2020-09-29 12:03:18 +08:00
    如果是通用型的爬虫技术,别人拿来根本没法直接爬具体某个网站,肯定得自己调试修改
    Wincer
        34
    Wincer  
       2020-09-29 12:06:25 +08:00   ❤️ 1
    王欣:“技术无罪”,然后就进去了
    SuujonH
        35
    SuujonH  
       2020-09-29 12:13:00 +08:00
    爬虫写的好 牢饭吃到饱😂
    Greatshu
        36
    Greatshu  
       2020-09-29 12:42:46 +08:00
    应该不会,GitHub 上还有很多勒索病毒源码,可比爬虫恶劣多了。
    hsuvee
        37
    hsuvee  
       2020-09-29 13:34:24 +08:00
    假如脚本是用 py 写的,是不是得搞一搞 Guido
    pkoukk
        38
    pkoukk  
       2020-09-29 13:45:29 +08:00
    法无许可不可为 手动狗头
    ljt1997
        39
    ljt1997  
       2020-09-29 13:49:49 +08:00 via Android
    买菜刀的知道菜刀能犯罪所以会把菜刀管制好,你自己知道你自己的东西很可能被利用犯法,你还要放出来,那就是知法犯法,利用漏洞,罪加多等!
    ljt1997
        40
    ljt1997  
       2020-09-29 13:52:02 +08:00 via Android
    买菜刀的知道菜刀能犯罪所以会把菜刀管制好,你自己知道你自己的东西很可能被利用犯法,你还要放出来,那就是知法犯法,利用漏洞,罪加多等!
    @maxxfire 你人在国内犯法,跟你用哪里的技术犯罪有啥关系呢?
    yolee599
        41
    yolee599  
       2020-09-29 13:55:26 +08:00
    github 是免费( free )的
    soulmt
        42
    soulmt  
       2020-09-29 14:06:41 +08:00
    先搞清楚 2 件事情,犯法工具和犯法行为

    拿非法工具做犯法的行为,你觉得要不要连带责任?

    拿适法的工具做违法的事情,你觉得要不要连带责任?

    那么问题来了,你写的爬虫是不是非法的。我也不知道,如果要连带,爬虫库的开发人员,也应该进去喝喝茶。
    zengxs
        43
    zengxs  
       2020-09-29 14:11:13 +08:00   ❤️ 3
    参考世辉律师事务所的文章 http://www.shihuilaw.com/news/news/4424

    绕过反爬显然是属于违法的,通过绕开对方计算机系统的限制进行数据获取,已经属于非法侵入计算机系统的范畴
    这个构成非法侵入计算机信息系统罪

    提供相关工具也构成提供侵入、非法控制计算机信息系统程序、工具罪

    所以回到楼主的问题,这个行为确实是违法的,很多人在 GitHub 上提供类似的爬虫代码目前只是没人去追究而已
    php01
        44
    php01  
       2020-09-29 14:15:32 +08:00
    @pkoukk 法无禁止即可为,是对个人而言。法无许既禁止,是对公权力而言。
    aloxaf
        45
    aloxaf  
       2020-09-29 14:19:00 +08:00
    对国内网站就别做这种事情了,万一有人拿你的程序爬网站被人家公司抓 /告了,你肯定也跑不了的。不管你最终有没有罪,一趟折腾下来你也得够呛,何必呢。

    你实在想分享技术就写几篇博文,不涉及具体代码以及网站名称。
    howellz
        46
    howellz  
       2020-09-29 14:31:56 +08:00
    @raaaaaar 看去报案的是谁啊?一般小公司肯定没啥事。碰到必胜客这种,非法经营、破坏计算机系统、窃取企业机密、传播病毒,再不济寻衅滋事,总能跟你安一条。
    JB18CM
        47
    JB18CM  
       2020-09-29 14:37:11 +08:00
    珍爱自由, 远离爬虫
    imn1
        48
    imn1  
       2020-09-29 14:38:24 +08:00
    首先,我不清楚“连带责任”是怎么判定的,所以没有确切结论

    如果有指明网址或网站,建议还是撤了吧
    如果你的例子只是爬 127.0.0.1,应该问题不大
    beny2mor
        49
    beny2mor  
       2020-09-29 14:44:06 +08:00
    行为定性的话, 是违法的, 一般有大量数据的网站都会有未经允许不得使用数据的条款。
    Tyuans
        50
    Tyuans  
       2020-09-29 14:58:33 +08:00
    真难说,你正常驾驶突然冲出来个人,撞了行人全责你不也得赔点么
    TimPeake
        51
    TimPeake  
       2020-09-29 15:30:45 +08:00
    GitHub 上不上有版权协议的吗
    araraloren
        52
    araraloren  
       2020-09-29 15:41:56 +08:00
    如果你的代码中有针对 特定的网站 的话,一般都是有问题的
    pmispig
        53
    pmispig  
       2020-09-29 15:51:17 +08:00
    协助破坏计算机信息罪
    寻衅滋事罪
    dingwen07
        54
    dingwen07  
       2020-09-29 15:54:00 +08:00 via iPhone   ❤️ 5
    “犯没犯法不是法律说了算!”
    ditel
        55
    ditel  
       2020-09-29 16:52:41 +08:00 via Android
    只放核心,实际的应用去了,然后说只是研究完事
    Tarkky
        56
    Tarkky  
       2020-09-29 18:40:53 +08:00
    正在学习编程,给个链接呀 楼主 @coloz
    lysS
        57
    lysS  
       2020-09-29 18:47:34 +08:00
    现在 reCAPTCHA3 不是没法破解吗?为啥那么多网站不用?还能被爬。。。
    locoz
        58
    locoz  
       2020-09-29 18:50:13 +08:00 via Android   ❤️ 1
    之前跟律师朋友聊过这个问题,答案是并不会。
    因为你只是写了这么一个程序,平台方并没有证据能证明你有对对方平台进行实际的采集,所以即使有人用你的程序搞出了事情并且说是用了你的程序,你也不需要承担任何责任。
    外包也是同理,如果采集的东西本身就是公开信息,且委托方没有说过具体用途,或者是说的用途没有什么问题,那么在这种情况下假设他去搞了一些会出事的事情,你也一样不需要承担任何责任,因为你对事情并不知情。
    loryyang
        59
    loryyang  
       2020-09-29 18:54:57 +08:00
    让我想起了盗版影片字幕组后来会标注仅供学习
    Semidio
        60
    Semidio  
       2020-09-29 19:21:06 +08:00
    @lysS #53 可能是因为商业版要收费? https://cloud.google.com/recaptcha-enterprise/pricing
    IGJacklove
        61
    IGJacklove  
       2020-09-29 20:14:29 +08:00 via Android
    @wangkun025 这条罪名能抓百分之九十九的人。。。
    wangkun025
        62
    wangkun025  
       2020-09-29 20:35:58 +08:00   ❤️ 1
    @IGJacklove “不要拿法律当挡箭牌”, 剩下的 1%也解决了。
    thtznet
        63
    thtznet  
       2020-09-29 21:38:36 +08:00
    如果肉身在国内,"法律不是当挡箭牌!"
    Wicked
        64
    Wicked  
       2020-09-29 21:42:54 +08:00 via iPhone
    这完全取决于使用者用来干嘛,如果爬了惹不起的站惹了不该惹的人,估计凶多吉少。上面说找律师的,真被抓典型的话,律师都给你吊牌了。
    greatbody
        65
    greatbody  
       2020-09-29 21:58:35 +08:00
    @Wincer 王欣是因为有服务器缓存了资源才近去的。你如果仅仅是发布了一个代码,不会算犯罪的。

    要说的话,windows 就是入侵信息系统的工具,要不要把微软的工程师都抓了。
    germain
        66
    germain  
       2020-09-29 23:41:26 +08:00
    首先你的代码能否被定义为 malicious code
    其次你的代码是否是成品,是否拿下来改个 URL 微调下其它参数就能运行并达到“绕过反爬、模拟用户行为等”的效果。

    符合以上,那么你违反了 Github 的 Community Guidelines

    Github 不禁止用户发布能够用来开发 malicious action 的 code (比如单独发布反爬模块的代码),很多情况这种 code 都是用来学习研究用。但是 Github 禁止用户发布 malicious 成品本身(成品爬虫,改个 URL 或微调下就能绕过反爬机制模拟用户行为等爬取目标服务上的内容)。

    用上面一些朋友的比方来解释一下就是:你可以在平台上讲解炸弹的原理,但是你不能把做好的炸弹直接放在平台上面。
    aguesuka
        67
    aguesuka  
       2020-09-30 07:38:27 +08:00 via Android
    法不可知威不可测
    anjingdexiaocai
        68
    anjingdexiaocai  
       2020-09-30 08:07:17 +08:00 via Android
    @yolee599 free 大概是自由而非免费
    joeyFuck
        69
    joeyFuck  
       2020-09-30 08:49:19 +08:00
    关键在于菜刀还是枪支
    learningman
        70
    learningman  
       2020-09-30 09:02:53 +08:00
    @PopRain 哪里的法律都有满足这种需求的方法。法律作为统治阶级的工具,哪个法系并不影响它发挥功能。
    不要把法律当挡箭牌.jpg
    yolee599
        71
    yolee599  
       2020-09-30 09:11:57 +08:00
    @anjingdexiaocai #68 我玩梗呢
    penll
        72
    penll  
       2020-09-30 09:27:14 +08:00
    是的关键在于,你的工具代码是否具有危险性。

    比如:能爬 zf 的或者军事数据。

    就相当于,你把玩具放地上,别人拿去用没事,但是,你把手雷放地上,那么你就有过失的罪名了
    wupher
        73
    wupher  
       2020-09-30 09:28:02 +08:00
    看了上面的回复,那要是谁设计了一个语言,方便学习+使用,结果有人拿去开发了爬虫、黑客工具,那我有罪吗? - 易语言

    再抛开语言,有人基于 Linux 以及各种嗅探、扫描工具,整合一份分发版,这种我会有罪吗? -kali

    最后,连代码都没敢写,设计了一份网络代理传输、加密、伪装工具,结果有人拿去 F(A)Q,这个又怎么说?-不敢写

    好怀念当年学 Basic
    penll
        74
    penll  
       2020-09-30 09:48:47 +08:00
    @wupher 语言有危害吗?

    语言,就相当于原材料。

    我们开发,就相当于把所有原材料拼起来,混合起来的成品(或者接近成品)。

    概念要捋清楚。
    tz894305532
        75
    tz894305532  
       2020-09-30 09:50:10 +08:00
    参考快播王兴,技术有罪吗?
    ScepterZ
        76
    ScepterZ  
       2020-09-30 09:52:47 +08:00
    口袋罪主要看有没有人想让你犯罪,分析法律是没用的,这些只能按做题思维,事后诸葛亮,强行分析
    fallinlovewith
        77
    fallinlovewith  
       2020-09-30 10:00:27 +08:00
    你最好声明一下,说要遵守法律法规,本 demo 只供学习交流,。。。。。。其他概不负责
    就像水库立警示牌:水深,禁止游泳
    zunceng
        78
    zunceng  
       2020-09-30 10:10:40 +08:00
    在 github 上看过到一个 点赞 /fellow 别人 github 的项目的项目 几分钟能 fellow 好几 w 然后被 github 关了 看不到源代码了

    有没有法律责任不知道
    Torpedo
        79
    Torpedo  
       2020-09-30 10:28:54 +08:00
    难说,但理论上应该不算。
    还是看你参与的程度
    jaylee4869
        80
    jaylee4869  
       2020-09-30 10:35:45 +08:00
    开!源!协!议!是!做!什!么!的?
    qq05629
        81
    qq05629  
       2020-09-30 11:35:20 +08:00   ❤️ 1
    老王在路上丢了一把刀, 被荆轲捡到了:
    荆轲拿这把刀捅了一个流氓地痞, 被判 3 年, 老王一点事没有;
    荆轲拿这把刀去通秦王, 被诛九族, 连带老王也被满门抄斩;
    hoyixi
        82
    hoyixi  
       2020-09-30 11:44:46 +08:00
    在我国说不清,说你有罪你就有罪
    ddefewfewf
        83
    ddefewfewf  
       2020-09-30 11:46:00 +08:00 via iPhone
    GitHub 实名吗?不实名 让他慢慢找
    ddefewfewf
        84
    ddefewfewf  
       2020-09-30 11:47:38 +08:00 via iPhone
    GitHub 一堆带 ssr 也没事
    bmwh123
        85
    bmwh123  
       2020-09-30 13:00:29 +08:00
    那我用那种模拟浏览器行为的( puppeteer 这样的)做算犯法吗,抓取的是特定的网站。
    Jooooooooo
        86
    Jooooooooo  
       2020-09-30 13:01:20 +08:00
    警察抓人不看法律

    再不济寻衅滋事肯定是可以安排上的

    你自己掂量吧
    515576745
        87
    515576745  
       2020-09-30 13:09:31 +08:00 via Android
    本代码仅供学习使用
    huangsw
        88
    huangsw  
       2020-09-30 13:12:43 +08:00
    欲加之罪 何患无辞
    liulilte
        89
    liulilte  
       2020-09-30 16:11:39 +08:00
    别人用的东西造成的危害小,你就没有事情,危害大你就有连带责任。
    -------------------------
    在世界任何一个国家,甭管你有没有罪,只要上头说你有罪你就有罪。
    hahaandyou001
        90
    hahaandyou001  
       2020-09-30 16:40:42 +08:00 via Android
    @PopRain 因为你国从来就不是法治国家
    mfi
        91
    mfi  
       2020-10-01 10:52:24 +08:00
    爬虫不是问题,问题是绕过反爬做到什么程度了,以及最终造成的影响
    没利益关系的话一般问题不大,快播和熊猫烧香都是有直接或者间接利益关系的
    话说你担心这个的话为什么要做源码公开,私有仓库放着不行吗
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2947 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 08:12 · PVG 16:12 · LAX 00:12 · JFK 03:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.