V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coolair
V2EX  ›  阅读

昨天微信读书在 PC 网页端打开了十几本书,被判定存在恶意爬取行为,再犯将永封。

  •  1
     
  •   coolair · 9 天前 via Android · 5637 次点击

    昨天写论文,打开了十几本书来查资料,被判定违规了,警告 5 天,下次再犯永久封禁账号。

    只是打开来看,都没有复制。 可能是我手术速过快?从书架里点开图书太快了?连点十几本就判定为爬虫了?

    大家引以为戒,浏览器不要同一时间一次打开多本图书,搞不好永封。

    我要去把读书笔记导出来了……

    41 条回复    2024-11-13 08:51:11 +08:00
    Ashore
        1
    Ashore  
       9 天前 via Android
    啊?这都能被判定为爬虫?
    xikaliy
        2
    xikaliy  
       9 天前 via Android
    之前在盗版网站看漫画,多打开了几个标签页也收到了同样提示😃
    x86
        3
    x86  
       9 天前
    可能觉得正常用户不会同时打开十几个页面看书吧
    Goooooos
        4
    Goooooos  
       9 天前
    @xikaliy #2 盗版网站也要放人盗版?
    MMMit
        5
    MMMit  
       9 天前
    还有这事儿吗。我是找了大佬的代码挂体验卡
    idcidc
        6
    idcidc  
       9 天前
    他们以为他们是独家阅读 app 呢
    somebody1
        7
    somebody1  
       9 天前
    @Goooooos
    防爬虫啊,资源本身无所谓,主要是爬虫对带宽服务消耗太大,又不能带来任何收入
    wu67
        8
    wu67  
       9 天前
    讲真, 就算是知网那货都没这么严格吧, 当年大学写毕业论文一样是各种开标签页, 腾讯真的是一股啥啥啥....
    bitmin
        9
    bitmin  
       9 天前
    如果我正常操作碰到这种提示就像被扔了一坨大便到嘴里一样恶心
    PerFectTime
        10
    PerFectTime  
       9 天前
    你按一下 F12 试试,马上就给你封了
    sekisui
        11
    sekisui  
       9 天前 via iPhone
    写论文用微信读书,参考文献不太方便标记吧
    treo
        12
    treo  
       9 天前
    请问是哪个专业呀的论文呀
    zaizaizai2333
        13
    zaizaizai2333  
       9 天前
    正常吧。爬虫然后卖盗版书的也是这样弄的。

    十几本书连标题都看不清楚了,正常用户不会这么用的。
    llxvs
        14
    llxvs  
       9 天前 via iPhone
    好過分,以後再也不用微信讀書了(雖然從來沒有用過)
    llxvs
        15
    llxvs  
       9 天前 via iPhone   ❤️ 1
    @zaizaizai2333 你這個理由太牽強了,樓主不是正常用戶嗎?樓主不就這麼用了。
    llxvs
        16
    llxvs  
       9 天前 via iPhone
    @zaizaizai2333 賣盜版書的這樣子弄,不代表這樣子的全是賣盜版書的。
    shadowyue
        17
    shadowyue  
       9 天前
    如果这个规定是在实体图书馆你们觉得合理吗?
    一个人可以同时借阅十几本书,但是同时打开阅读的应该就几本。
    x86
        18
    x86  
       9 天前   ❤️ 1
    @PerFectTime #10 facebook 是真封的,2010 年的老号啥都没做
    zaizaizai2333
        19
    zaizaizai2333  
       9 天前   ❤️ 2
    @llxvs 😂灰产们不高兴了。

    你试试在 Netflix 、Amazon Prime Video 上同时加载播放五个视频?做得到嘛?
    pkoukk
        20
    pkoukk  
       9 天前
    @zaizaizai2333 #13 为什么标题看不清楚了,书就不能看了?写论文开 50 个标签都有可能
    pkoukk
        21
    pkoukk  
       9 天前
    @shadowyue 图书馆限制我不能夹书签了么?留标签页不就是留个书签,不需要下次进来重新定位么?
    llxvs
        22
    llxvs  
       9 天前 via iPhone   ❤️ 1
    @zaizaizai2333 視頻沒有同時看的場景,但是文本是有的。真有意思,討論之前先扣個帽子。我不是做灰產的,只是對這種不尊重用戶的產品嗤之以鼻。
    dule
        23
    dule  
       9 天前
    腾讯:你不用有的是人用,管你体验如何?
    oxyFired
        24
    oxyFired  
       9 天前
    微信读书: 免费给你看还连吃带拿的
    somebody1
        25
    somebody1  
       9 天前   ❤️ 5
    从反爬策略上看,有点粗暴,但有用。
    因为对于大多数据来说都不会有这种场景,楼主的这种场景还是少之又少。(有的人可能会杠,我预判一波,少就不配用了吗,对,你 vip199w 就可以用了,资本家又不是慈善家,你对他抱什么期待啊!)

    而且对于读书类 app 来说,更希望你用他的 app ,而不是网页版。网页版被爬太简单了,搞个 cookie ,编程小白都能搞,为了过滤掉这部分大量的低级爬虫,有时候策略激进一点反而好,误伤相对比精细粒度的对抗成本还是低,完全是可接受的。

    我经常搞爬虫,这两年对抗策略上就是宁可误杀,不可放过。伤到一部分客户也没关系,把这堆简单粗暴的小白干掉,不要浪费精力。
    zaizaizai2333
        26
    zaizaizai2333  
       9 天前
    @llxvs 😂我一搜,淘宝上就有微信读书 VIP 下 pdf/epub 的。针对的就是当年新书,1.5 一本,已售几万份。

    不限制一些,灰产都拿去赚钱去了。
    coolair
        27
    coolair  
    OP
       9 天前
    @oxyFired #24 我没有白嫖噢,我买了年卡 VIP ,充了 5 年了。
    llxvs
        28
    llxvs  
       9 天前 via iPhone
    @zaizaizai2333 這不是說明了這些限制只限制到了普通用戶嗎?
    Leasing
        29
    Leasing  
       9 天前
    这些屁股决定脑袋的人,警告一下好像侮辱他了 应激反应有些强烈了
    PerFectTime
        30
    PerFectTime  
       9 天前
    @x86 #18 我之前曾经注册过一个,还是真实 id ,一注册马上就无了
    momo1pm
        31
    momo1pm  
       9 天前
    @shadowyue 同时看十本,我没问题,菜就多练
    momo1pm
        32
    momo1pm  
       9 天前
    @zaizaizai2333 显示器不行就换,视力不好就配眼镜,4k 分辨率开十几个标签还能看不清?
    momo1pm
        33
    momo1pm  
       9 天前
    @somebody1 对灰产没屁用,只会限制到用户的特定使用场景,说白了就是懒
    somebody1
        34
    somebody1  
       9 天前   ❤️ 1
    @momo1pm #33
    有用就行,你当领导也是一样,一个策略,3 人/日能搞定,你出了个 30 人/日的方案,先不说你这个方案光指定就话费的人力物力,你 leader 也会质疑你,为什么要投入这么多,而且你搞个精细化的方案,要是被突破了,领导更觉得你能力不行了,3 人/日的方案,投入少,突破了之后再投入也不会觉得有什么。

    企业里面可没什么那么高尚的东西,什么都要计算产出与成本的。高尚的情操可保不住饭碗,咱们这里动动嘴皮子,你们可以做的更好,人家是实打实的要吃饭的。

    商业的东西,就是在人家的条条框框里面用,开源的东西,参与人员众多的情况下,才有可能不计成本,搞一个相对较好的方案出来。
    bitmin
        35
    bitmin  
       9 天前   ❤️ 2
    说没问题的是沉浸在码农思维里了吧

    如果是我公司,产品硬要这样设计肯定被我开了,就不能在新开书页上提示达到频率限制之类的友好提示吗,这要成本吗

    误判不用背锅吗,抓错人坐牢出来还有国家赔偿,到你们这就是活该,可以被抛弃,不用在意的少数人
    momo1pm
        36
    momo1pm  
       9 天前
    @somebody1 q 阅有什么需求要长期占用人力的?事最多的也就是商业化,风控团队有啥忙的这些都干不好?
    Aixtuz
        37
    Aixtuz  
       9 天前
    误判本身不是大问题,正常提醒,给人申诉的机会就行。
    但是微信的申诉...我不敢报任何期望,它连一个正常的新设备登录都能折磨的我想骂人。
    yinmin
        38
    yinmin  
       9 天前 via iPhone
    @coolair 你改用 ipad 查资料,使用效果接近。
    yinmin
        39
    yinmin  
       9 天前 via iPhone
    @coolair 你也可以试试竞品:得到 app 的电子书,支持整个电子书库的全文检索,基于电子书库的 ai 问答(我的-ai 学习助手)
    Battle
        40
    Battle  
       9 天前
    微信读书的角度,绝大部分这么操作的都是爬虫,我这样风控,有 1%的误判率,代价就是正常用户会生气,留存降低,收益是避免很多爬虫
    coolair
        41
    coolair  
    OP
       8 天前
    @yinmin #39 得到的计算机类图书多吗?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5095 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 09:34 · PVG 17:34 · LAX 01:34 · JFK 04:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.