V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coolair
V2EX  ›  阅读

昨天微信读书在 PC 网页端打开了十几本书,被判定存在恶意爬取行为,再犯将永封。

  •  1
     
  •   coolair · 48 天前 via Android · 6173 次点击
    这是一个创建于 48 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨天写论文,打开了十几本书来查资料,被判定违规了,警告 5 天,下次再犯永久封禁账号。

    只是打开来看,都没有复制。 可能是我手术速过快?从书架里点开图书太快了?连点十几本就判定为爬虫了?

    大家引以为戒,浏览器不要同一时间一次打开多本图书,搞不好永封。

    我要去把读书笔记导出来了……

    41 条回复    2024-11-13 08:51:11 +08:00
    Ashore
        1
    Ashore  
       48 天前 via Android
    啊?这都能被判定为爬虫?
    xikaliy
        2
    xikaliy  
       48 天前 via Android
    之前在盗版网站看漫画,多打开了几个标签页也收到了同样提示😃
    x86
        3
    x86  
       48 天前
    可能觉得正常用户不会同时打开十几个页面看书吧
    Goooooos
        4
    Goooooos  
       48 天前
    @xikaliy #2 盗版网站也要放人盗版?
    MMMit
        5
    MMMit  
       48 天前
    还有这事儿吗。我是找了大佬的代码挂体验卡
    idcidc
        6
    idcidc  
       48 天前
    他们以为他们是独家阅读 app 呢
    somebody1
        7
    somebody1  
       48 天前
    @Goooooos
    防爬虫啊,资源本身无所谓,主要是爬虫对带宽服务消耗太大,又不能带来任何收入
    wu67
        8
    wu67  
       48 天前
    讲真, 就算是知网那货都没这么严格吧, 当年大学写毕业论文一样是各种开标签页, 腾讯真的是一股啥啥啥....
    bitmin
        9
    bitmin  
       48 天前
    如果我正常操作碰到这种提示就像被扔了一坨大便到嘴里一样恶心
    PerFectTime
        10
    PerFectTime  
       48 天前
    你按一下 F12 试试,马上就给你封了
    sekisui
        11
    sekisui  
       48 天前 via iPhone
    写论文用微信读书,参考文献不太方便标记吧
    treo
        12
    treo  
       48 天前
    请问是哪个专业呀的论文呀
    zaizaizai2333
        13
    zaizaizai2333  
       48 天前
    正常吧。爬虫然后卖盗版书的也是这样弄的。

    十几本书连标题都看不清楚了,正常用户不会这么用的。
    llxvs
        14
    llxvs  
       48 天前 via iPhone
    好過分,以後再也不用微信讀書了(雖然從來沒有用過)
    llxvs
        15
    llxvs  
       48 天前 via iPhone   ❤️ 1
    @zaizaizai2333 你這個理由太牽強了,樓主不是正常用戶嗎?樓主不就這麼用了。
    llxvs
        16
    llxvs  
       48 天前 via iPhone
    @zaizaizai2333 賣盜版書的這樣子弄,不代表這樣子的全是賣盜版書的。
    shadowyue
        17
    shadowyue  
       48 天前
    如果这个规定是在实体图书馆你们觉得合理吗?
    一个人可以同时借阅十几本书,但是同时打开阅读的应该就几本。
    x86
        18
    x86  
       48 天前   ❤️ 1
    @PerFectTime #10 facebook 是真封的,2010 年的老号啥都没做
    zaizaizai2333
        19
    zaizaizai2333  
       48 天前   ❤️ 2
    @llxvs 😂灰产们不高兴了。

    你试试在 Netflix 、Amazon Prime Video 上同时加载播放五个视频?做得到嘛?
    pkoukk
        20
    pkoukk  
       48 天前
    @zaizaizai2333 #13 为什么标题看不清楚了,书就不能看了?写论文开 50 个标签都有可能
    pkoukk
        21
    pkoukk  
       48 天前
    @shadowyue 图书馆限制我不能夹书签了么?留标签页不就是留个书签,不需要下次进来重新定位么?
    llxvs
        22
    llxvs  
       48 天前 via iPhone   ❤️ 1
    @zaizaizai2333 視頻沒有同時看的場景,但是文本是有的。真有意思,討論之前先扣個帽子。我不是做灰產的,只是對這種不尊重用戶的產品嗤之以鼻。
    dule
        23
    dule  
       48 天前
    腾讯:你不用有的是人用,管你体验如何?
    oxyFired
        24
    oxyFired  
       48 天前
    微信读书: 免费给你看还连吃带拿的
    somebody1
        25
    somebody1  
       48 天前   ❤️ 5
    从反爬策略上看,有点粗暴,但有用。
    因为对于大多数据来说都不会有这种场景,楼主的这种场景还是少之又少。(有的人可能会杠,我预判一波,少就不配用了吗,对,你 vip199w 就可以用了,资本家又不是慈善家,你对他抱什么期待啊!)

    而且对于读书类 app 来说,更希望你用他的 app ,而不是网页版。网页版被爬太简单了,搞个 cookie ,编程小白都能搞,为了过滤掉这部分大量的低级爬虫,有时候策略激进一点反而好,误伤相对比精细粒度的对抗成本还是低,完全是可接受的。

    我经常搞爬虫,这两年对抗策略上就是宁可误杀,不可放过。伤到一部分客户也没关系,把这堆简单粗暴的小白干掉,不要浪费精力。
    zaizaizai2333
        26
    zaizaizai2333  
       48 天前
    @llxvs 😂我一搜,淘宝上就有微信读书 VIP 下 pdf/epub 的。针对的就是当年新书,1.5 一本,已售几万份。

    不限制一些,灰产都拿去赚钱去了。
    coolair
        27
    coolair  
    OP
       48 天前
    @oxyFired #24 我没有白嫖噢,我买了年卡 VIP ,充了 5 年了。
    llxvs
        28
    llxvs  
       48 天前 via iPhone
    @zaizaizai2333 這不是說明了這些限制只限制到了普通用戶嗎?
    Leasing
        29
    Leasing  
       48 天前
    这些屁股决定脑袋的人,警告一下好像侮辱他了 应激反应有些强烈了
    PerFectTime
        30
    PerFectTime  
       48 天前
    @x86 #18 我之前曾经注册过一个,还是真实 id ,一注册马上就无了
    momo1pm
        31
    momo1pm  
       48 天前
    @shadowyue 同时看十本,我没问题,菜就多练
    momo1pm
        32
    momo1pm  
       48 天前
    @zaizaizai2333 显示器不行就换,视力不好就配眼镜,4k 分辨率开十几个标签还能看不清?
    momo1pm
        33
    momo1pm  
       48 天前
    @somebody1 对灰产没屁用,只会限制到用户的特定使用场景,说白了就是懒
    somebody1
        34
    somebody1  
       48 天前   ❤️ 1
    @momo1pm #33
    有用就行,你当领导也是一样,一个策略,3 人/日能搞定,你出了个 30 人/日的方案,先不说你这个方案光指定就话费的人力物力,你 leader 也会质疑你,为什么要投入这么多,而且你搞个精细化的方案,要是被突破了,领导更觉得你能力不行了,3 人/日的方案,投入少,突破了之后再投入也不会觉得有什么。

    企业里面可没什么那么高尚的东西,什么都要计算产出与成本的。高尚的情操可保不住饭碗,咱们这里动动嘴皮子,你们可以做的更好,人家是实打实的要吃饭的。

    商业的东西,就是在人家的条条框框里面用,开源的东西,参与人员众多的情况下,才有可能不计成本,搞一个相对较好的方案出来。
    bitmin
        35
    bitmin  
       48 天前   ❤️ 2
    说没问题的是沉浸在码农思维里了吧

    如果是我公司,产品硬要这样设计肯定被我开了,就不能在新开书页上提示达到频率限制之类的友好提示吗,这要成本吗

    误判不用背锅吗,抓错人坐牢出来还有国家赔偿,到你们这就是活该,可以被抛弃,不用在意的少数人
    momo1pm
        36
    momo1pm  
       48 天前
    @somebody1 q 阅有什么需求要长期占用人力的?事最多的也就是商业化,风控团队有啥忙的这些都干不好?
    Aixtuz
        37
    Aixtuz  
       48 天前
    误判本身不是大问题,正常提醒,给人申诉的机会就行。
    但是微信的申诉...我不敢报任何期望,它连一个正常的新设备登录都能折磨的我想骂人。
    yinmin
        38
    yinmin  
       48 天前 via iPhone
    @coolair 你改用 ipad 查资料,使用效果接近。
    yinmin
        39
    yinmin  
       48 天前 via iPhone
    @coolair 你也可以试试竞品:得到 app 的电子书,支持整个电子书库的全文检索,基于电子书库的 ai 问答(我的-ai 学习助手)
    Battle
        40
    Battle  
       48 天前
    微信读书的角度,绝大部分这么操作的都是爬虫,我这样风控,有 1%的误判率,代价就是正常用户会生气,留存降低,收益是避免很多爬虫
    coolair
        41
    coolair  
    OP
       47 天前
    @yinmin #39 得到的计算机类图书多吗?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2318 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:02 · PVG 00:02 · LAX 08:02 · JFK 11:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.