V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
roberts
V2EX  ›  分享创造

通过 Hook 微信爬公众号的新文章

  •  
  •   roberts · 2019-08-19 14:27:16 +08:00 · 5970 次点击
    这是一个创建于 1955 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Sogou 关闭了微信的历史消息查看,网页端的微信也 ban 了大多数的微信号,所以想了这个方法,直接 Hook 微信的某些 call 来监控爬取微信文章

    地址: https://github.com/redtips/wechathook

    另外,爬虫接活~微信 bluetips
    13 条回复    2019-11-13 14:10:18 +08:00
    mateor95
        1
    mateor95  
       2019-08-19 18:27:18 +08:00
    太折腾了,明明抓包微信读书就能解决的事情..
    www6688w
        2
    www6688w  
       2019-08-19 20:32:32 +08:00
    @mateor95 微信读书可以抓包到 公众号的文章 吗 ? 是 app 还是小程序?
    roberts
        3
    roberts  
    OP
       2019-08-20 09:33:35 +08:00 via Android
    @mateor95 这个是考虑实时完整性和大规模抓取,很多消息是针对性推送,只有关注了在客户端才被推送看得到。或许有更好的办法
    roberts
        4
    roberts  
    OP
       2019-08-20 09:38:52 +08:00 via Android
    @www6688w 只有部分优质公众号
    mateor95
        5
    mateor95  
       2019-08-20 11:27:43 +08:00
    @www6688w #2
    微信读书 APP 端,确实是可以抓包实现的

    因为我懒得去翻公众号,所以我自己做了一个工具来维护公众号阅读列表(怕版权问题所以没公开)

    确实是可以抓到所有公众号的(至少我自己的个人号是能抓到的,那我就认为所有的号都能抓到,毕竟我才 100 个粉丝)

    至于针对性推送是否能抓到的问题,这个我不确定,因为我没有试验过没有发言权
    mateor95
        6
    mateor95  
       2019-08-20 11:28:58 +08:00
    @roberts #3
    你的方案确实能够保证实时性,但是太麻烦了,可能商业用途中会比较有用,但是我本身的话倒是不在乎延迟一两分钟
    mateor95
        7
    mateor95  
       2019-08-20 11:30:09 +08:00
    @www6688w #2
    你试一下在微信读书 APP 直接搜索公众号名字就知道了,建议别搜太大众化的词,因为搜索结果太多了不好判断
    zkqiang
        8
    zkqiang  
       2019-08-20 18:54:51 +08:00
    感谢,是个好思路
    Jaho
        9
    Jaho  
       2019-08-21 09:22:10 +08:00
    @mateor95 但是 阅读数 和评论抓不到吧
    mateor95
        10
    mateor95  
       2019-08-21 11:41:03 +08:00
    @Jaho #9
    现行应该没办法抓到阅读和评论
    vcode
        11
    vcode  
       2019-08-22 17:00:40 +08:00
    应该有某种协议,我看那些刷赞的都可以抓到阅读和评论
    roberts
        12
    roberts  
    OP
       2019-08-23 13:38:26 +08:00 via Android
    @vcode 阅读点赞万能 key 就能抓
    lateautumn4lin
        13
    lateautumn4lin  
       2019-11-13 14:10:18 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1970 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 393ms · UTC 16:16 · PVG 00:16 · LAX 08:16 · JFK 11:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.