V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Aether
V2EX  ›  分享创造

也许是一个重复的轮子: V2EX 主题自助过滤和检视

  •  
  •   Aether ·
    aetherwu · 2018-01-10 09:26:39 +08:00 · 2018 次点击
    这是一个创建于 2494 天前的主题,其中的信息可能已经有所发展或是发生改变。
    需求:
    - 经常刷某个特定版面
    - 只关心特别的关键字,比如 iOS、Android
    - 不想刷界面,只想快速得到相关结果

    实现:Python BeautifulSoup

    代码:


    扫描关键字:上海

    返回结果:
    [求职 实习] [上海 杭州] Python Golang 后端 服务端 19 年毕业 求实习 求指点 - https://www.v2ex.com/t/421008#reply5
    [社招-北京&上海&成都] [美团点评] ]分布式计算 / Java 开发 /架构专场 - https://www.v2ex.com/t/420972#reply3
    更新了一遍简历。求一个 前端 /nodejs 的开发职位 [上海 /杭州 皆可,最好是上海]。 - https://www.v2ex.com/t/419762#reply6
    八年开发老兵寻找远程工作机会 [上海 or 杭州 or 南京] - https://www.v2ex.com/t/419498#reply5
    ...
    ...

    这里只是抛砖引玉,当然可以写成一个定时的爬虫加上储存,然后把新的主题发送到微信啥的(比如使用 SeverChan )……
    6 条回复    2018-01-16 11:44:21 +08:00
    disposablexyz
        1
    disposablexyz  
       2018-01-12 09:14:19 +08:00 via iPhone
    这还不到 40 行代码,只能说鼓励一下,但下次就别拿出来了吧
    Aether
        2
    Aether  
    OP
       2018-01-12 11:52:21 +08:00
    @disposablexyz 我搜索过 v2ex,并没有找到类似的主题。大多数 v2exer 都比我聪明能干,但也许总能帮助到一些人。感谢你的鼓励。
    kslr
        3
    kslr  
       2018-01-12 13:09:23 +08:00
    @Aether #2 我觉得可以泛匹配一堆网站,这样就可以帮我很多忙了。
    Aether
        4
    Aether  
    OP
       2018-01-12 13:16:41 +08:00
    @kslr 匹配一堆网站是指,对很多网站的列表进行关键字监视么?
    kslr
        5
    kslr  
       2018-01-12 13:25:04 +08:00
    @Aether #4 比如针对某个网站的规则屏蔽某些标题 tr td 这样的 ( sis, 草榴什么的
    Aether
        6
    Aether  
    OP
       2018-01-16 11:44:21 +08:00
    @kslr 感觉这种时候你需要真·爬虫 https://segmentfault.com/a/1190000007360307
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4768 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 09:52 · PVG 17:52 · LAX 01:52 · JFK 04:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.