V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
charlie21
V2EX  ›  问与答

关于 rss feed 抓取 以前的文章的问题

  •  
  •   charlie21 · 2015-09-16 18:03:26 +08:00 · 2342 次点击
    这是一个创建于 3359 天前的主题,其中的信息可能已经有所发展或是发生改变。
    ref /t/26248 ( 为什么有些博客的 RSS 无法显示该博客很久前的文章?有何解决办法? ) /t/93539 ( RSS 订阅服务推荐 )

    同一个 feed ,我在 feedly 里添加 feed 之后,只抓取到 2013 年 4 月的文章,在 Inoreader 里能抓取到 2014 年 3 月的文章。

    现在哪个 RSS 订阅器最能够抓取到 历史久远的文章?或者能让 RSS 阅读器允许 自定义 抓取的时间跨度。rss feed 挖取能力是在选择 RSS 订阅服务时的一个考量因素
    2 条回复    2015-09-16 19:05:07 +08:00
    66beta
        1
    66beta  
       2015-09-16 18:13:55 +08:00
    我猜测,有人订阅过,数据库里有历史数据,所以你看的到
    假设没有任何人在此平台订阅过,那么你只能看到该 feed 最新的几条
    oott123
        2
    oott123  
       2015-09-16 19:05:07 +08:00 via Android
    楼上正解
    RSS 一般就输出最新的数条(比如 10 条),也不带翻页啥的…
    当然有的服务会去源站爬全文,但爬历史数据的我还没见过。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4585 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 04:03 · PVG 12:03 · LAX 20:03 · JFK 23:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.