Junyiz
V2EX  ›  Node.js

抓取新浪博客的命令行程序: dature

  •  
  •   Junyiz · Mar 21, 2018 · 5253 views
    This topic created in 3006 days ago, the information mentioned may be changed or developed.

    dature 是基于 Node.js 的爬虫程序,可以抓取新浪博客某博主的全部博文,包含标题、正文、时间、分类、图片,并生成 HTML 文件。

    安装

    npm install -g dature

    使用

    dature sina_blog_uid

    详见: https://www.npmjs.com/package/dature

    6 replies    2018-03-28 13:06:17 +08:00
    JohnChiu
        1
    JohnChiu  
       Mar 21, 2018 via iPhone   ❤️ 1
    赞!顶一下支持~
    Junyiz
        2
    Junyiz  
    OP
       Mar 22, 2018
    今天更新了生成 HTML 的模版
    xuyl
        3
    xuyl  
       Mar 27, 2018
    试用了下,生产的模板有问题,Cannot read property 'title' of undefined,
    xuyl
        4
    xuyl  
       Mar 27, 2018
    新浪博客?还以为是微博。。。
    Junyiz
        5
    Junyiz  
    OP
       Mar 27, 2018
    @xuyl 对的
    Junyiz
        6
    Junyiz  
    OP
       Mar 28, 2018
    已支持抓取 CSDN 博客
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3047 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 07:49 · PVG 15:49 · LAX 00:49 · JFK 03:49
    ♥ Do have faith in what you're doing.