V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
LINAICAI
V2EX  ›  问与答

如何采集漫画

  •  
  •   LINAICAI · 2014-02-28 09:20:33 +08:00 · 2905 次点击
    这是一个创建于 3954 天前的主题,其中的信息可能已经有所发展或是发生改变。
    说到底就是采集规则,采集漫画和采集图片一样吗。
    5 条回复    1970-01-01 08:00:00 +08:00
    kiah
        1
    kiah  
       2014-02-28 10:48:40 +08:00
    一样的。。
    zhy0216
        2
    zhy0216  
       2014-02-28 16:29:07 +08:00
    一样的,
    但最好自己写个model, 分好哪本漫画, 哪一卷这些数据,
    然后在页面的model里存图片的url就好
    LINAICAI
        3
    LINAICAI  
    OP
       2014-02-28 16:55:35 +08:00
    @zhy0216
    是不是读取目标网页html内的特定节点然后记录到相应的model,这样的话,如何做到自动展开二级或者内链读取下级网页数据呢?
    LINAICAI
        4
    LINAICAI  
    OP
       2014-02-28 16:56:43 +08:00
    @zhy0216 还有是有些分页数据怎么去,不可能每一页都去读取一次吧。
    zhy0216
        5
    zhy0216  
       2014-03-20 10:33:05 +08:00
    @LINAICAI
    没太看懂你的意思
    就是找到这个漫画, 这个漫画下面有很多卷
    你把这些都存下, 然后再去爬每一个卷,
    看这个卷的时候, 一方面都有下一页的连接, 所以你可以继续爬
    另外一般的漫画站都是把页码数写在url上的, 你可以猜

    不知道讲清楚没。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3798 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 10:24 · PVG 18:24 · LAX 02:24 · JFK 05:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.