V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dettac
V2EX  ›  Wikipedia

如何下载特定的 wikipedia 数据?

  •  
  •   dettac · 2017-01-18 23:14:38 +08:00 · 7090 次点击
    这是一个创建于 2884 天前的主题,其中的信息可能已经有所发展或是发生改变。

    可否直接从 dbpedia.orgdumps.wikimedia.org 或别的什么地方直接将每个页面的.navbox (这里指 CSS 中的 class )数据下载?如下图所示数据: navbox

    目前已知 infobox 可直接从 dbpedia 的 rdf 数据 infobox_***** .ttl 中获取,即: infobox

    请问除了使用爬虫,有没有可以完全下载的途径?谢谢!

    2 条回复    2017-01-20 09:57:55 +08:00
    gdsagdada
        1
    gdsagdada  
       2017-01-19 11:31:54 +08:00
    https://www.zhihu.com/question/19803440
    问前先搜索,爬虫不现实
    dettac
        2
    dettac  
    OP
       2017-01-20 09:57:55 +08:00
    @gdsagdada 整体数据我已下载,只是提问是否可以下载部分(即词条页面某一个位置)的数据,谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2765 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 13:29 · PVG 21:29 · LAX 05:29 · JFK 08:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.