爱意满满的作品展示区。
ayang23

pdf2any 文字版 PDF 转 md,html,docx,表格支持良好

  •  
  •   ayang23 ·
    ayang23 · 2 days ago · 788 views

    https://github.com/ayang/pdf2any

    pdf2docx 已经不维护了,这个项目从 pdf2docx 升级而来,识别表格更准确,增加了转 html 和 md 的功能,方便喂给大模型。

    自己经常使用,速度比 docling 高出 4 倍,格式识别也比 docling 准确,缺点就是不支持扫描版 PDF.

    有需要可以试试。有 bug 欢迎提交。

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3018 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 03:29 · PVG 11:29 · LAX 20:29 · JFK 23:29
    ♥ Do have faith in what you're doing.