有没有免费的 OCR API？自己服务器能部署的开源软件也行

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 312 天前的主题，其中的信息可能已经有所发展或是发生改变。

有一大批图片需要识别里面的文字，有没有免费的 OCR API ，目前 GitHub 上浏览了一圈好的 OCR 都需要显卡才行，我的服务器没有显卡，有没有对服务器配置要求没那么高的 OCR 开源软件

OCR

API

开源

18 条回复

ferock

PRO

2025 年 4 月 4 日 via iPhone

支持图片的 llm

ferock

PRO

2025 年 4 月 4 日 via iPhone

哦…没有显卡

EngAPI

2025 年 4 月 4 日

本站有人分享过的
pdf-craft：把 pdf 转换成 markdown 或者 epub （作者在本站）
ocrmypdf：按原格式 ocr 语言（加一层）

觉得有用点个赞把金币还我哦

kisshere

2025 年 4 月 4 日

@EngAPI 谢谢，但我的全是图片，不是 pdf

studyingss

2025 年 4 月 4 日 via Android

有的兄弟，有的

https://www.v2ex.com/t/1120897

Daybyedream

2025 年 4 月 4 日

umi-ocr 自己有 api 的= =这种？

soap0X

2025 年 4 月 4 日 via Android

楼上说的微信那个，百度的 paddleocr ，不行了直接接个视觉大模型

PRStarDust

2025 年 4 月 4 日

https://rapidai.github.io/RapidOCRDocs/main/install_usage/rapidocr_api/usage/

raycool

2025 年 4 月 4 日

paddleocr

iorilu

2025 年 4 月 4 日

api 怎么可能有免费的

靠谱的就是上面有人提的微信 ocr, 也不需要 gpu

其他 paddleocr 自己开发也可以

lizhenda

2025 年 4 月 4 日

使用 deepseek api 直接识别图片试试？

photon006

2025 年 4 月 4 日

mistral

lemos1235

2025 年 4 月 4 日

paddleocr 可以用 cpu ，稍微慢一些而已。

GaGim

2025 年 4 月 4 日

mistral 和 paddle

ShenZhen

2025 年 4 月 5 日

@cobbage 视觉大模型有哪些？

soap0X

2025 年 4 月 5 日

@Lucoie #15 随便找一个就可以吧。我当时测试识别表格用的阿里 vl

syaoranex

2025 年 4 月 6 日

如果只是需要文字 OCR ，用微信的就行。链接楼上已经给了。
如果需要多模态大模型来 OCR （例如一些表格，手写文字），那智谱的 GLM-4V-FLASH 是免费的，最大并发 10 ，可以用于 OCR 。

kisshere

2025 年 4 月 6 日

@syaoranex 微信的没法再服务器上运行