首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
宝塔
V2EX  ›  程序员

有没有 Win 下好用的 OCR 工具推荐?

  •  
  •   Sixzeroo · 2018-02-08 22:27:35 +08:00 · 7092 次点击
    这是一个创建于 650 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在看一些扫描版本的电子书,有时候想要摘录一些内容要用到 OCR,目前网上找到的是要不就是有数量限制要不就是排队时间巨长,前些天自己用百度的 OCR 写了一个小东西( http://server.liuin.cn:8080 ),但是还是要将截图保存然后选择图片,这样花的时间有点长。

    目前知道 macOS 上有一个比较好的工具: https://github.com/oott123/alfred-clipboard-ocr

    所以想请教一下各位有没有 Win 下类似的好的工具推荐,就是那种能直接从粘贴板复制提交然后获得结果的

    第 1 条附言  ·  2018-02-09 11:08:01 +08:00

    目前找到两个方法:

    谢谢大家!

    第 2 条附言  ·  2018-02-09 20:57:52 +08:00
    把之前写东西加了个粘贴上传的功能(粘贴截图即可获得结果),用的是百度的 OCR,大家需要的可以参考:

    https://github.com/Sixzeroo/WebOCR
    34 回复  |  直到 2019-08-31 22:57:02 +08:00
        1
    laqow   2018-02-08 22:41:40 +08:00 via Android
    不介意的话 acrobat
        2
    choury   2018-02-08 22:42:12 +08:00
    OneNote 啊
        3
    LosLord   2018-02-08 22:45:12 +08:00 via Android
    Windows10 带 ocr 的 api 的,好像直接调用就行。
    官方还有个 demo 呢,可以直接用 vs 运行
        4
    huclengyue   2018-02-08 23:01:24 +08:00 via Android
    感觉百度的还不错。
        5
    huclengyue   2018-02-08 23:01:55 +08:00 via Android
    嗯,要自己调接口
        6
    Sixzeroo   2018-02-08 23:11:40 +08:00
    @choury 刚才试了试,发现识别率还是没有百度的高
        7
    Sixzeroo   2018-02-08 23:12:36 +08:00
    @LosLord 有相关的资料吗?
        8
    Sixzeroo   2018-02-08 23:13:58 +08:00
    @huclengyue 百度识别率还行,我用的这几天中文基本上很少有错
        9
    huiyadanli   2018-02-08 23:15:37 +08:00
    ABBYY
        10
    LosLord   2018-02-08 23:41:16 +08:00 via Android
    @Sixzeroo 不知道你需求什么样的,win10 带的是 ocr api 就是 c#的 uwp 应用好像。
    https://github.com/Microsoft/Windows-universal-samples/tree/master/Samples/OCR
        11
    applehater   2018-02-08 23:52:00 +08:00 via iPhone
    @Sixzeroo 看我发过的帖子就可以了。
        12
    zhaoxiting1997   2018-02-08 23:54:59 +08:00   ♥ 1
    abbyy finereader 绝对是最好的,就是比较大
        13
    applehater   2018-02-08 23:56:38 +08:00 via iPhone
    @LosLord 只要🈶️运行时都可以调用的,我把他做成了命令行工具识别答题题目效果可以。
    @Sixzeroo 里面有 MS 官方文档说明和示例。
    /t/427237
        14
    LosLord   2018-02-09 00:00:55 +08:00 via Android
    @applehater 这个我当时也有需求要写,可是我不会 c#😂
        15
    applehater   2018-02-09 00:03:14 +08:00 via iPhone
    @LosLord 我也不会,UWP 支持四种编程语言,C# C++ VB.NET Javascript😀但是我还是懒得写了。
        16
    masir   2018-02-09 00:12:50 +08:00 via Android   ♥ 1
    Abbyy
        17
    g00001   2018-02-09 01:29:16 +08:00   ♥ 1
    可以用 aardio 写一个,
    不需要运行时,生成软件几百 KB,开发工具 5.6MB ,简单方便。

    几句代码可以解决问题:

    import console
    import win.clip;
    import gdip.bitmap;
    import baidu.client;

    //创建百度 OCR 客户端
    var http = baidu.client();
    http.setAuth("http://update.aau.cn/v10/test/test-baidu.aardio")

    //读取剪贴板图像
    var hbmp = win.clip.readBitmap();
    var bmp = gdip.bitmap(hbmp);

    //调用 OCR 识别接口
    var ocr = http.api("https://aip.baidubce.com/rest/2.0/ocr/v1/");
    var result = ocr.general_basic(
    image = bmp.saveToBuffer("*.jpg");
    )

    //输出结果
    console.dumpJson(result);
    console.pause(true);

    参考源码:
    http://bbs.aardio.com/forum.php?mod=viewthread&tid=22093

    调用 google 的 tesseract-ocr 也可以
    http://bbs.aardio.com/forum.php?mod=viewthread&tid=12601
        18
    qianyi0129   2018-02-09 08:21:56 +08:00   ♥ 1
    abbyy
        19
    newbieo0O   2018-02-09 08:56:22 +08:00
    python 写个吧,调百度接口
        20
    qsnow6   2018-02-09 09:48:28 +08:00
    也别调百度接口了,直接用 win 10 系统自带
        21
    qsnow6   2018-02-09 10:03:25 +08:00
        22
    jsnjfz   2018-02-09 10:09:55 +08:00
    百度,阿里上的汉王云
        23
    ss0xt   2018-02-09 11:13:51 +08:00
    可以试试 知网 CAJViewer
        24
    nogoodren   2018-02-09 11:44:41 +08:00
    OneNote
        25
    nicevar   2018-02-09 12:04:37 +08:00
    最近做的一个项目在 win 下用的 tesseract
        26
    lancn   2018-02-09 14:30:55 +08:00
        27
    bfhh126   2018-02-09 14:51:17 +08:00   ♥ 1
    Abbyy +1
        28
    zhishidahao   2018-02-09 16:27:43 +08:00 via iPhone   ♥ 1
    abbyy finereader 绝对是最好的,就是比较贵
        29
    Marilyn   2018-02-09 16:58:18 +08:00
    这个好像免费的极少,期待。。。。
        30
    Izual_Yang   2018-02-09 17:04:52 +08:00
    CAJViewer
    或者 unicornviewer+MODI
        31
    Izual_Yang   2018-02-09 17:09:43 +08:00

    识别率还是可以的
        32
    Sixzeroo   2018-02-09 20:57:33 +08:00
    把之前写东西加了个粘贴上传的功能(粘贴截图即可获得结果),用的是百度的 OCR,大家需要的可以参考: https://github.com/Sixzeroo/WebOCR
        33
    acupnocup   2018-03-21 13:25:54 +08:00
    @zhaoxiting1997 这个好贵啊 试用版有限制极多 在犹豫是否要购买。
        34
    iutopia   81 天前
    不知道有没有类似 fooview 的那种功能的软件。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   935 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 26ms · UTC 20:31 · PVG 04:31 · LAX 12:31 · JFK 15:31
    ♥ Do have faith in what you're doing.