V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
The Go Programming Language
http://golang.org/
Go Playground
Go Projects
Revel Web Framework
legendnan
V2EX  ›  Go 编程语言

识别图片中的文字与数字

  •  
  •   legendnan · 2020-09-28 11:44:36 +08:00 via Android · 3106 次点击
    这是一个创建于 1536 天前的主题,其中的信息可能已经有所发展或是发生改变。
    大佬们,我想识别一个图片中的数字,他是网页上的我想给他截图保存下来。然后用程序去识别他里面的数字。请问这个识别率高的库都有什么?
    8 条回复    2020-10-14 15:47:02 +08:00
    xylophone21
        1
    xylophone21  
       2020-09-28 11:51:38 +08:00
    Google mnist PyTorch, 大把代码跑到 9X%+,X 大概是 5678
    rimutuyuan
        2
    rimutuyuan  
       2020-09-28 11:53:32 +08:00
    百度智能云 ocr 识别 api,一天很多次免费额度
    supermoonie
        3
    supermoonie  
       2020-09-28 11:55:03 +08:00 via iPhone
    飞浆
    miaomiao888
        4
    miaomiao888  
       2020-09-28 12:53:36 +08:00
    试试 PandaOCR 各种 OCR 引擎自个挑
    但如果想要离线库那没啥可推荐的,识别效果基本都不如在线的
    shm7
        5
    shm7  
       2020-09-28 13:00:51 +08:00
    你放在 go 这个主题下,让我不晓得怎么回答。

    第一你这里的截图是什么样的不知道,不晓得识别难度。如果是比较规整的,肯定比歪歪斜斜的好识别。沙发说什么 9X%我觉得可能是微信号看多了。谷歌最赚钱的 youtube 的机器翻译也只能适合慢速不带口音的翻译。稍微复杂一点的情况,错误也会频繁出现。

    如果你懂 DL/CV,可以看看 attentionOCR 这种端到端的模型,在歪斜形变的场景也能保持一定的识别率。但是问题是没有中文的训练数据,英文数字应该有。有个同事做过这方面的事情,我有点耳闻。
    shm7
        6
    shm7  
       2020-09-28 13:03:26 +08:00
    谷歌有过一个识别规整英文数字验证码的开源方案,比较老了,叫 tesseract (对,就是雷神那个东西)。你可以试试。我们这边做验证码识别不太行。
    legendnan
        7
    legendnan  
    OP
       2020-09-28 14:34:24 +08:00
    @shm7 图片是带有颜色的,绿色黄色橙色等根据数字大小来确定颜色。主要是想用 go 写就发在这里了。识别内容就是数字。到现在我也不会在 V2EX 上发图片。要不就发图了
    z21victor
        8
    z21victor  
       2020-10-14 15:47:02 +08:00
    如果只是英文和数字,github.com/otiai10/gosseract 这个应该是可以的。中文的话,基础的模型识别效果都不太好
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   888 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 20:15 · PVG 04:15 · LAX 12:15 · JFK 15:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.