V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
smark
V2EX  ›  程序员

试用了几个国内的表格 OCR 功能,大厂并不优秀啊

  •  
  •   smark · 2022-10-11 17:40:02 +08:00 · 4451 次点击
    这是一个创建于 803 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 阿里 宫识别为官,周一识别为司一
    • 腾讯 周一识别为司一
    • 华为 周一识别为司一
    • 百度 没找到试用入口

    还不如一个叫薪火科技的公司,起码在我这张表格图中是正常的。 大厂宣称的技术实力在哪里呢?感觉反而更多的细分领域的小公司实力更强一点呢?

    第 1 条附言  ·  2022-10-12 09:03:35 +08:00
    这个算是无意间帮打了广告,但是这个公司跟我确实利益无关(没找到修改原贴的地方,想屏蔽掉名字)。之前压根不知道这个公司,只是由于这次的经历产生一点对大厂技术盲目信任的动摇的感想。大家关注点可以在大厂和垂直细分小厂的技术对比上,非常想听听大家的观点~
    26 条回复    2022-10-14 10:40:09 +08:00
    wuxiaoqing234
        1
    wuxiaoqing234  
       2022-10-11 17:42:42 +08:00   ❤️ 4
    这是广告吗..
    hidemyself
        2
    hidemyself  
       2022-10-11 17:44:01 +08:00   ❤️ 3
    广告太硬了
    yhm2046
        3
    yhm2046  
       2022-10-11 17:49:52 +08:00
    多少钱,拉我入群有饭一起恰
    kiroter
        4
    kiroter  
       2022-10-11 17:50:51 +08:00
    所以你那个小厂是这样识别的吗? result = result.replace("司一", "周一"); doge
    JustSong
        5
    JustSong  
       2022-10-11 17:52:11 +08:00 via Android
    你是懂推广的
    zhw2590582
        6
    zhw2590582  
       2022-10-11 18:30:31 +08:00
    有钱一起赚啊
    icySoda
        7
    icySoda  
       2022-10-11 18:33:37 +08:00 via iPhone
    请问这么好的产品,怎么访问呢?🙄
    RangerWolf
        8
    RangerWolf  
       2022-10-11 19:19:41 +08:00
    我觉得楼主不一定是硬广~
    我确实也对比过几家的服务,确实是一个不知名小厂的服务秒杀其他大厂的。

    PS: 百度的没有在线试用,直接申请。脚本不难写~
    watzds
        9
    watzds  
       2022-10-11 20:58:36 +08:00   ❤️ 2
    对的,小公司是靠这功能吃饭的,大厂不过是丰富一下功能
    Maxwe11
        10
    Maxwe11  
       2022-10-11 21:24:24 +08:00
    业务端不敢苟同,但是在此类技术领域,相比这些资源企业,百度还是更靠谱点儿的。
    aaa5838769
        11
    aaa5838769  
       2022-10-11 22:55:25 +08:00
    我个人觉得楼主不一定是硬广,之前有 OCR 需要,他们都提过测试的入口,但是测试结果还不如一个白猫 OCR 强,但是白猫不支持 API 接口对接。其次百度感觉对开发者比较优化,有免费提供测试的 API 接口的次数。
    freedgw
        12
    freedgw  
       2022-10-11 23:41:45 +08:00 via Android
    在公式识别等特别细分的领域可能是成立的,比如 mathpix ,就最准确,反观百度和 bing 的公式识别准确度都很差
    smark
        13
    smark  
    OP
       2022-10-12 08:59:42 +08:00
    @wuxiaoqing234 。。额,确实算是无意间帮打广告了,不过确实在这个点上符合了我的需求预期。
    smark
        14
    smark  
    OP
       2022-10-12 09:20:31 +08:00
    @RangerWolf 卧槽,同样的感受。这个小厂我是在搜索结果中随便点的,还有几个没有看,顺手吧名字带上来了,确实不是为了给他们打广告。
    @watzds 这么说也对,其实之前换工作也考虑过类似小厂,后来总觉的大厂技术实力比较雄厚,市场竞争可能会被大厂拿钱砸死,后来还是放弃了,这次经历又让我对这个观点产生了动摇
    smark
        15
    smark  
    OP
       2022-10-12 09:24:42 +08:00
    @Maxwe11 个人觉得百度在 AI 领域投入巨大,应该会好一点,只是没有提供上传图片直接试用的入口,就没有测试到。
    由于我试用这个 ocr 功能的初衷是帮媳妇儿识别排班表然后设置闹钟这个小需求,要体验百度的 api 需要注册百度云服务的相关账号+实名认证+领取免费次数+写 demo 等等,暂时搁置了( doge
    RangerWolf
        16
    RangerWolf  
       2022-10-12 09:33:25 +08:00
    @smark 我也是感觉百度在 AI 领域各种硬广,确实也用过他们的文心大模型,但是被表格的精度打败了。。。
    buliugu
        17
    buliugu  
       2022-10-12 09:39:07 +08:00
    今年 7 月份用过百度表格 OCR ,用了一个当时 sdk 里都没有写的 table ocr api (新上线接口,sdk 似乎没及时更新),效果感觉还不错
    SanjinGG
        18
    SanjinGG  
       2022-10-12 09:41:04 +08:00
    用的免费还是付费的?
    smark
        19
    smark  
    OP
       2022-10-12 09:49:57 +08:00
    @SanjinGG 试用嘛,免费的
    unknow1
        20
    unknow1  
       2022-10-12 11:20:49 +08:00
    前段时间有个客户也有这个需求,也试过各大厂商的接口,均不行。
    后来改变了客户的需求,把识别图片表格改成了解析 excel 🐶
    smark
        21
    smark  
    OP
       2022-10-12 12:14:37 +08:00
    @unknow1 有一说一,PM 能力可以的
    watzds
        22
    watzds  
       2022-10-12 14:13:08 +08:00
    https://www.xinhuokj.com/ocr/commonh

    核心技术团队来自 BAT 及科大讯飞等头部 AI 企业
    watzds
        23
    watzds  
       2022-10-12 14:14:49 +08:00
    这还是国家高新技术企业呢,OCR 结合 AI 语境上下文,估计是更加准确
    Maxwe11
        24
    Maxwe11  
       2022-10-12 17:49:09 +08:00
    @smark 深表理解,我家里是我妈干活儿,总有各种要求的统计数据,我妈这个年纪搞不定,就都“外包”给我来帮她做,这些事业单位真是做了一笔好买卖,笃定了不管多麻烦,家里肯定有人给兜底,这么算,她们的薪资水平其实划算的很 /doge
    PopRain
        25
    PopRain  
       2022-10-12 18:14:35 +08:00
    底层百度 paddlepaddle ,上层做一些语意调整,完美。。。。
    SanjinGG
        26
    SanjinGG  
       2022-10-14 10:40:09 +08:00
    @smark 没试过表格 ocr ,但之前用百度的高精度,在我的需求里是 100%精准的,可以试试
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1728 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 16:17 · PVG 00:17 · LAX 08:17 · JFK 11:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.