V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
duangthef1rst
V2EX  ›  程序员

GLM-OCR 发布

  •  
  •   duangthef1rst · 5 天前 · 1290 次点击

    GLM-OCR 是一款先进的光学字符识别( OCR )工具,旨在从各种文档格式中提取和理解文本数据。其核心特性基于 GLM 模型架构,确保在复杂布局文档中的高精度文本识别。

    主要特点:

    文本提取:GLM-OCR 高效地从图片、扫描文档或 PDF 中提取文本。

    文档结构理解:不仅仅是简单的文本提取,还能理解文档的结构,如标题、段落、表格及混合内容等。

    多语言支持:该模型能够识别多种语言的文本,使其在不同地区和使用场景中都能发挥作用。

    优化的性能:GLM-OCR 在准确性和计算效率之间找到了平衡,适合云端和边缘计算的部署。

    更多信息可以访问官方站点: https://glm-ocr.com

    8 条回复    2026-02-06 10:19:34 +08:00
    avenger
        1
    avenger  
       5 天前 via iPhone
    和那个 glm 有什么关系吗?点 price 显示 404
    Akikiki
        2
    Akikiki  
       5 天前
    @avenger 就是智谱的
    tool2dx
        3
    tool2dx  
       5 天前
    能加上 XY 坐标输出不? 一般那来说文字识别不会 100%准确, 总需要二次修改.
    avenger
        4
    avenger  
       5 天前
    @tool2dx 试了一个 api 有返回的,目前百度、阿里、夸克都有类似的接口,置信度还是最关键因素

    最近在做一个试卷 ocr 的项目,用了几个 api 准确度都提不上去
    avenger
        5
    avenger  
       5 天前
    api 返回示例

    ````
    {
    "task_id": "ce2641ced3e34e67b47f3b0feeb25aee",
    "message": "成功",
    "status": "succeeded",
    "words_result_num": 4,
    "words_result": [
    {
    "location": {
    "left": 79,
    "top": 122,
    "width": 1483,
    "height": 182
    },
    "words": "你好,世界!",
    "probability": {
    "average": 0.7320847511,
    "variance": 0.08768635988,
    "min": 0.3193874359
    }
    }
    ]
    }
    ```
    RuiCBai
        6
    RuiCBai  
       4 天前
    glm-ocr dot com 不是智谱官网站点吧。。。这样宣传就有点误导大家 😂
    Selenium39
        7
    Selenium39  
       4 天前
    官方的站点是: https://ocr.z.ai
    Maroontor
        8
    Maroontor  
       4 天前
    需要什么配置,准确率如何
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2123 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 14:51 · PVG 22:51 · LAX 06:51 · JFK 09:51
    ♥ Do have faith in what you're doing.