V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
rm0gang0rf
V2EX  ›  C#

请教 使用 Tesseract 识别 图片文字,一直提示 ArgumentException: 路径的形式不合法。 大神请指教一下 谢谢

  •  
  •   rm0gang0rf · 2021-11-17 08:59:59 +08:00 · 1641 次点击
    这是一个创建于 1093 天前的主题,其中的信息可能已经有所发展或是发生改变。
    var path = Path.GetDirectoryName(Assembly.GetExecutingAssembly().CodeBase);
    path = Path.Combine(path, "tessdata");
    path = path.Replace("file:\\", "");
    using (var engine = new TesseractEngine(path, "eng", EngineMode.Default))
    {
    using (var img = Pix.LoadFromFile("./0.png"))
    {
    using (var page = engine.Process(img))
    {
    return(page.GetText());

    }
    }
    }
    6 条回复    2021-11-25 09:44:23 +08:00
    sadfQED2
        1
    sadfQED2  
       2021-11-17 09:17:28 +08:00 via Android
    路径打印出来看一下,不要用相对路径,tessdata 库在 python 里面是是命令行调用二进制文件,不知道 c#是不是也这样
    rm0gang0rf
        2
    rm0gang0rf  
    OP
       2021-11-17 10:00:12 +08:00
    @sadfQED2 好的 谢谢 这折腾一天了快~
    rm0gang0rf
        3
    rm0gang0rf  
    OP
       2021-11-17 11:01:34 +08:00
    各种方法 绝对 相对 都试过了~~
    coder001
        4
    coder001  
       2021-11-24 21:27:48 +08:00
    把训练数据、Tesseract.dll 放到 exe 旁边

    ```csharp
    new TesseractEngine(".", "chi_sim")
    ```

    一直能正常使用,大概你还需要确认一下子文件夹 x86 、x64 里面的 dll 有没有正确放置

    ```
    bin
    │ chi_sim.traineddata
    │ Tesseract.dll
    │ TSR.exe
    │ TSR.pdb

    ├─x64
    │ leptonica-1.78.0.dll
    │ tesseract41.dll

    └─x86
    leptonica-1.78.0.dll
    tesseract41.dll
    ```
    coder001
        5
    coder001  
       2021-11-24 21:31:36 +08:00
    完整代码可以在咕狗搜 TesseractScreenReader 主域名是 topcl ,是个自己搭的 gogs ,怕被当 spam 就不贴出来了
    rm0gang0rf
        6
    rm0gang0rf  
    OP
       2021-11-25 09:44:23 +08:00
    @coder001 谢谢 已经解决了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2033 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:17 · PVG 00:17 · LAX 08:17 · JFK 11:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.