V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
louistsangjk
V2EX  ›  OpenClaw

openclaw 无法多模态输入图片识别

  •  
  •   louistsangjk · 2 天前 · 319 次点击

    我用 Telegram 的,我尝试过发送图片识别错误 我换了两次模型,一开始是 kimi k2.5 ,后面换了 gemini 3 flash 都不行 每次都是乱回答图片内容 我尝试图片 url 是可以的,那说明模型是没问题的,我猜测是只发送了一个文件名过去了? 有什么解决办法吗?我写了个 skill ,他还是执着使用 read 去读取

    3 条回复    2026-02-10 08:29:08 +08:00
    rolandzhou
        1
    rolandzhou  
       1 天前 via iPhone
    我的是 tg + gemini 3 pro/claude-sonnet-4-5 ,没有做额外配置,开箱就能直接发图片过去,它也能理解图片的内容
    Watchdog
        2
    Watchdog  
       1 天前
    gemini 完全可以,直接发,语音、图片都可以,就是慢
    liverpool17
        3
    liverpool17  
       14 小时 42 分钟前
    读取图片路径不对,我一开始也是你这样后来跟模型说清楚让他自己查找位置修改位置就好了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2012 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 15:11 · PVG 23:11 · LAX 07:11 · JFK 10:11
    ♥ Do have faith in what you're doing.