openclaw 无法多模态输入图片识别

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

我用 Telegram 的，我尝试过发送图片识别错误我换了两次模型，一开始是 kimi k2.5 ，后面换了 gemini 3 flash 都不行每次都是乱回答图片内容我尝试图片 url 是可以的，那说明模型是没问题的，我猜测是只发送了一个文件名过去了？有什么解决办法吗？我写了个 skill ，他还是执着使用 read 去读取

图片

模型

识别

3 条回复 • 2026-02-10 08:29:08 +08:00

rolandzhou

1 天前 via iPhone

我的是 tg + gemini 3 pro/claude-sonnet-4-5 ，没有做额外配置，开箱就能直接发图片过去，它也能理解图片的内容

Watchdog

1 天前

gemini 完全可以，直接发，语音、图片都可以，就是慢

liverpool17

14 小时 42 分钟前

读取图片路径不对，我一开始也是你这样后来跟模型说清楚让他自己查找位置修改位置就好了