用 Deekseek R1 也有几个月了,基本上当作搜索引擎和日常办公助手在使用。 和 Claude Sonnet 3.5/3.7 比起来,中文场景下或者沟通一些国内的问题时,Deepseek 首次回答的内容总体还是很靠谱的。 但是长时间使用下来,发现 Deepseek 基本上只有首次回答靠谱。 除了第一次追问时很大概率碰到服务器繁忙的场景之外,能正常返回结果的时候,追问的回答质量差的离谱,幻想问题尤其严重。
比如刚才给他提供了一个 3000 字的文案让他帮我缩写成 1000 字的小红书风格的文案,第一次回答返回的内容基本满意,但我补充了 100 多字新的内容,并让他结合我两次给的内容考虑后,它返回的内容就严重离谱了。返回的内容有一多半都是我的文案中从来没提到过的内容,和我给他的主题完全不想干~~
我想应该不是我提问的问题吧,同样的场景下,Claude Sonnet 3.7 的回答就完全没问题。
其实还是更想多使用 Deepseek 的,但是这个实际使用体验,屡次三番的让人爱不起来啊。
不知道大家实际使用下来是什么样的。是只有我这样么~