最近高强度用 GPT5-Thinking ,通过多轮对话的方式辅助生成代码,大约 600 多行。它自动在 Canvas 生成代码,并且在这上面进行修改更新。到后面发现代码越改越糟糕,有的函数定义在修改完之后直接消失不见,导致后面报错。有的部分 1-2 行就能搞定,它给你写 10 多行。有一处最简单的矩阵乘法,它用循环来实现。感觉还不如之前的 O3 。不知道你们用过之后感觉如何?
![]() |
1
youthfire 12 天前
gpt 的问题不在于模型,而在于动态的算力分配。满血的 gpt-5 thinking 是我用过解决代码能力最强的。但如果处于降智状态,别说 o3 了,和 4o 都区别不大。留个心,你会发现它神一会儿狗一阵儿。最稳定的代码解决,目前看是 claude4.1 ,但是当你代码量特别长,比如 1000-2000 行,就并没有比 gemini 2.5 pro 强多少,上下文长度上去后性能锐减,而且额度一会儿就跑没了。可以交叉着用。
|
2
seraphlz OP 目前我是 GPT5-Thinking 和 GPT4.1 混合用。GPT4.1 的 100 万上下文还是管用。对话中途可以随时切换成 GPT5-Thinking ,对需要优化或者修正的部分进行深度分析。
|