你们有没有比较过， GPT5-Thinking 和 O3 比，辅助生成代码哪个强？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

最近高强度用 GPT5-Thinking ，通过多轮对话的方式辅助生成代码，大约 600 多行。它自动在 Canvas 生成代码，并且在这上面进行修改更新。到后面发现代码越改越糟糕，有的函数定义在修改完之后直接消失不见，导致后面报错。有的部分 1-2 行就能搞定，它给你写 10 多行。有一处最简单的矩阵乘法，它用循环来实现。感觉还不如之前的 O3 。不知道你们用过之后感觉如何？

gpt5

code generation

2 条回复 • 2025-08-23 13:33:24 +08:00

youthfire

12 天前

gpt 的问题不在于模型，而在于动态的算力分配。满血的 gpt-5 thinking 是我用过解决代码能力最强的。但如果处于降智状态，别说 o3 了，和 4o 都区别不大。留个心，你会发现它神一会儿狗一阵儿。最稳定的代码解决，目前看是 claude4.1 ，但是当你代码量特别长，比如 1000-2000 行，就并没有比 gemini 2.5 pro 强多少，上下文长度上去后性能锐减，而且额度一会儿就跑没了。可以交叉着用。

seraphlz

12 天前

目前我是 GPT5-Thinking 和 GPT4.1 混合用。GPT4.1 的 100 万上下文还是管用。对话中途可以随时切换成 GPT5-Thinking ，对需要优化或者修正的部分进行深度分析。