sickworm
V2EX  ›  编程

被 composer 2.5 震撼了

  •  
  •   sickworm · 2 days ago · 1588 views

    我日常是 gpt 5.5 high + deepseek pro max effort 搭配着用,之前公司给够的时候 claude 也用了几个月。

    最近因为写了个功能,要适配 cursor 的 hooks ,所以买了一个月 cursor 。那时候还是 composer 2 ,用起来大概和 glm5.1 体感差不多(没试过复杂的),剩余额度主要还是用一下 gpt 5.5 。

    前两天看到 composer 2.5 出了,随便用了一下,用后感受非常震撼。首先是工具调用和 token 速度快到爆炸,用肉眼扫感觉一秒钟能调用 5 个工具,输出也跟刷屏一样。

    然后拿 gpt 5.5 AB 了 7 8 个问题,都是中等偏难的编码问题。结果 composer 2.5 在快一倍的情况下,回答质量和 gpt 5.5 一样甚至更好,一样是找到的解法都是对的,更好的方面主要是解释的更详细,人更好理解。

    我兴奋的跟几个同事都演示了一下,速度大家都觉得很快。有个刚好有 cursor 包月的同事也试了一下,也同意我的观点(>= gpt5.5)。感觉网上聊这个的很少,想看看大家有体验过的感受怎样,因为这个确实不太符合常理,毕竟它的基座是 kimi 2.5 。

    21 replies    2026-05-25 01:02:52 +08:00
    herozzm
        1
    herozzm  
       2 days ago
    真的吗?国内大模型雄起?
    Mac
        2
    Mac  
       2 days ago   ❤️ 1
    phper 看到这名字以为穿越了
    bladeRunner2049
        3
    bladeRunner2049  
    PRO
       2 days ago via Android
    赞同,之前用 Opus4.6 额度用完了,开始用 Composer2.5 ,速度超级快,体验上跟 4.6 也没啥区别,Kimi 给力👍
    sickworm
        4
    sickworm  
    OP
       2 days ago
    @herozzm 但直接用 kimi 2.5 并没有这种感觉,比 glm 5.1 拉很多
    HappyAndSmile
        5
    HappyAndSmile  
       2 days ago
    我不认同,快是快,但是没用,好想好努力地写了方案然后去做,最后做了一坨垃圾给我,浪费了我 2 小时重新改
    YanSeven
        6
    YanSeven  
       2 days ago via Android
    让 token 再飞一会。
    lianyue
        7
    lianyue  
       2 days ago
    composer 的结构美观质量比 gpt 好
    其他的都差
    cuebyte
        8
    cuebyte  
       2 days ago
    速度飞起应该是因为拿到了 xAI 的算力,至于为什么效果好就不得而知了,可能是后训练给力,也可能是算力不差钱,可以调用更多的前向传递层或类似的提升吧。
    yangyaofei
        9
    yangyaofei  
       2 days ago via Android
    是不是 opus 变弱了,除了个别的特别需要智力和指令跟随的任务,没感觉比 glm5.1 强很多,没有原来那种比我更懂我,还能好好实现的感觉了……
    sickworm
        10
    sickworm  
    OP
       1 day ago via Android
    @cuebyte 可能针对 coding 猛训了一波
    sickworm
        11
    sickworm  
    OP
       1 day ago via Android
    @yangyaofei 我偶尔也会有这种感觉,但很难摆脱主观感受
    herozzm
        12
    herozzm  
       1 day ago via iPhone
    x 上一堆都在猛吹这个和 Qwen 3.7 max ,突然想起特斯拉网上没赢过线下没输过这个段子,看完你会觉得 claude 预期市值那么高都是假的,今天被这个 xx 模型干趴,明天被哪个 xx 模型打得无还手之力,回头一看 claude 还是第一
    sickworm
        13
    sickworm  
    OP
       1 day ago
    @herozzm 流量导向是这样的,不过现在公司 token 预算都给的很足,到了要降本增效的时候不知道 claude 还是不是第一首选
    yangyaofei
        14
    yangyaofei  
       1 day ago via Android
    @sickworm 现在我基本上只用 opus 做一些规划和审计,短程任务用 glm5.1 ,长程任务用 deepseek,glm 要是用弄个靠谱的 1m 上下文就好了
    slackerman
        15
    slackerman  
       1 day ago via Android
    我只用 auto, 没有单独开过 composer ,不知道有没有代表性。1 、飞快,小活自己能完全 hold 住的都给他。2 、前端审美不错,第一梯队,比 codex 好。3 、review 还行,有些独特角度。
    大活,复杂的全局的代码实现就算了,指令理解,遵循,周全程度还是差点
    现在基本用 codex+cursor auto
    sickworm
        16
    sickworm  
    OP
       23h 0m ago
    @yangyaofei 个人体验,国模 token 速度都好慢,deepseek 一到下午就半小时的干,影响心情和效率。glm 只用过司内部署的,高峰期也是非常慢。glm 新出的快速版不知道怎么样
    sickworm
        17
    sickworm  
    OP
       22h 58m ago
    @slackerman auto 和 composer 是一个体验,估计 99% 都路由到 composer 了,毕竟和其他模型隔离了额度
    yangyaofei
        18
    yangyaofei  
       22h 2m ago
    @sickworm #16 最近好多了, 甚至 glm 都给大于 2 的并发了😂😂😂(甚至晚上能跑 10 个 subagent 了). 我有自己的智谱的 coding plan, 感觉最近快了很多, 公司给的 key 超级慢.

    Deepseek 感觉已经挺快的了, 确实有时候用 Cursor/Codex 感觉还是他们快, 但是钱包受不住, 个人觉得除了 opus 没一个能打的

    Codex 也不好用, 快是快但是, 智商没有 opus 那么高能解决一些棘手的工程规划问题, 又没有 glm 那么听话甘愿当牛马, 需要数学/算法的时候又没有 G(Gemini)老是那么厉害.
    slackerman
        19
    slackerman  
       21h 33m ago via Android
    @sickworm 我也是这么感觉的,但是不知道哪里可以查证。毕竟文档上 Auto 和 Composer 的价格是不一样的。
    sickworm
        20
    sickworm  
    OP
       9h 7m ago via Android
    @slackerman 还有这回事,我得看看,我看额度共享就没在意
    sickworm
        21
    sickworm  
    OP
       9h 5m ago via Android
    @yangyaofei 好久没用 opus 了,确实最强,gpt5.5 是我第二喜欢的,不过最近要被 composer 篡位了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   6097 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 02:08 · PVG 10:08 · LAX 19:08 · JFK 22:08
    ♥ Do have faith in what you're doing.