zhwguest
V2EX  ›  OpenAI

续 claude 降智严重后, codex 也在步其后尘

  •  
  •   zhwguest · 5 days ago · 4874 views

    你说这是为什么呀为呀么为什么?

    39 replies    2026-05-20 16:26:52 +08:00
    neuthself
        1
    neuthself  
       5 days ago
    可能是算力不够?
    MX123
        2
    MX123  
       5 days ago
    这两天 claude 明显比 Codex 强
    lujiaosama
        3
    lujiaosama  
       5 days ago
    无它,算力不足,好日子还在后头呢
    longxinglink
        4
    longxinglink  
       5 days ago
    我的模型和 Mythos Preview 差在哪里?我的 GPT5.5:这里可能有一个漏洞,根据文档我新建了三个漏洞来修补这个漏洞,Mythos Preview:这里有漏洞,我写了 PoC ,跑通了,还能把它和另一个低危点串成攻击链。
    https://www.v2ex.com/t/1213773#reply1

    GPT 幻觉特别强,经常去用错误文档且不加以检验,也是酱汁导致的吗?
    kloudmuka
        5
    kloudmuka  
       5 days ago
    GPT 这两天拉完了,吐一大堆没用的垃圾,又只能回去用 Claude 了
    MuyuQ
        6
    MuyuQ  
       5 days ago
    这两天 image2 也经常抽风。
    deplives
        7
    deplives  
       5 days ago
    gpt 的降职已经不是这几天才开始的,我的官方 gpt 已经吃灰很久了,上周让他写一个 需求,弯弯绕绕改了一堆又一堆,编译都过不去,最后自己都快无限循环了,claude 4.7 一把梭解决,顺便还找出来了 gpt 写的屎一样代码的 20 多个 bug
    prosgtsr
        8
    prosgtsr  
       5 days ago
    一般都是有新模型在研发中,占用算力了
    qingjin
        9
    qingjin  
       5 days ago
    算力倾斜,逼你用更高倍的新模型。
    evan1
        10
    evan1  
    PRO
       5 days ago
    gpt 是最先开启降智的。。。好几年了都。

    当时 claude 还只会封号。
    evan1
        11
    evan1  
    PRO
       5 days ago
    可能是为了节省成本。
    bush911
        12
    bush911  
       5 days ago
    各位大佬,Claude 手机号码验证你们都是去淘宝搞定的吗?
    glouhao
        13
    glouhao  
       5 days ago
    其实我感觉啊 这几家都是刚发布出来新东西可劲搞 后面慢慢下滑
    kkth
        14
    kkth  
       5 days ago
    哇擦,难怪这几天感觉不对劲,这可咋办呀
    zhwguest
        15
    zhwguest  
    OP
       5 days ago
    最恐怖的事情是,网络明明牛逼轰轰,但是广大码畜只能使用弱智工具了。
    xjoker
        16
    xjoker  
       5 days ago
    怪了 我今天体感是 GPT 比 Claude 好用
    imchrisorz
        17
    imchrisorz  
       5 days ago
    这两天感觉 Codex 确实有点降智,一个需求怎么讲都讲不明白,plan 生成质量很差
    huangpingdong
        18
    huangpingdong  
       5 days ago
    @MX123 claude 不是租到了马斯克的算力了吗
    chunqiuyiyu
        19
    chunqiuyiyu  
       5 days ago
    现在真的蠢得用不了……
    JerningChan
        20
    JerningChan  
       5 days ago
    感觉本地部署的 qwen3.6-27b 都比 opus 4.7 要用,写代码的话

    今天消耗了 21%的 token opus4.7 居然对话了 3 次都处理不好一个 bug ,还来来回回 3 次都说他已经修改了代码,看输出他是改了,但是完全不知道他改的什么东西,反正就是没效果

    然后,换回本地 qwen3.6-27b 一次解决问题
    NerbraskaGuy
        21
    NerbraskaGuy  
       5 days ago
    感觉都在试探用户底线,测试降智到哪种程度会导致用户流失太多,用来制定成本。
    x86
        22
    x86  
       5 days ago
    故意开白嫖的口子呗,这个月到期不续费,不如白嫖
    iFlicker
        23
    iFlicker  
       5 days ago
    新模型训练会占用大量算力
    MEIerer
        24
    MEIerer  
       5 days ago
    额度又少,还降智,难受
    jackqian
        25
    jackqian  
       5 days ago
    我一直用 xhigh ,没感觉到降智
    diudiuu
        26
    diudiuu  
       5 days ago
    @JerningChan 方便分享一下哪个量化版本的吗
    JerningChan
        27
    JerningChan  
       5 days ago
    @diudiuu 就用 unsloth 的 Qwen3.6-27B-UD-Q4_K_XL.gguf 就很不错,我家里自己用的 35b-a3b 也很不错
    teaguexiao
        28
    teaguexiao  
       5 days ago
    这种节点通常是新版本发布前后的算力调度问题,Claude Sonnet 4 发布前 3.7 也来过一次差不多的波动。等一周左右一般会恢复,实在不行就先请 ds v4 我来做客。
    wdv2ly
        29
    wdv2ly  
       5 days ago via Android
    同感,Opus 4.7 明显比之前苯了很多,现在有点像豆包了,说啥只会迎合
    diudiuu
        30
    diudiuu  
       5 days ago
    @JerningChan #27 一会在本地试下
    commoccoom
        31
    commoccoom  
       5 days ago
    @JerningChan 请问下 3060 12G 能跑吗😂
    iorilu
        32
    iorilu  
       5 days ago
    不会把, 真不如本地

    这两公司得瞬间破产
    icaca
        33
    icaca  
       5 days ago
    一两周前就降智了
    JerningChan
        34
    JerningChan  
       5 days ago
    @commoccoom 不太行喔,除非你把大部分的层卸载到 cpu+内存,这样稠密型的模型就会比较慢了,moe 的话,我就不太清楚,我之前是 1660s 6g ,跑那种 9b 模型,设大了上下文,就得卸载到 cpu ,就会很慢
    JerningChan
        35
    JerningChan  
       5 days ago
    @iorilu 你自己试试就知道了,问题是即便你想 27b 用的爽,不想折腾,单卡跑,成本是多少?随便起码一张 4090 吧,反正我自己用 2080ti 22g 跑 27b 模型,都只有 20t/s 左右,要用得爽,起码 60t/s 才有一点点效率
    sead
        36
    sead  
       5 days ago
    最近写的确实缺点意思, 我还以为是错觉。。。
    chen27
        37
    chen27  
       5 days ago
    算力用来训新模型了
    eventlooped
        38
    eventlooped  
       5 days ago
    我最近觉得 claude 比 gpt 强太多了
    mfsw
        39
    mfsw  
       4 days ago
    不知道恢复了没有。不敢用了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   846 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 129ms · UTC 21:19 · PVG 05:19 · LAX 14:19 · JFK 17:19
    ♥ Do have faith in what you're doing.