一位研究员用 Anthropic 的 Opus 4.6 做了一项实验。花了 2 万刀,让 AI 生成了 10 万行的代码, 实现了一个 C 编译器,它可以在 X86 、ARM 和 RISC-V 上面构建和编译 Linux 6.9 的内核。
这是我第一次见 AI 能够完整地实现一个足够大,也足够复杂的一个项目。也基本说明,AI 离取代程序员真的很近了。
我要再去试试 Claude Code 了,想想刚买的 Gemini Ultra... 在现在这个时代,购买任何一个 AI Coding 的 plan 都不要超过一个月,你永远不知道下个月哪个模型和工具更强大一些
文章地址: https://www.anthropic.com/engineering/building-c-compiler
1
bybyte 17 小时 1 分钟前
大概看了一下 :1.这个“Rust 实现的 C 语言”有些地方直接调用了 GCC 实现,而不是自己实现 2.就算启用了全部的优化,都比不过当前主流编译器禁用优化的速度(编译器开发最难的地方就是优化) 3.无法编译 16 位 x86 代码。 总结一些(个人理解):现在的 AI 确实对于一些存量很大的项目、方向能做到 70 分左右吧,现在程序员的价值应该就在于从 70 分到 90 分甚至到 100 分,这部分是 AI 做不到的,甚至一些小众的方向 AI 连 70 分都做不到。
|
3
defaw 10 小时 54 分钟前 然后呢,什么新东西都没创造,gcc 本来就在训练语料里,让 ai 再吐出一个更劣化的版本然后大惊小怪
|
4
sir283 9 小时 57 分钟前 gcc 不是开源的吗?不是还有个更轻量的 tcc 吗? ai 会从开源项目里扒源码出来,不是什么新鲜事了吧?
|
5
renchong 9 小时 41 分钟前 flutter 1w+的 issue 了,球球先让 ai 解决了吧
https://github.com/flutter/flutter/issues |
6
sillydaddy 8 小时 30 分钟前
感谢 OP 分享。
楼上的都在扯啥呢?尤其#1 楼,把人家「自曝其短」的东西照搬过来: https://www.anthropic.com/engineering/building-c-compiler#:~:text=not%20without%20limitations.-,These%20include,-%3A 只看到了那些缺点,这是个极简的脚手架你怎么不说呢?那 Agents 不能联网怎么不说呢?人类几乎没有介入怎么不说呢? Opus4.6 相比 Opus4.0 甚至 Opus4.5 的跨越怎么不说呢? 重点中的重点是 16 个 Agent ( Agent 团队)的协作,实现长时间大规模的无介入协作编程,不是吗?即使把这篇文章给到 AI ,也不至于抓不到重点吧。 |
8
voiyy 7 小时 25 分钟前
训练语料里那么多开源编译器,哪个不比它这个写的好,去看了它的代码,顶多就计算机本科毕业生代码水平
|
9
287854442 OP @bybyte 这是专业人士啊,谢谢分享
@willwon1 每一年都变化很大,真的不知道明年后年会怎么样 @defaw @sir283 是的,开篇说了,这是实验性项目,我也觉得结果本身其实没什么意义,就跟马拉松一样,只是探索一下极限 "gcc 本来就在训练语料里,让 ai 再吐出一个更劣化的版本然后大惊小怪" 这个观点看似合理,但我不他赞同,整个互联网都在训练语料里,但现在让他复制一个 linux 系统怕还是不可能的事情,让他创造出另外一个诺贝尔奖也不太现实。(背景是当下) 虽然大模型像一个整个互联网(知识库)的“压缩包”,但“解压”过程是相当有损的。 @renchong 哈哈哈 @sillydaddy 谢谢 @HFX3389 同怀念,那时候感觉 AI 完全只是个辅助,现在基本可以做主力 |
10
287854442 OP @voiyy 哇哦,好一个 CS 毕业生代码水平
.的个数代表我的惊吓程度 |
11
kaneg 7 小时 12 分钟前 via iPhone
GCC 的历史复杂性是略有所闻的。这样的项目如果用人,即使不计成本,不论最后的结果,那也是旷日持久的超大工程。 照这样的发展速度,以后这种庞大且复杂的工程,AI 可以真正发挥其 7x24 不间断地工作的优势,人类只有围观的份了。
|
13
xiaopenggggggg 52 分钟前
Rust 编译器为 ai 提供了明确的错误信息,没有 Rust 编译器,让 ai 用其他语言搞编译器没这么容易把
|