Chuckle's recent timeline updates
Chuckle

Chuckle

🏢  家外蹲 / 前台
V2EX member #604103, joined on 2022-11-30 18:49:14 +08:00
Today's activity rank 12478
Per Chuckle's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
Chuckle's recent replies
理论来说,异地要手机号接码啥的操作,已经基操了,没有确实有问题
这是让人做负担,让人先弄好顶层设计,但好累,我也发现另一个朴实无华的办法,模仿 AI 训练,设计一个环境,让 AI 自己无限试错碰壁,闲着没事,把做过的需求再让 AI 做一遍,然后给正确答案,AI 自己对比自己做错了什么,做得更好了什么,记录下来,沉淀 spec 之类的,这个工作流我养了一个月了,前两天感觉 AI 灵智开了,仿佛看到原子弹爆炸.jpg 。
我开了一个新对话,只输入了一句话,“现在把另一个扩展适配新组件”,这句话背后,需要涉及 4 个项目仓库,还要对比新老组件 api ,还要看之前的组件怎么迁移的,扩展怎么写,等等潜在逻辑,传统让 AI 辅助我弄的话,起码半天,而且很累。但现在它 10 分钟,在单个对话窗口,一句话,甚至触发了 5 次上下文压缩,还能保持工作流。工作流里从来没有要求过要一次完成长任务,但它就是做到了。最后只有两个细节差异逻辑不对,我让它自己再检查一遍就发现了。
@Chuckle 多 agent 对抗是个方向,毕竟我现在最常干的事情就是让 AI 自己再审查一遍代码,比如“逐行代码对比新老组件的上层扩展适配是否一致,有无逻辑、功能、细节差异,以及潜在的风险”,往往我自己 cr 前先问个几轮,就完成了 99%了能挑出来不少风险和毛病,但这句话要是扔 rules 或者 skill 里貌似不起作用,ai 不会完成代码后自己检查,因为这种提示词和具体业务有关联,找不到黄金提示词,但有另一个 agent 自动介入的话,就能根据业务情景,自动生成这段话
界面好看,有空试试,不过学习一个新工具成本还高,现阶段专业的还是脱离不了 ide 或者 codex cc 成熟的 agent 生态,以及 vb 上绕不过去的 codex app 大山。如果给成熟的 agent 做“外围插件”,什么记忆系统之类的,难免会受限,像支持 hook 、plugin 的 agent 也没多少,更别说更深层的定制改动了,不够自由,但自己做 agent ,同质化和换工具成本高。如果只是免费注册用 api ,推广的吸引力还是不够,毕竟凹凸曼大善人,时不时来个 bug gpt5.5 就 free 了,还有一堆中转站。
我实践时也发现 op 所言,它完全缺乏全局观,agent 本身只是个“操作系统”,在复杂老项目中,完成需求任务,更多的瓶颈不是上下文大小、agent 能力,而是上层应用,只有 agent ,AI 不知道业务架构,AI 无法从一个页面上,定位到你成百上千的仓库改哪个文件,AI 无法完成测试闭环,这背后还有需求分析、业务数字化、代码地图、质量审计的事情,以及模仿阿尔法狗进化的老路子,让 AI 自己学习经验,试错才是最宝贵的,这也是我边做需求边做 ai 工作流头疼的点。
多 agent 弄个对抗网络的设计,之前好像也见过,但实际开发并不会像 demo 那样一段话生成***,自由度没这么高,也不是单仓库项目,往往是涉及多个仓库,多个包。
多 agent 对抗、规范沉淀,加上需求复杂性导致不可避免的上下文压缩,感觉有让 AI 偏离原有的产品 prd 设计方向的风险。
另外对比图也过于夸张了,opus4.7 不至于,一句话生成***不仅听腻了,感觉也并不是好的案例,先弄一个网盘系统,再用标准的产品 prd ,对比看或许更明显。
我近一个月实践下来,大模型其实能力是够了,上下文也不是问题,对于大型软件项目,瓶颈在上层应用设计,需要有一个决策,让公司所有人都用上 ai ,需要有一个工具,在人和 ai 不断对话过程中,自动记录经验、试错过程,ai 能完成的 90%工作,那不是重要的,对于剩下 10%难啃的骨头,遇到的奇奇怪怪的问题,人会发现很多代码和文档不能提现的“隐性”逻辑,把这些落到“外置记忆”中,才是提升最大的,但现在记忆系统的设计,还是五花八门,没有一个大家都认可的基准测试,都在摸索
码住
弄个 ai 脚手架吧,这种项目挺多的,做过的事情让 ai 记住,沉淀规范,别每次打开新对话 ai 都不知道之前做过什么,做错过什么,a 代表 XXX ,b 代表 XXXX ,c 代表 XXX ,用多了 ai 就懂你了(当然 token 花得也更多了),就不会拉扯你了
@nowant 不清楚,反正极致站起来狠狠蹬,之前 cursor 不限量,一个月蹬 1k 多刀,忒贵了,我自己弄了个 ai 脚手架,一个月,qoder 也调教得勉强能用
https://github.com/qxchuckle/lattice/
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2758 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 11:55 · PVG 19:55 · LAX 04:55 · JFK 07:55
♥ Do have faith in what you're doing.