liyafe1997
ONLINE

liyafe1997

V2EX 第 32249 号会员,加入于 2013-01-13 12:04:39 +08:00
今日活跃度排名 12033
火绒病毒库停更了吗?
信息安全  •  liyafe1997  •  30 天前  •  最后回复来自 gearfox
6
用 PostgreSQL 存图片等 binary 有什么坑吗
  •  1   
    PostgreSQL  •  liyafe1997  •  54 天前  •  最后回复来自 hd7771
    90
    Clash 能实现订阅的订阅吗
    宽带症候群  •  liyafe1997  •  94 天前  •  最后回复来自 itisqiang
    39
    现在还有支持 S3 睡眠的笔记本吗
    硬件  •  liyafe1997  •  161 天前  •  最后回复来自 cskason
    2
    Win11 安装了 4 月更新之后发现搜索 UI 换字体了?
  •  1   
    Windows  •  liyafe1997  •  210 天前  •  最后回复来自 dgy125
    55
    liyafe1997 最近回复了
    以我高强度 ClaudeSonnet/Codex 的经验来看,这玩意几乎没有难度,甚至都用不着上 ClaudeSonnet/Codex ,(在 Cursor/Copilot 订阅中)免费的 Grok Code Fast 1 都能搞定 。
    要么是你用的中转站有鬼(给你弄了个假模型),要么是你的 prompt 太烂。
    从你的描述看,你应该是刚用 AI 没多久,多试试就知道怎么写 prompt 了。
    prompt 也不是一件想当然的事,不然为什么会有个词叫 Prompt Engineering
    15 小时 19 分钟前
    回复了 lymanbernadette6 创建的主题 Android 众安银行的 root 检测无敌了
    别用 Mgaisk 了,用 KernelSU 这类内核级 root 吧,Magisk 再怎么隐藏,都是有文件系统 hook
    22 小时 20 分钟前
    回复了 yezheyu 创建的主题 程序员 可以给手机刷上原生 Linux 吗?
    @duanxianze 不用 root ,Termux ,proot 容器跑发行版,用 VNC 连 localhost 来跑桌面,基本上日常的活都能干。
    3 天前
    回复了 ikiler 创建的主题 Android 为什么安卓互传联盟不开放接口协议?
    @pigspy 不用马上,早都支持了,我手上的 X70 & MagicOS9 试过可以和华为以及互传联盟的互传。
    这估计是国产机里面互传覆盖最广的了,荣耀这方面赢麻了
    3 天前
    回复了 ikiler 创建的主题 Android 为什么安卓互传联盟不开放接口协议?
    @wKong753900 统一推送联盟有个问题,这个服务器谁来运营,谁来负担成本?
    互传没有这个问题,因为是纯本地的协议的事情。
    4 天前
    回复了 Valid 创建的主题 Windows 有多少人不知道 UAC 在 windows 下的作用的
    @yyzh 不要把微信装到 Program Files 里就行了,装到%AppData%或者其它当前用户有权限的地方,就能无 UAC 自动更新了。
    4 天前
    回复了 fcfangcc 创建的主题 NAS 有人试过把 NAS 文件备份到对象存储吗
    太贵了,百度盘一年不到 200 ,10+TB 的空间,上传加密压缩包当冷备
    写上面这个的时候突然想到以前看到过的一个很好玩的视频:
    https://www.bilibili.com/video/BV1Pt421a7rw/

    这人估计因为什么原因,脑子里的 LLM 丢失了大量参数,像极了 LLM 规模过小过拟合在胡言乱语,但是无论是上面这人还是 LLM 胡言乱语,你会发现把每一句话单独挑出来都没毛病,至少语法是正确的。编程语言也是,你用一个再垃圾的模型让它写主流编程语言的复杂需求的代码,代码逻辑可能乱写一通,但语法基本上是对的。说明语法这个层面的信息(无论是编程语言还是人类语言)是非常基本的,小模型都不容易犯错,别说大模型了。
    你不能用 AST 这些传统的算法/逻辑来理解 AI ,AI 是没有逻辑的。

    各种 LLM 最基本的原理说白了就是「吐出下一个概率最高的 token 」,大量的各种语言的代码的训练数据基本就保证了,不会吐出导致语法错误的 token ,换句话说,导致语法错误的 token 不会得到高分(因为在训练数据中没有这种 case ),所以不会吐出来。

    就跟我们学习人类语言一样,你可能不了解一种语言的语法,但是从小到大有大量的 input (比如你的母语,中文,我想没多少人真的懂其中的门道),所以你也不太容易说出写出语法错误的句子,因为跟你以前看到的听到的别人说的不一样,会感觉很别扭(虽然你也说不出其中的规则),除非训练数据被污染了(比如你整天看很多中二的东西,那你说话可能也会变得很中二)。

    「逻辑错误/凭空编出来的 API 」,这就是所谓的幻觉,因为相关训练数据缺失,在这种情况下,一个概率最大的 token 可能就会是不正确的信息(编出来的 API ),因为实在没有其它更好的选择了,(即,尽管概率得分不大,但是依然是最大的那个,或者说,没有比它更正确的信息了)。

    比如 AI 不知道到底有哪些 API ,你的 prompt 提到一个「读用户年龄信息」,根据你的仓库里的代码,它可能会脑补出一个 GetUserAgeFromDB(),但是怎么样也不会吐一个 GetYourMoneyFromDB(),因为这时 token 一路吐下去,最正确的回答就是「 GetUserAgeFromDB()」。

    还是拿人类思维和语言来举例子,比如你从小在城市长大,你没见过西瓜是怎么长的,也没阅读过有相关内容的资料(训练数据缺失)。然后呢老师让你写作文,写篇「去乡下摘西瓜的故事」( prompt ),然后呢根据你从小到大的 input ,你知道西瓜是水果,然后呢水果一般都是长在树上的(「果」这个 token 后面经常跟着「树」)苹果也是水果,苹果树也经常出现,所以当你写下「西瓜」的时候,「树」这个 token 在你脑海里得分是很高的,于是你写下了「西瓜树」,幻觉就这么来了。尽管「西瓜树」是错的,但是你也不会写下「西瓜人」,「树」比「人」概率更大。

    但是从语法层面,你不大可能犯错误,尽管你可能并不懂什么主谓宾定状补这些语法知识和规则,但你会写出「我->去->爬->西瓜->树」,因为在你以前阅读过的材料(训练数据)中见过很多类似的组合(你见过很多句子第一个字是「我」,因此「我」在这里概率是最高的,然后「我」后面经常跟着「去」,于是你写了「去」......),你不大可能会写出「爬去我」,因为训练数据里你没见过「爬」放句首的,所以这个得分不会高,你就不会吐「爬」出来,「爬」后面也不会跟着「去」......因此你不会写出语法错误的句子,尽管你并不懂具体的语法规则。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5343 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 09:13 · PVG 17:13 · LAX 01:13 · JFK 04:13
    ♥ Do have faith in what you're doing.