$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 xiqingongzi 打赏,数额会 100% 进入 xiqingongzi 的钱包。
Web  收录于 VXNA 的 1 个网站
23 篇文章 feed address
xiqingongzi
0D

xiqingongzi

Just Keep Shipping
🏢  高级产品经理
V2EX 第 57504 号会员,加入于 2014-03-05 22:35:38 +08:00
今日活跃度排名 23175
根据 xiqingongzi 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
xiqingongzi 最近回复了
是的。作为某小龙的模型产品,补充一些我的看法(仅个人看法)
评测和体感不一致

1. 作为终端用户,我的建议是,不要太相信榜单,只作为参考,甚至也只能作为参考。原因是榜单本身是一个开卷考试,理论上如果你想考高分,你可以塞尽可能多的数据拟合题目,以获得足够高的分数。(为什么不是每个模型都刷满分?因为还需要加入其他类型的数据,以确保模型的在其他榜单效果上足够好)。所以,榜单看看就行。关键还是自己的使用体感或者自己的评测指标。

2. 关于打榜推理:打榜推理的好处是用量可控加时间短,所以可以上八路推理;得到比较好的效果。但如果是日常使用,一个是损耗比较大,因为日常的问题往往不需要那么多并行推理选其一(大部分问题没那么复杂,这也是为啥 claude code 把 ultrathink 作为一个单独的 magic word 来使用);另外一块是要考虑到成本,国内的竞争非常的卷,以至于各家可能都是贴着成本在做,甚至亏本在卖 API ,这样导致其实很难会选择给你最强的模型推理方案。
80 天前
回复了 radishzz 创建的主题 分享发现 好消息, PakePlus 改名了
感觉 pake 作者要恶心死了 hhh
81 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
开源模型可以自己考虑
81 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
国内的都不太用看..有安审拦截.🙀
求加群,微信 ixiqin_com
100 天前
回复了 Livid 创建的主题 Solana 20250805 - Cold Wallet 操作说明
V2EX 第 57504 号会员,加入于 2014-03-05 22:35:38 +08:00
看了一下,时间过的真快啊,也是加入 V 站 11 年了。
真 · 实干家。
@darksword21
@Jannok 比较好奇,是真人头像 PTSD ?还是小象馆这种类型的头像 PTSD ?(我并不是说你们的评价有啥问题,我思考的是如果更好的改变自己 maybe 需要换换风格)

此外,@Jannok 我倒觉得,这个可能和 PM 没啥关系。因为严格来说,我自己并不是一个 General 的 PM ,我的定位更多是 technical product manager ,所以也会做很多研发的工作。
@nananqujava 所以第一个,你的的预期是什么?;第二个你的预期是他每天问你一下?
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2654 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 14:13 · PVG 22:13 · LAX 06:13 · JFK 09:13
♥ Do have faith in what you're doing.