V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xiqingongzi  ›  全部回复第 1 页 / 共 87 页
回复总数  1731
1  2  3  4  5  6  7  8  9  10 ... 87  
是的。作为某小龙的模型产品,补充一些我的看法(仅个人看法)
评测和体感不一致

1. 作为终端用户,我的建议是,不要太相信榜单,只作为参考,甚至也只能作为参考。原因是榜单本身是一个开卷考试,理论上如果你想考高分,你可以塞尽可能多的数据拟合题目,以获得足够高的分数。(为什么不是每个模型都刷满分?因为还需要加入其他类型的数据,以确保模型的在其他榜单效果上足够好)。所以,榜单看看就行。关键还是自己的使用体感或者自己的评测指标。

2. 关于打榜推理:打榜推理的好处是用量可控加时间短,所以可以上八路推理;得到比较好的效果。但如果是日常使用,一个是损耗比较大,因为日常的问题往往不需要那么多并行推理选其一(大部分问题没那么复杂,这也是为啥 claude code 把 ultrathink 作为一个单独的 magic word 来使用);另外一块是要考虑到成本,国内的竞争非常的卷,以至于各家可能都是贴着成本在做,甚至亏本在卖 API ,这样导致其实很难会选择给你最强的模型推理方案。
76 天前
回复了 radishzz 创建的主题 分享发现 好消息, PakePlus 改名了
感觉 pake 作者要恶心死了 hhh
77 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
开源模型可以自己考虑
77 天前
回复了 Charon2050 创建的主题 问与答 哪家 LLM 的色情类角色扮演效果较好?
国内的都不太用看..有安审拦截.🙀
求加群,微信 ixiqin_com
96 天前
回复了 Livid 创建的主题 Solana 20250805 - Cold Wallet 操作说明
V2EX 第 57504 号会员,加入于 2014-03-05 22:35:38 +08:00
看了一下,时间过的真快啊,也是加入 V 站 11 年了。
真 · 实干家。
@darksword21
@Jannok 比较好奇,是真人头像 PTSD ?还是小象馆这种类型的头像 PTSD ?(我并不是说你们的评价有啥问题,我思考的是如果更好的改变自己 maybe 需要换换风格)

此外,@Jannok 我倒觉得,这个可能和 PM 没啥关系。因为严格来说,我自己并不是一个 General 的 PM ,我的定位更多是 technical product manager ,所以也会做很多研发的工作。
@nananqujava 所以第一个,你的的预期是什么?;第二个你的预期是他每天问你一下?
158 天前
回复了 xiqingongzi 创建的主题 VXNA 申请收录:白宦成的博客
158 天前
回复了 xiqingongzi 创建的主题 VXNA 申请收录:白宦成的博客
是的
266 天前
回复了 lmshl 创建的主题 生活 🎉小棉袄出生, 生殖隔离已打破
恭喜!
2024-09-20 14:24:59 +08:00
回复了 7dzxtaobaocom 创建的主题 推广 相约十一年, 2024 大闸蟹已上市,欢迎新老 V 友尝鲜
对楼主家的 find my tag 印象深刻
可以看看 linux.cn
2023-01-20 10:44:36 +08:00
回复了 nomedia 创建的主题 职场话题 大家今年都拿了几个月年终奖?
0
@SampleNaive 服务器赔付 25%,OSS 赔付 10%。
2023-01-06 15:35:40 +08:00
回复了 wdssmq 创建的主题 问与答 「WordPress」有人了解 WP 上架插件/主题的审核流程么?
@wdssmq 可以看一下他们的文档,有如何加入 plugin 团队的说明
1  2  3  4  5  6  7  8  9  10 ... 87  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2352 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 15:48 · PVG 23:48 · LAX 07:48 · JFK 10:48
♥ Do have faith in what you're doing.