yanyuechuixue

yanyuechuixue

V2EX 第 61683 号会员,加入于 2014-05-01 23:22:30 +08:00
今日活跃度排名 21891
yanyuechuixue 最近回复了
@thet 大哥您说的这里的 source ip 是指本地(也就是 container )还是指远端( peers )啊?
@kennylam777 非常感谢!

我还得多加学习。
那我用 exl2 就好了,我也正是有一个 4090 和 4060ti , 也只是用来做对话,足够了。

感谢大哥!
@kennylam777 不好意思,我是个新手,能否请教您一下,不同的量化有什么不同呀?

例如 exl2 量化,W4A16 量化 , GPTQ 量化,他们的性能会有比较大的不同么?

我现在简单起见,直接用了 ollama 给出的 Int4 ,想去挑一个好的
@yanyuechuixue ok 找到了,谢谢!
@kennylam777
能给一个 coder 的链接不?
我只找到了 instruct 的链接
8 天前
回复了 ClA0ClA0 创建的主题 Apple 京东耍猴, mac mini 压根抢不到
你才知道啊哈哈哈哈哈
@F1Justin 纯 CPU 么?
@liulicaixiao cursor 怎么白嫖呀?
看了一下,如果用 INT4 的模型,4090 没问题了。精度损失也很少。
但问题是不可能将一块 4090 用在这上面。成本太高了,不考虑保护隐私的情况下,还不如订阅 ChatGPT.

4060Ti 16G 的价格比较低,我买了一块,这个可以用来“全职”部署 LLM, 但目前即便是 INT4 也无法跑在 16G 上。

也许 Windows 的共享显存会有用,但不知道速度会降低到多少。
14 天前
回复了 caojunjie2024 创建的主题 iPhone iPhone 时间旁边的火箭是什么意思哦
@cat 而且是 OP ??
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3047 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 13:35 · PVG 21:35 · LAX 05:35 · JFK 08:35
Developed with CodeLauncher
♥ Do have faith in what you're doing.