![]() |
1
ericguo 66 天前
正常,不过建议用用 LM Studio ,跑 mlx 格式的模型,dwq 量化的就很好。
|
![]() |
2
walkon OP @ericguo 好吧,这个风扇噪音有点预期之外。待会我试试 LM Studio 。我之前试了 70B 的 DeepSeek ,才 10 tokens/s ,CPU/GPU 已经干到 100°C 了,风扇到了 3000 多转,键盘都烫得不行,本地跑大模型有点受罪啊。
|
4
niubilewodev 66 天前
Mac 能本地跑大模型,但 token 速度和 prefill 时间都很烂。
而且有一定概率高负载键盘位置滋滋滋的响。 |
5
lpxxn 66 天前
我的 mini pro 48G 内存跑一些 32b 的才会风扇噪音
|
![]() |
6
ericguo 66 天前 ![]() @walkon https://huggingface.co/mlx-community/Qwen3-30B-A3B-4bit-DWQ 这个模型推荐
另外的确随便跑跑得了,真的干活还是得调用大模型,本地跑的意义真心不大。 |
![]() |
8
walkon OP @niubilewodev 感觉就是这个声音,是风扇声么?
|
![]() |
9
GeekGuru 65 天前
跑大模型响很正常呀,瞬间功耗估计都破百瓦了。
|
![]() |
11
ota 12 天前
跑本地主要是部署流程的 devops ,意义不大。而且真金白银买硬件,还只能够的上能 run 的程度,根本无任何调试的意义。我直接放弃了。因为用过几天 m3max128g 的。现在跑所谓的“本地大模型”,都是用 pay as you go 的 cloud 。调试完就快照关闭机器。一次也花不了多少钱,而且很多可以导出 pod 平移其他 k8s 。真没必要本地化,不管是学习还是开发。
|