V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
huaweigg
V2EX  ›  Local LLM

通过雷电网桥连接三台 Mac(m1p/m2/m4)测试 Exo cluster 运行 Qwen 2.5 Coder 32B 结果

  •  
  •   huaweigg · 14 天前 · 753 次点击

    测试机型:

    • m1pro 16G(14cu)
    • m2 8G(10cu)
    • m4 16G(10cu)

    Screenshot 2024-12-13 at 12.30.34 AM.png

    测试模型为 Qwen 2.5 Coder 32B

    测试结果

    • 三台单独都无法运行起来。当 m2 和 m4 通过雷电 4 互相连接时也无法运行。
    • 当 m1pro 和 m4 通过雷电 4 互相连接时,速度为 5 tokens/s
    • 当三台设备通过雷电 4 互相连接时,速度为 8 tokens/s

    崩溃概率蛮大的,测试三次,两次 m2 机器上 python 进程 OOM 被干掉。 Screenshot 2024-12-13 at 12.36.36 AM.png

    第 1 条附言  ·  12 小时 50 分钟前
    时延是 0.4ms
    3 条回复    2024-12-26 14:01:48 +08:00
    phrack
        1
    phrack  
       14 天前
    挺有意思的,之前也偶然见过这个项目不过没试过。如果不用雷电就是普通的以太网速度怎么样?
    huaweigg
        2
    huaweigg  
    OP
       13 天前   ❤️ 1
    @phrack 千兆比雷电网桥慢,感觉瓶颈在通讯时延,千兆延时在 1000ms ,雷电网桥才 400ms ,通讯数据带宽也就几百 kbps 。万兆没有条件测😂,据 https://x.com/alexocheema/status/1855242039501128144/photo/1 比雷电 4 还快一些。
    Livid
        3
    Livid  
    MOD
       15 小时 40 分钟前   ❤️ 1
    提供一个参考数据点。

    2021 MBP M1 Max 64G

    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   988 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:42 · PVG 05:42 · LAX 13:42 · JFK 16:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.