shutdown
@KKCC 是的,mac 运行满血 deepseek 只是大了点的木船,要速度还是得 GPU 卡
金字塔顶端的人
实际也只是跑起来,生产不可用,14t/s 的速度需要等太久(0528-8bit)
@KKCC 我用过 mac studio 512gb 的版本,LLM Studio 启动串行执行效果还可以(用 mlx-community/minimax-m2.1-8bit-gs32),速度可以达到 40-80token/s,跑 opencode 的实际体验还是和 opencode 官方的 minimax free zen 差很多,主要是速度上慢,调用本地执行的时间至少是 api 的三倍。生成的 code 理论上是一样的,只是 gpu 限制了执行速度。