DGX Spark 与 MacStudio 怎么选呀

23 条回复
148 次浏览

内容如题,想买一个 AI 设备,小团队就几个人用,目前看了两个设备,DGX Spark 和 MacStudio,计划用于跑大模型,100B 左右的模型这些设备的内存都可以吼得住,但在一些带宽、速率上,不知道这两个设备有没有太大差别。有有经验的大佬指导一下吗?先谢谢大家啦
image.png
image.png

马上来
OP

不考虑云,只考虑本地小设备,不考虑买单卡来组装,只考虑一体的主机。

DGX Spark 我选择的这个,现在跑 120b 的模型无压力
这个是 128g cpu 和 gpu 共享,我听说两台机子可以搞 400b 的,只是现在也没有人见过

还是看你需求跑多大的模型,我装的这个模型相当于 4o-mini 的水平

https://2libra.com/post/ai-applications/vc337z0 刚装完,分享下

准备再写一个 openclaw 跟这个配置的文章,目前已经弄好了,通道配置的飞书.

马上来
OP

大佬,这个是教程嘛。用起来感觉怎么样呀,和 MacStudio 对比过没有呀。我主要是想着要是 macstudio 不用了还可以干其他的,这个设备要是不用了当个 ARM 的 Linux 服务器感觉用处不大facepalm

展开 7 条评论

不差钱的话,全都买啊。mac studio m3 ultra 要是不搞 512g mem ,意义不大,顶配要 10w ,比 dgx spark 贵太多了。如果预算有限,就 dgx spark 咯?反正现在小模型的智能密度很高了。你要专业性和准确性的话,用 rag 提升,当前 ocr 和 rerank 都发展的不错了。

mac studio m3 ultra 可以串起来,组一个 1T mem 的组合 跑 671B 的 deepseek 。不差钱儿的话,这个肯定更好。

转一下 有个老哥回复的

马上来

实际也只是跑起来,生产不可用,14t/s 的速度需要等太久(0528-8bit)

马上来
OP

是的,感觉支撑生产还是不够,钱和性能还是正比关系

展开 1 条评论
前排打手
GRD

我现在用的就是你说的这款 MS, 但是没跑过大模型, 主要是用来开发, 还没跑满过性能.

image

马上来
OP

哇,我刚刚测试跑模型,qwen-code-next,2 并发下,30token/s,和 API 还是没有办法比,不过也确实,价格和性能还是正比的

前排打手
GRD

用 Ollama 跑吗? 我还没本地跑过, 因为我本身也需要很大的内存来工作 😂

展开 4 条评论
前排打手
GRD

昨晚上刚好想装 ollama, 然后就装了几个大模型测试了一下速率, 感觉一般.

发表一个评论

R保持