做了一款在线 GPU 推理速度计算器,希望可以帮助到大家

9 条回复
103 次浏览

一个 vibe code 出来的 GPU 推理性能估算工具。
起因很简单——显卡太贵,买不起,想跑个模型又不知道自己的配置够不够,
于是把网上散落的参数和公式汇总了一下,做成了这个计算器。

在线地址: tps.bunai.cc

适合干什么

✅ 在买机子 / 租卡之前,先大概预估一下跑不跑得起来
✅ 学习推理性能建模,理解量化、KV Cache、TP、Roofline 这些概念
✅ 做方案初筛和参数对比

❌ 不适合直接替代真实 benchmark
❌ 不适合把估算值当作生产承诺
❌ Mac 电脑没有放出来,验证了一下差距有点大,先放一放


参考资料

这套公式和参数是我自己整理汇总的,没有大量真机跑过验证。
如果你手上有真实的测试数据,发现哪里估算偏差大、公式有问题,
欢迎开 Issue 或 PR 指出来,大家一起学习,一起把这个东西做得更准。

希望有真实数据的大佬帮忙指正,谢谢!🙏

❤️1
👍2
300
前排打手

显卡列表和模型列表的还需要补充,显卡各型号配置都有不同,模型就比如 qwen3 和 qwen3.6 都有,没看到 qwen3.5...

都听我说!
OP

截至目前,上面楼层已经修改了
qwen3.5 太多了,选择了大的已经添加,不到 1b 就没有添加,其他模型后续会继续追加
显卡再考虑一下,显卡同一类型,区别不是很大,特殊遇到再加吧.

追加一键识别电脑显卡,后续需要继续蹲点,我也不知道对不对。

前排打手

我感觉 2L 的意思应该是:识别当前显卡『并自动爬取配置』,而不是识别匹配一下=。=

都听我说!
OP

fake_sad 现在应该是识别到了,会自动带入参数计算,剩下的参数,需要自己调整了

都听我说!
OP

@MuyePeikon 目前的做法,只能在预设的显卡里面找,只有匹配到了才能自动计算。
每个显卡的带宽显存都是不一样的,都会影响计算结果,有很多参数。

Mac 电脑没有放出来,验证了一下差距有点大,先放一放。
他是 gpu+cpu 共享,所以理论上,只要 mac 内存能把模型加载上就能使用,不会很快也不会很慢。
而且 mac 机子光看带宽预测是一点也不准,实际要比理论高很多

自动爬取这个需要研究一下数据来源+详细参数,都满足也是可以做的

发表一个评论

R保持