只需一步,快速开始
杜甫 发表于 2025-4-12 14:43 刚试了下, 跑deepseek-coder-v2 16B 这个模型 速度有9token/秒,不知道把P106拔下来后有多少
举报
吊打华伪 发表于 2025-4-12 15:04 你跑的时最小的吧,几GB的那种。 单凡你跑个10GB的, 就不可能有这个速度。 理论最好的情况10-6=4GB要传 ...
杜甫 发表于 2025-4-12 15:30 16B,模型大小8.9G
吊打华伪 发表于 2025-4-12 16:07 你这个是moe的,每次只读取激活的权重,远远小于8.9. 大概率都小于6GB. 其他模型每次都要读取8.9GB. ...
杜甫 发表于 2025-4-12 16:15 不懂。 128G的内存,能跑32B的模型了吧
吊打华伪 发表于 2025-4-12 17:03 能是能,就是超级慢。 你也不用折腾了,就跑i现在这个moe最合适了,换其他的8.9G 最多2token/s. 换更大 ...
杜甫 发表于 2025-4-12 17:11 就是说去掉烂显卡,反而会快很多?
吊打华伪 发表于 2025-4-12 14:35 香菇肥牛,有印象 记得以前看过你博客的一篇教程。 没有独显,纯核显。
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|全球主机交流论坛
GMT+8, 2025-5-6 05:29 , Processed in 0.058931 second(s), 6 queries , Gzip On, MemCache On.
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.