全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 298|回复: 3

hostloc首发?在自己机器上跑起来了英伟达Nemotron-Ultra-253B模型

[复制链接]
发表于 2025-4-13 12:29:24 | 显示全部楼层 |阅读模式
众生平等,这个体积,除了英伟达专业显卡,其他所有卡包括4090都是废品,大家都要用cpu算

非moe,用不了清华大学的推理构架。


众生平等之下MJJ掌握优势:一般人没有4通道的内存, MJJ人手一个E5 ovh


实测,E5 ovh不到0.3个token/s, 我去问个问题,吃完饭,回来再看!



官网:https://build.nvidia.com/nvidia/llama-3_1-nemotron-ultra-253b-v1   卡成狗了

loc首发介绍:https://hostloc.wiki/thread-1402426-1-1.html   但是openrouter就没必要了,貌似时非推理的。




英伟达整个模型比较强,可以时推理的模型,也可以关闭推理。

发表于 2025-4-13 12:34:42 | 显示全部楼层
免费的一大堆 干什么要这样折磨自己呢
发表于 2025-4-13 12:37:54 | 显示全部楼层
钱多,,,,,,我们用不起
发表于 2025-4-13 13:49:39 | 显示全部楼层
我是老王 发表于 2025-4-13 12:34
免费的一大堆 干什么要这样折磨自己呢

这样可以显得自己相当的牛逼。就好像AI程序是他设计出来的一样
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-5-7 13:35 , Processed in 0.071706 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表