全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 705|回复: 10

ollama本地部署的deepseek都是假的 真的没有开源 谁都得不到R1

[复制链接]
发表于 前天 17:58 | 显示全部楼层 |阅读模式
deepseek网页版R1是基于自己的deepseek v3来的, 这个是一个完全新的,和qwen  llama是并列的一个模型。
----至少它们自己是这么说的,反正别人也不知道。因为他的数据集是没有开源的!
模型权重和训练框架部分开源,但完整数据集未公开,
简单说:没有任何人可以克隆一个deepseek网页版R1 !!!


比如 ollama run deepseek-r1:7b   
实际下载的是Updated 8 days ago

0a8c26691023 · 4.7GB

model
arch
qwen2
·
parameters
7.62B
·
quantization
Q4_K_M
4.7GB
params
{ "stop": [ "<|begin▁of▁sentence|>", "<|end▁of▁sentence|>",
148B
template
{{- if .System }}{{ .System }}{{ end }} {{- range $i, $_ := .Messages }} {{- $last := eq (len (slice
387B
license
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB

也就是qwen2的模型蒸馏来的。 但经过80万R1数据改进的qwen和llama




而deepseek网页版R1的答案都来自于deepseek v3,和qwen  llama是并列的一个模型。
发表于 前天 18:34 | 显示全部楼层
你是来搞笑的 完整版671B 你家用拿什么跑?
小模型是蒸馏来的,还有量化版的肯定不一样啊 多学习一点吧
发表于 前天 20:00 | 显示全部楼层
本帖最后由 opentt 于 2025-1-29 20:02 编辑

当用户遇到一个新AI的时
Lv5:检验法律/医疗/金融等垂直领域专业合规性与决策精准度
Lv4:数学推理、超长文本一致性及可解释性追溯
Lv3:验证技术、伦理机制及对抗性攻击能力
Lv2:侧重多轮逻辑衔接、文化适配与矛盾指令
Lv1:测试基础问答、生活场景响应
Lv0:假的,偷api
lv -1:天安门89 64
发表于 前天 19:07 | 显示全部楼层
真的假的对你来说有意义吗?  你天天这个不行那边做假,累不累,初一了该休息就休息。
发表于 前天 18:01 | 显示全部楼层
没明白,本地部署的是不是要喂数据库?
发表于 前天 18:01 | 显示全部楼层
你下671B的模型看看呢
发表于 前天 18:09 | 显示全部楼层
太高端,听不懂
发表于 前天 18:54 | 显示全部楼层
我记得有个几百G大小的,你试试
发表于 前天 19:34 | 显示全部楼层
内存是小事
显卡是大头啊  
目前19G哪个版本都得24G显存了。
、600多G哪个得几张显卡跑了。
发表于 昨天 22:07 | 显示全部楼层
ollama run deepseek-r1:671b
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-1-31 00:18 , Processed in 0.066767 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表