全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 901|回复: 9

llama 3 的体验感觉不好

[复制链接]
发表于 2024-5-5 11:45:56 | 显示全部楼层 |阅读模式
我体验了最近很火的llama 3的8b和70b的模型, 感觉并没有想象的好. 我感觉最好的还是c4ai-command-r-plus, 对指令的理解和完成的正确率都很好. llama 3对指令的理解还是不行.

大家认为呢?
 楼主| 发表于 2024-5-5 13:00:33 | 显示全部楼层
hhxx 发表于 2024-5-5 12:46
R+的模型确实很不错,刚才去试了试!这两天好像还有个什么phi3,但是我还没来得及尝试 ...

phi3只有3.8b的参数, 只能作为简单的辅助, 不可能做太复杂的任务.
发表于 2024-5-5 11:46:48 | 显示全部楼层
一个chatgpt我都玩不明白,这么多的吗?
发表于 2024-5-5 11:48:18 | 显示全部楼层
我还是玩 Claude3 吧
 楼主| 发表于 2024-5-5 11:48:58 | 显示全部楼层
Telegramr 发表于 2024-5-5 11:46
一个chatgpt我都玩不明白,这么多的吗?

chatgpt感觉越来越笨了. 很多问题也不愿意回答. 即使是gpt4也是这样. 还是自建的好. 有问必答, 也不用每月付钱了.
发表于 2024-5-5 11:54:20 来自手机 | 显示全部楼层
个人感觉llama指令服从还说得过去,但是让他输出中文的时候会有大量的中英混合问题而且貌似通过prompt很难调整,估计得通过中文微调解决了...不过8b模型用来跑翻译效果不错,又轻又快
 楼主| 发表于 2024-5-5 11:59:58 | 显示全部楼层
hhxx 发表于 2024-5-5 11:54
个人感觉llama指令服从还说得过去,但是让他输出中文的时候会有大量的中英混合问题而且貌似通过prompt很难 ...

我感觉简单的指令还行, 但是稍微复杂一点的, 它就不行了, 会漏掉一些给的要求. 对于英文指令也是这样. 过几个月看看finetuning后的模型. 现阶段还是c4ai的好.
发表于 2024-5-5 12:09:00 | 显示全部楼层
你试试千问110b,感觉很好就是太大了,本地基本不可能部署  https://huggingface.co/spaces/Qwen/Qwen1.5-110B-Chat-demo
发表于 2024-5-5 12:46:17 | 显示全部楼层
julie 发表于 2024-5-5 11:59
我感觉简单的指令还行, 但是稍微复杂一点的, 它就不行了, 会漏掉一些给的要求. 对于英文指令也是这样. 过 ...

R+的模型确实很不错,刚才去试了试!这两天好像还有个什么phi3,但是我还没来得及尝试
 楼主| 发表于 2024-5-5 12:58:38 | 显示全部楼层
梦想成真 发表于 2024-5-5 12:09
你试试千问110b,感觉很好就是太大了,本地基本不可能部署  https://huggingface.co/spaces/Qwen/Qwen1.5-11 ...

感觉好像还是差一点. 用英文问时, 有时会跳出中文字.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-1-30 11:21 , Processed in 0.070835 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表