中文 LLaMA 模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 633 天前的主题，其中的信息可能已经有所发展或是发生改变。

在 github 上发现这个项目：

以 ChatGPT 、GPT-4 等为代表的大语言模型（ Large Language Model, LLM ）掀起了新一轮自然语言处理领域的研究浪潮，展现出了类通用人工智能（ AGI ）的能力，受到业界广泛关注。然而，由于大语言模型的训练和部署都极为昂贵，为构建透明且开放的学术研究造成了一定的阻碍。为了促进大模型在中文 NLP 社区的开放研究，本项目开源了中文 LLaMA 模型和经过指令精调的 Alpaca 大模型。这些模型在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练，进一步提升了中文基础语义理解能力。同时，在中文 LLaMA 的基础上，本项目使用了中文指令数据进行指令精调，显著提升了模型对指令的理解和执行能力。

https://github.com/ymcui/Chinese-LLaMA-Alpaca

看着效果好像还不错，有没有试过和 chatgpt3.5 对比效果怎么样。

模型

llama

中文

指令

3 条回复 • 2023-04-07 13:27:59 +08:00