Release 中文羊驼大模型三期 v2.0 · ymcui/Chinese-LLaMA-Alpaca-3 (original) (raw)

本次发布Llama-3-Chinese-8B-Instruct-v2（指令模型），直接采用500万条指令数据在Meta-Llama-3-8B-Instruct 上进行精调。

v1版（PT+SFT，基于非Instruct版训练）和v2版（SFT，基于Instruct版训练）各有特点，可根据下游任务效果、实际主观体验等方面选择。

模型名称	完整版	LoRA版	GGUF版
Llama-3-Chinese-8B-Instruct-v2(指令模型)	[🤗Hugging Face] [🤖ModelScope][wisemodel]	[🤗Hugging Face] [🤖ModelScope][wisemodel]	[🤗Hugging Face] [🤖ModelScope]

由于Llama-3-Chinese-8B-Instruct-v2使用的初始化模型为Meta-Llama-3-8B-Instruct（其效果比非Instruct版高），相关下游任务指标相比v1均有显著提升，部分指标上超过原版。以下是部分结果：

稍后Llama-3-Chinese-8B-Instruct-v2将登陆大模型竞技场，届时将与其他模型PK效果。

注：初期票数较少，排名结果不稳定。