Release 中文羊驼大模型三期 v2.0 · ymcui/Chinese-LLaMA-Alpaca-3 (original) (raw)

本次发布Llama-3-Chinese-8B-Instruct-v2(指令模型),直接采用500万条指令数据在Meta-Llama-3-8B-Instruct 上进行精调。

v1版(PT+SFT,基于非Instruct版训练)和v2版(SFT,基于Instruct版训练)各有特点,可根据下游任务效果、实际主观体验等方面选择。

下载方式

模型名称 完整版 LoRA版 GGUF版
Llama-3-Chinese-8B-Instruct-v2(指令模型) [🤗Hugging Face] [🤖ModelScope][wisemodel] [🤗Hugging Face] [🤖ModelScope][wisemodel] [🤗Hugging Face] [🤖ModelScope]

客观任务效果

由于Llama-3-Chinese-8B-Instruct-v2使用的初始化模型为Meta-Llama-3-8B-Instruct(其效果比非Instruct版高),相关下游任务指标相比v1均有显著提升,部分指标上超过原版。以下是部分结果:

Llama-3-Chinese-8B-Instruct Llama-3-Chinese-8B-Instruct-v2
C-Eval Valid 49.3 / 51.5 51.6 / 51.6
C-Eval Test 48.3 / 49.4 49.7 / 49.8
CMMLU Test 49.7 / 51.5 51.8 / 52.4
MMLU Valid 60.1 / 61.3 62.1 / 63.9
MMLU Test 59.8 / 61.8 62.6 / 63.7
LongBench Average 29.6 46.4

详细结果请参看:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3?tab=readme-ov-file#模型效果

主观体验效果

稍后Llama-3-Chinese-8B-Instruct-v2将登陆大模型竞技场,届时将与其他模型PK效果。

注:初期票数较少,排名结果不稳定。