Swift DOCUMENTATION — swift 3.6.0.dev0 文档 (original) (raw)

Swift DOCUMENTATION
查看页面源码

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
人类对齐
- 数据集
- GRPO
- DPO
- RM
- PPO
- KTO
- CPO
- ORPO
- SimPO
推理和部署
- 推理
- 部署
Megatron-SWIFT训练
采样
评测
导出与推送
强化微调
GRPO
Agent支持
支持的模型和数据集
- 模型
- 数据集
使用Tuners
- 接口列表
常见问题整理
- 训练
- 推理
- 部署
- 评测

Customization

自定义模型
- 模型注册
自定义数据集
插件化

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
- 奖励函数
- 训练脚本
Embedding训练
- loss
- 数据集格式
- 脚手架
- 推理
快速训练VL模型
NPU支持
- 环境准备
- 微调
- 推理
- 部署
更多最佳实践

Indices and tables

索引
模块索引
搜索页面