Yi-34B大模型官网下载本地部署使用微调教程

公司	零一万物
发布日期	2024-06-26
分类	大语言模型
类型	开源
参数	34B

Yi-34B 是由 01.AI 零一万物开发的新一代开源双语大型语言模型（LLM）。该模型在 3T 多语言语料库上训练而成，表现出在语言理解、常识推理、阅读理解等方面的卓越能力。Yi-34B 采用 Transformer 结构，这一架构自 2018 年以来已成为大型语言模型标准。该模型不仅在各项基准测试中表现优异，还针对中英文语境进行了优化。

模型评测

Yi-34B 在多项基准测试中展现了其强大的性能，包括 MMLU、CMMLU 等，尤其在双语（中英文）环境中表现突出。例如，在 AlpacaEval 排行榜上，Yi-34B 位居 GPT-4 Turbo 之后名列第二。此外，Yi-34B 在 Hugging Face Open LLM 排行榜上也取得了领先位置。

部署使用

详细步骤

环境准备：确保 Python 3.10 或更高版本已安装。
获取模型：通过 Hugging Face、ModelScope 或 WiseModel 下载 Yi-34B 模型。
本地部署：
- 使用 pip 进行安装：首先克隆 Yi GitHub 仓库，然后安装依赖。
- 使用 Docker：运行 Docker 镜像，并挂载模型路径。
- 使用 llama.cpp：对于计算资源受限的情况，如 MacBook Pro，使用该工具。
执行推理：根据模型类型（聊天或基础模型），编写并执行 Python 脚本来调用模型并生成输出。

常见问题

Q: 如何在有限的计算资源上部署 Yi-34B?
- A: 对于资源受限的情况，可以选择使用 llama.cpp 工具，或者使用 Yi 提供的量化模型，如 4-bit 或 8-bit 版本。
Q: 如何进行模型的微调？
- A: 微调模型需要准备特定的数据集，并使用相应的脚本来运行微调过程。可以参考 Yi 官方文档中的微调指南。