阿里通义千问Qwen1.5-32B-Chat大模型官网下载部署使用教程评测

公司	阿里巴巴
发布日期	2024-04-30
分类	大语言模型
类型	开源
参数	32B
上下文	32k
收费价格	输入：0.0035元/千tokens，输出：0.007元/千tokens

Qwen1.5-32B-Chat 是 Qwen2 的测试版本，是一个基于 Transformer 架构的解码器语言模型，专为对话生成而优化。它在多语言支持、上下文长度稳定性和人类偏好方面进行了显著改进。该模型提供了8种不同尺寸的版本，包括一个32B的密集模型，支持高达32K的上下文长度，无需远程代码信任。

模型评测

Qwen1.5-32B-Chat 在多个语言模型评测指标上表现出色，特别是在对话生成和多语言理解方面。它通过监督微调和直接偏好优化进行了后训练，以提高性能。尽管具体的评测数据未在文档中提供，但模型的改进点和特性表明它在语言生成任务上具有较高的潜力。

部署使用

部署步骤

安装依赖：确保安装了 Python 环境，并安装 transformers>=4.37.0。

加载模型和分词器：

from modelscope import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("qwen/Qwen1.5-32B-Chat")
tokenizer = AutoTokenizer.from_pretrained("qwen/Qwen1.5-32B-Chat")

准备输入：定义提示和系统消息，使用分词器的 apply_chat_template 方法。
生成文本：使用模型的 generate 方法生成文本。
解码输出：使用分词器的 batch_decode 方法解码生成的 ID。

示例代码

# 省略了部分代码，具体请参考上文提供的快速开始部分。

常见问题

Q: 如何解决 `KeyError: 'qwen2'` 错误？

A: 确保安装了正确版本的 transformers 库，使用 pip install transformers>=4.37.0 进行安装。

Q: 如何调整生成文本的长度？

A: 通过设置 generate 方法的 max_new_tokens 参数来调整。

Q: 如何处理多语言输入？

A: Qwen1.5-32B-Chat 支持多语言，只需确保输入文本是模型支持的语言之一。

{{userData.name}}已认证

Qwen1.5-32B-Chat

模型评测

部署使用

部署步骤

示例代码