GLM-4V-9B开源多模态大模型官网下载本地部署使用微调教程

公司	智谱AI
发布日期	2024-06-05
分类	多模态模型
类型	开源
参数	9B
上下文	8k
体验网址	点击使用

公司

智谱AI

发布日期

2024-06-05

分类

多模态模型

类型

开源

参数

上下文

体验网址

点击使用

GLM-4V-9B 是智谱 AI 推出的一款开源多模态预训练大语言模型，属于 GLM-4 系列。该模型在语义理解、数学推理、代码生成和知识整合等多个领域表现出色。GLM-4V-9B 支持多轮对话，并具备网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。此外，模型还增加了对26种语言的支持，包括日语、韩语和德语等，进一步拓宽了其应用范围。

模型评测

GLM-4V-9B 在多模态能力方面进行了广泛的评测，包括但不限于视觉理解任务。在各项评测中，GLM-4V-9B 与其他顶级模型相比，展现出了在某些任务上的优越性能。例如，在 SEEDBench_IMG、MMStar、MMMU 等评测中，GLM-4V-9B 的得分均位于前列，显示出其在综合能力和学科综合方面的强大实力。

部署使用

部署步骤

环境准备：确保系统安装了 Python 和 PyTorch，以及必要的依赖库。
安装依赖：根据模型的 GitHub 仓库提供的依赖安装指南进行安装。
下载模型：从 ModelScope 或 GitHub 仓库下载 GLM-4V-9B 模型。
编写代码：使用提供的 Python 代码示例，编写适合自己需求的脚本。
运行模型：执行编写的脚本，进行模型的生成和推理。

常见问题与解答

Q: 如何安装模型的依赖？

A: 请访问模型的 GitHub 仓库，按照提供的依赖安装指南进行操作。

Q: 模型支持的最大上下文长度是多少？

A: GLM-4V-9B 支持的最大上下文长度为 8K，即大约 8000 个字符。

Q: 模型是否支持自定义功能调用？

A: 是的，GLM-4V-9B 支持自定义工具调用，可以执行特定的自定义功能。

GLM-4V-9B

模型评测

部署使用

部署步骤

常见问题与解答

相关资源

Qwen-VL-Chat

Qwen-VL-Max

Qwen-VL

Yi-VL-6B

GPT-4o

Janus-Pro

DeepSeek-R1

Llama3.1-405B

DeepSeek-V2

阿里巴巴

零一万物

Meta

DeepSeek

Stability AI

模型评测

部署使用

部署步骤

常见问题与解答

相关资源

Qwen-VL-Chat

Qwen-VL-Max

Qwen-VL

Yi-VL-6B

GPT-4o

Janus-Pro

DeepSeek-R1

Llama3.1-405B

DeepSeek-V2

阿里巴巴

零一万物

Meta

DeepSeek

Stability AI

请输入验证码

....支付确认中....