大模型竞技场排行榜
LMSYS Chatbot Arena Leaderboard大模型竞技场是一个公开的AI大模型评测平台,基于大量普通用户的真实体验来评估和对比大型语言模型的性能。通过收集大量用户直接对比不同模型的回答,生成一个基于Elo等级分系统的大模型排名排行榜。
LMSYS Chatbot Arena Leaderboard大模型竞技场是一个公开的AI大模型评测平台,基于大量普通用户的真实体验来评估和对比大型语言模型的性能。通过收集大量用户直接对比不同模型的回答,生成一个基于Elo等级分系统的大模型排名排行榜。
模型 | 公司 | 发布日期 | 参数量 | 上下文 | 类型 | API收费价格 |
GPT-4o |
2024-05-14 | 1000B | 128K | 闭源 | 输入:5美元/百万tokens,输出:15美元/百万tokens | |
GPT-4o mini |
2024-07-18 | N/A | 128K | 闭源 | 输入:0.15美元/百万tokens,输出:0.6美元/百万tokens | |
Claude 3.5 Sonnet |
2024-06-21 | N/A | 200k | 闭源 | 输入:3美元/百万tokens,输出:15美元/百万tokens | |
Llama3.1-405B |
2024-07-23 | 405B | 128K | 开源 | N/A | |
Gemini 1.5 Pro |
2024-03-15 | N/A | 100万 | 闭源 | 输入:0.35美元/百万tokens,输出:0.7美元/百万tokens | |
GPT-4 Turbo |
2023-11-08 | 1000B | 128K | 闭源 | 输入:10美元/百万tokens,输出:30美元/百万tokens | |
GPT-4 |
2023-03-14 | 1000B | 32k | 闭源 | 输入:30美元/百万tokens,输出:60美元/百万tokens | |
Claude 3 Opus |
2024-03-04 | N/A | 200K | 闭源 | 输入:15美元/百万tokens,输出:75美元/百万tokens | |
Llama3.1-70B |
2024-07-23 | 70B | 128K | 开源 | N/A | |
Yi-Large |
2024-05-13 | 100B | 32k | 闭源 | 20元/100万token |
扫码打开当前页
之前