模型资料 · 数据同步于 2025-09-09
GLM 5.1 FP8
GLM 5.1 FP8 是 智谱 的模型,主打工具调用、推理、开放权重。它的上下文窗口为 203K,价格在同类中偏贵(比约 29% 的同类便宜)。适合复杂推理、写代码和需要思考链的任务。
速览
- 最低输入价:$0.85/1M token(NEAR AI Cloud),比约 29% 的同类便宜
- 最低输出价:$3.3/1M token
- 输出/输入比:3.9×(输出贵几倍)
- 上下文窗口:203K token,比约 58% 的同类更长
- 发布日期:2026-03-27
- 能力:工具调用、推理、开放权重
- 可用平台数:2
各平台价格
同一个模型,不同平台价格不同。最便宜的排在前面。
| 平台 | 输入/1M | 输出/1M | 上下文 | 上架 |
|---|---|---|---|---|
| NEAR AI Cloud | $0.85 | $3.3 | 203K | 2026-03-27 |
| Neuralwatt | $1.1 | $3.6 | 203K | 2026-04-07 |
价格每日同步自 models.dev + 各家官方文档。
同类对比
和价位/厂商相近的模型放一起看。
| 模型 | 厂商 | 输入/1M | 输出/1M | 上下文 |
|---|---|---|---|---|
| FLUX.2 Klein 4B | NEAR AI Cloud | $1 | $1 | 128K |
| Qwen 3.6 35B A3B FP8 | NEAR AI Cloud | $0.17 | $1.1 | 262K |
| Qwen3 Embedding 0.6B | NEAR AI Cloud | $0.01 | 未公开 | 41K |
| Qwen3 Reranker 0.6B | NEAR AI Cloud | $0.01 | $0.01 | 41K |
该不该选它
GLM 5.1 FP8 是 智谱 的模型,主打工具调用、推理、开放权重。它的上下文窗口为 203K,价格在同类中偏贵(比约 29% 的同类便宜)。适合复杂推理、写代码和需要思考链的任务。
- 先并排对比:在对比工具里和 1-2 个候选放一起,规模化时价格差比跑分更重要。
- 挑满足延迟/SLA 的最便宜平台:同样的权重,不同平台价差很大。
- 每 3 个月重估一次:前沿价格降得快,今天最便宜的下个季度未必。
相关模型
常见问题
GLM 5.1 FP8 多少钱?最低 $0.85 输入 / $3.3 输出(每 1M token,最便宜平台)。其他平台见上表。
上下文窗口多大?203K token。
哪些平台提供?Neuralwatt、NEAR AI Cloud。
数据来源?models.dev + 各家官方文档,每日同步。关于数据。