2026 年最便宜的 AI API 是哪个？

顶级质量看 DeepSeek R1，约 $0.55 输入 / $2.19 输出每百万 token。极致便宜的分类、抽取场景看 Gemini 2.5 Flash 和 GPT-5 mini，输入价不到 $0.20。Qwen3 Max 在亚洲部署也很有竞争力。

GPT-5 每百万 token 多少钱？

2026 年 GPT-5 标准价约 $2.50 输入 / $10 输出每百万 token。GPT-5 mini 约 $0.15 / $0.60。缓存输入 5 折，批量 API 再 5 折但是异步。

Claude Sonnet 4.6 约 $3 输入 / $15 输出，比 DeepSeek R1 贵 5 倍，比 GPT-5 贵约 50%。Claude Haiku 4.5 便宜很多，约 $0.80 / $4，简单任务质量已经达到 Sonnet 90%。

用 prompt caching（重复上下文省 50-90%）、batch API（半价但异步）、用能跑过评测的最小模型、按任务路由 — 分类用便宜模型，推理才上贵的。

抽取、分类、总结、翻译够用，常常感受不到与前沿模型的差距。多步推理、code agent、复杂决策通常不够 — 模型循环试错总成本反而更高。

AI 模型选型指南 · 2026 年 5 月更新

顶级质量看 DeepSeek R1，约 $0.55 输入 / $2.19 输出 每百万 token。极致便宜的分类、抽取场景看 Gemini 2.5 Flash 和 GPT-5 mini，输入价不到 $0.20。Qwen3 Max 在亚洲部署也很有竞争力。

2026 年 GPT-5 标准价约 $2.50 输入 / $10 输出 每百万 token。GPT-5 mini 约 $0.15 / $0.60。缓存输入 5 折，批量 API 再 5 折但是异步。

如果你在做 AI 产品，API 账单往往是最大的可变成本。前沿模型价格自 2024 年以来已经掉了 5-10 倍，能跑过你评测的最便宜模型几乎永远是正确选择。这篇按 2026 年实际价格排名，并标注每款的质量边界。

以上是不带缓存、不带 batch 的标价。实际花销做好优化后能再降 30-70%。

Prompt caching（Anthropic、OpenAI、DeepSeek 都支持）：缓存前缀只收正常输入价的 10-50%。聊天产品复用 system prompt 或文档时，输入 token 能省 50-90%。最大单一杠杆。
Batch API（OpenAI、Anthropic）：24 小时内异步完成的任务半价。回填、批量打分、内容生成最适合。
输出 token 节制。输出价是输入价的 4-5 倍。让模型返回结构化 JSON 而不是散文，输出能砍 70%。max_tokens 是你的好朋友。

便宜模型在以下场景容易翻车：长 agent 循环（5+ 工具调用）、细致推理、模糊指令、跨文件代码重构、需要语气把控的内容。一个"便宜"模型循环 5 次的总成本经常超过 Claude 一次完成的开销。永远算每个完成任务的成本，不是每个 token 的成本。

便宜模型最擅长：分类、情感分析、抽取（NER、结构化输出）、翻译、定长总结，以及任何能用字符串匹配判定对错的任务。

OpenRouter 用一个 OpenAI 兼容接口路由到 DeepSeek、Gemini Flash、GPT-5 mini、Claude Haiku 等。A/B 测试不同模型时不用注册 6 次。

OpenRouter 目前没有公开的推广返佣计划，此为普通推荐链接。

2026 年最便宜的 API？输入大用 Gemini 2.5 Flash，要推理质量用 DeepSeek R1。

DeepSeek 真比 GPT-5 便宜？是。输入和输出都便宜约 5 倍，多数编程和推理任务质量相当。

该用 Claude Haiku 吗？如果 Sonnet 能跑通的任务，Haiku 通常也能，价格只要 1/4。务必先测。

哪里看实时价格？Check.AI 每周追踪，厂商页面是权威来源。