模型广场
大约 2 分钟模型分组
模型广场
模型广场展示了 HuiLiu API 当前支持的所有大模型及其价格、折扣信息。
进入方式
- 路径:登录控制台 → 右上角"模型广场"
页面结构
- 左侧:可用令牌分组列表,点击切换显示
- 右侧:当前分组下的模型卡片,包含:
- 模型名称(如
gpt-4o、claude-sonnet-4-20250514) - 模型介绍
- 输入 / 输出价格(按 1M tokens)
- 折扣倍率
- 厂商标识
- 模型名称(如
主要模型概览
OpenAI 系列
| 模型 | 说明 | 适用场景 |
|---|---|---|
gpt-4o | 旗舰多模态模型 | 高质量对话、图像理解 |
gpt-4o-mini | 轻量级、低成本 | 日常对话、批处理 |
o1 / o1-mini | 推理模型 | 复杂推理、数学、代码 |
o3 / o3-mini | 新一代推理模型 | 顶尖推理任务 |
Anthropic Claude 系列
| 模型 | 说明 | 适用场景 |
|---|---|---|
claude-opus-4 | 最强 Claude | 复杂创作、研究 |
claude-sonnet-4-20250514 | 平衡型旗舰 | Claude Code / 通用任务 |
claude-3-5-sonnet-20241022 | 经典高性能 | 通用对话、代码 |
claude-3-5-haiku | 轻量级 | 高频低成本场景 |
Google Gemini 系列
| 模型 | 说明 | 适用场景 |
|---|---|---|
gemini-2.5-pro | 旗舰多模态 | Gemini CLI / 长上下文 |
gemini-2.5-flash | 高速版 | 实时对话 |
国产模型
| 模型 | 说明 |
|---|---|
deepseek-chat / deepseek-reasoner | DeepSeek V3 / R1 |
qwen-max | 通义千问旗舰 |
glm-4 | 智谱清言 |
模型列表会持续更新
具体可用模型以控制台模型广场为准。我们会持续接入新发布的模型,请定期查看最新列表。
折扣说明
每个模型卡片右上角会显示"折扣倍率",含义为:
1.0x:按原价计费0.5x:半价2.0x:双倍
具体折扣以"模型广场 → 折扣说明"为准。
缓存折扣
对于支持 prompt 缓存的模型(如 Claude),命中缓存的部分会有大幅折扣:
- 缓存写入:约 1.25x 原价
- 缓存读取:约 0.1x 原价
合理使用缓存可以显著降低成本,尤其适合长上下文反复对话的场景。
