马斯克旗下 xAI 公司今天推出全新 AI 模型 Grok 4 Fast,该模型拥有 2 百万上下文窗口,在企业与消费级任务中实现接近 Grok 4 的推理表现,同时平均减少 40% 推理 tokens。
在性能测试中,Grok 4 Fast 的推理基准表现与 Grok 4 相当,但平均使用的推理 tokens 减少了 40%,价格降低 98%。
架构方面,Grok 4 Fast 首次将长链推理模式与快速响应模式统一到同一模型中,并通过系统提示动态切换。这不仅减少了延迟,也进一步降低了 Token 成本,适用于实时搜索、代码执行等多种场景。开发者可通过 xAI API 调整推理深度以匹配不同需求。
Grok 4 Fast 目前已对所有用户(包括免费用户)开放,并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供。
在 API 调用价格方面,每 100 万 tokens 输入费用为 0.2 美元,每 100 万 tokens 输出费用为 0.5 美元。
via 匿名