



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'x-ai/grok-4-07-09',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="x-ai/grok-4-07-09",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

产品详情
✨ Grok 4:面向高级推理和自动化的下一代人工智能
Grok 4 代表了 xAI 在大型语言模型领域的最新突破,专为复杂的高级推理、高级智能行为和无缝的现实世界任务自动化而设计。Grok 4 基于 Grok 3 的强大架构,显著增强了其推理能力。 计算能力提升10倍 专注于训练。一项关键的新功能是将工具使用直接集成到其基于人类反馈的强化学习(RLHF)流程中,为人工智能交互树立了新的标准。
🚀 技术规格
性能基准
- 上下文窗口: 256,000 个Tokens
- 最大输出: 约4,096个Tokens
- 训练方案: 强化学习计算能力是 Grok 3 的 10 倍
- 工具用途: 原生支持,并提供强大的多步骤支持
绩效指标
- ARC-AGI-2上的SOTA: 15.9%
- AIME 2025: 准确率 76.9%
- 人类的最后考试(HLE):
- 使用工具: 总体占比 44.4%。50.7% 为纯文本部分
- 无需工具: 25.4% (与 Gemini 2.5 Pro 的 21.6% 相比)

Grok 4 关键性能指标的可视化表示。
主要能力
- ✓ 跨长上下文的多步骤推理
- ✓ 在真实/合成环境中使用原生工具
- ✓ 确定性输出(非流式)
- ✓ API执行规划
- ✓ 在AGI风格基准测试中表现出色
API定价 (每100万Tokens)
输入:
- 0–128k 个Tokens: 3.15美元
- 12.8万+Tokens: 6.30美元
- 缓存: 0.75美元
输出:
- 0–128k 个Tokens: 15.75美元
- 12.8万+Tokens: 31.50美元
💡 Grok 4 的最佳使用场景
Grok 4 的先进功能使其成为各种高要求应用的理想选择:
- 🤖 自主代理: 为执行工具和进行复杂规划的复杂系统提供动力。
- 🔍 高级质量保证系统: 利用其 256K 上下文窗口,实现多文档推理和精确答案生成。
- 📈 研究与评估: 处理需要较强逻辑推理和数据综合能力的长期任务。
- 📊战略分析: 能够处理和构建复杂的输入数据,从而促进业务和研究规划。
- 💻 代码代理: 在各种工具链和开发环境下驱动多步骤推理过程。
🔗 代码示例
可以通过标准 API 调用启动与 Grok 4 的集成。以下是一个 API 交互的概念示例,展示了典型的聊天完成流程的结构。
// 使用假设的 xAI Grok 4 客户端库的示例 import xai_client client = xai_client.XAIClient(api_key="YOUR_API_KEY") response = client.chat.completions.create( model="x-ai/grok-4-07-09", messages=[ {"role": "system", "content": "您是一位乐于助人的 AI 助手。"}, {"role": "user", "content": "用简单易懂的方式解释量子纠缠的概念。"} ], max_tokens=200, temperature=0.7 ) print(response.choices[0].message.content) (此代码片段仅供参考;实际实现可能因 API 文档而异。)
🆚 Grok 4:与其他领先型号的比较
-
与 GPT-4o 相比: 虽然 GPT-4o 在多模态和网页浏览方面表现出色,但 Grok 4 在 AGI 类型的任务中展现出更优异的推理性能和工具集成能力。
-
对战Claude 4 Opus: Claude 4 以其语言安全性和对齐能力而闻名。然而,Grok 4 在 ARC-AGI-2 上的表现明显优于它(15.9% 对 8.6%)以及人类的最后考试,尤其是在工具辅助的场景中。
-
与 Gemini 2.5 Pro 相比: Gemini 2.5 Pro 以其速度和指令执行能力而闻名。相反,Grok 4 在零样本推理和规划方面超越了它,达到了 25.4% 对 21.6% 无需工具即可在 HLE 上进行操作。
-
vs. Grok 3: Grok 4 相较于 Grok 3 有了显著的提升。它受益于: 强化学习计算能力提升 10 倍 并原生集成了工具使用说明,从而实现 25.4% 在人类最后的考试中,无需借助任何工具(与 Grok 3 的 ~14.7% 相比),即可获得增强的多步骤推理和事实记忆。
⚠️ Grok 4 的局限性
- 纯文本: 目前,Grok 4 不支持视觉或音频输入。
- 工具使用顺序: 工具的使用不是组合式的,这意味着操作是按顺序执行的,而不是并行执行或采用复杂的嵌套模式。
- 闭合重量模型: 模型权重不公开。
- 流式确定性: 使用流式输出时,种子确定性可能不可靠。
- 无公开本地/离线推断: 公开推理功能不适用于本地或离线部署。
🔗 API 集成
Grok 4 可通过 AI/ML API 轻松访问。要开始使用并将 Grok 4 集成到您的应用程序中,您可以…… 在此注册。
❓ 常见问题解答 (FAQ)
Q1:Grok 4 相对于 Grok 3 的主要改进是什么?
A1:Grok 4 在训练期间提供 10 倍的 RL 计算能力,并将工具的使用直接原生集成到其 RLHF 管道中,从而显著增强了推理和多步骤能力。
Q2:与 GPT-4o 或 Claude 4 Opus 等模型相比,Grok 4 的主要优势是什么?
A2:Grok 4 在高级推理性能方面表现出色,尤其是在 AGI 类型的任务中,并且拥有强大的工具集成能力。它在 ARC-AGI-2 和 Humanity's Last Exam 等基准测试中展现出卓越的性能,尤其是在启用工具的配置下。
Q3:Grok 4 是否支持视觉或音频等多模态输入?
A3:截至目前的 Grok 4 版本,它是一款纯文本模型,不支持视觉或音频输入。
Q4:Grok 4 的最大上下文窗口是多少?
A4:Grok 4 具有 256,000 个标记的广泛上下文窗口,使其能够处理和理解非常长的输入。



登录