128K

在

出去

聊天

禁用

GLM-4.5 空气

通过在大幅减少活动参数数量和内存需求的同时提供接近旗舰级的性能，它使组织能够部署高级大型语言模型功能，而无需广泛的计算基础设施。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'zhipu/glm-4.5-air',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="zhipu/glm-4.5-air",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

GLM-4.5 空气

产品详情

✨ Zhipu AI's GLM-4.5-Air 脱颖而出，表现出极高 高效的 和 成本效益高 大型语言模型。它采用先进的混合专家（MoE）设计，拥有1060亿个参数（其中120亿个处于激活状态）。该模型完美适用于各种文本到文本的应用，并展现了GLM-4.5的强大功能。 128,000 个令牌的上下文窗口这项功能使其能够理解和生成超长文本，同时大幅降低计算开销。

技术规格

🚀 性能基准测试

上下文窗口： 128,000 个Tokens
排名 总排名第六 在 12 项行业基准测试中，平均得分达到 59.8 分。
推理能力： 在 MMLU-Pro (81.4%)、AIME24 (89.4%) 和 Math (98.1%) 考试中取得了令人印象深刻的成绩，同时具备扎实的编程能力。

📊 代理应用程序的性能指标

GLM-4.5-Air 专为智能体应用而设计，具有强大的 128,000 个令牌的上下文窗口和集成的函数执行功能。在 τ-bench 和 BFCL-v3 等领先的智能体基准测试中，它取得了几乎与 GLM-4.5-Air 相当的结果。 Claude 4 首十四行诗值得注意的是，在专门的网页浏览测试（BrowseComp）中，GLM-4.5-Air 能够评估复杂的多步骤推理和工具使用能力，并展现出优异的性能。 准确率 26.4%该模型优于 Claude-4-Opus（18.8%），并接近顶级模型 o4-mini-high（28.3%）。这些数据凸显了 GLM-4.5-Air 在真实世界、工具驱动的任务和智能体场景中均衡而强大的性能。

💡 主要功能

高级文本生成： 能够生成流畅、语境准确的输出，适用于长篇内容和复杂的多轮对话。
高效的智能体推理： 在“思考”（解决复杂问题）和“非思考”（即时反应）模式下，均保持强大的编码、推理和工具使用能力。
资源效率： 它所需的 GPU 内存显著减少（可在 16GB GPU 上部署），使其成为现实世界中硬件受限环境的绝佳选择。
在实际开发和代理任务方面极具竞争力，提供快速代码建议和详细的文档分析。

💲 API 定价

输入： 0.21美元
输出： 1.155美元

最佳使用场景

经济高效的对话式人工智能： 非常适合高容量、低延迟的聊天机器人和虚拟助手。
轻量级编码辅助： 提供实时代码补全、调试和高效文档生成功能。
复杂文档分析： 能够大规模分析法律、科学和商业文本。
移动和边缘部署： 在硬件资源有限的环境中表现出色。
代理工具： 为使用工具的代理、网页浏览功能和批量内容转换提供支持。

代码示例

与其他型号的比较

对比 Claude 4 首十四行诗： GLM-4.5-Air 在效率和性能之间取得了不错的平衡，尽管在某些编码和智能推理任务中略逊于 Claude 4 Sonnet。Claude 4 Sonnet 支持更大的上下文窗口（20 万个标记 vs. 12.8 万个标记），并且具备图像输入功能（使其更适合多模态应用），而 GLM-4.5-Air 的独特之处在于…… 开源、更具成本效益，并且在函数调用和多轮推理中提供强大的可靠性。

与 GLM-4.5 相比： GLM-4.5-Air 的性能约为旗舰级 GLM-4.5 的 80-98%，但活动参数数量显著减少（12 字节 vs. 32 字节），资源需求也更低。虽然其原始任务准确率可能略逊一筹，但它仍然保持了强大的推理、编码和智能体能力，使其成为一款优秀的解决方案。 更适合在硬件受限的环境中部署。

对比 Qwen3-Coder： GLM-4.5-Air 在编码和工具使用方面与 Qwen3-Coder 具有很强的竞争力，能够为复杂的编程任务提供快速准确的代码生成。GLM-4.5-Air 展示了 优势成功率和可靠的工具调用机制 超越 Qwen3-Coder。

对比 Gemini 2.5 Pro： GLM-4.5-Air 在实际推理和编码基准测试中与 Gemini 2.5 Pro 相比毫不逊色。虽然 Gemini 在某些特定的编码和推理测试中可能略胜一筹，但 GLM-4.5-Air 也提供了…… 兼顾大上下文窗口和智能体工具，针对高效的实际部署进行了优化。。

局限性

与 GLM-4.5 旗舰型号相比，整体性能和活动参数数量略有降低。
虽然核心文本和代码处理能力依然强劲，但某些复杂任务的性能可能会略有下降。
对于那些将绝对最先进的精度置于所有其他考虑因素之上的组织来说，这并非理想之选。
要充分利用其“全部”上下文和工具支持功能，可能需要新的基础设施才能达到最佳效率。

常见问题解答 (FAQ)

❓智普AI的GLM-4.5-Air的核心优势是什么？

✔️ GLM-4.5-Air 的主要优势在于其卓越的性能 效率和成本效益这是通过具有 120 亿个活跃参数的混合专家 (MoE) 设计实现的，因此非常节省资源。

❓ GLM-4.5-Air 的上下文窗口大小是多少？

✔️ 它具有相当的 128,000 个令牌的上下文窗口从而能够理解和生成非常长且复杂的文本。

❓ GLM-4.5-Air 在哪些领域展现出强大的竞争力？

✔️ 它在以下方面表现出色 代理应用程序、网页浏览（性能优于 Claude-4-Opus）并且在编码、推理和工具使用方面表现出色，尤其是在硬件受限的环境下。

❓ GLM-4.5-Air 的最佳应用场景有哪些？

✔️理想应用场景包括 经济高效的对话式人工智能、轻量级编码辅助、复杂文档分析以及在移动和边缘设备上的部署。

❓ GLM-4.5-Air 的主要局限性是什么？

✔️ 其主要局限性包括与旗舰级 GLM-4.5 相比，整体性能略有下降，因此不太适合对性能要求较高的场景。 绝对最先进的精度高于一切。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用