



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'zhipu/glm-4.5-air',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="zhipu/glm-4.5-air",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalles del producto
✨ GLM-4.5-Air de Zhipu AI destaca como un altamente eficiente y rentable Modelo de lenguaje de gran tamaño. Diseñado con una avanzada arquitectura Mixture-of-Experts (MoE), cuenta con 106 mil millones de parámetros totales (de los cuales 12 mil millones están activos). Perfectamente adaptado a una amplia gama de aplicaciones de conversión de texto a texto, refleja las impresionantes características del GLM-4.5 completo. Ventana de contexto de 128.000 tokensEsta capacidad le permite comprender y generar textos excepcionalmente largos, al tiempo que reduce drásticamente la carga computacional.
Especificación técnica
🚀 Puntos de referencia de rendimiento
- Ventana de contexto: 128.000 tokens
- Clasificado 6.º en la clasificación general En 12 indicadores de referencia de la industria, logró una puntuación media de 59,8.
- Habilidad de razonamiento: Excelentes puntuaciones en MMLU-Pro (81,4%), AIME24 (89,4%) y Matemáticas (98,1%), además de sólidas capacidades de programación.
📊 Métricas de rendimiento para aplicaciones ámbicas
GLM-4.5-Air está diseñado específicamente para aplicaciones agentes, y cuenta con una robusta ventana de contexto de 128.000 tokens y capacidades integradas de ejecución de funciones. En los principales benchmarks agentes, como τ-bench y BFCL-v3, logra resultados casi equivalentes a Soneto 4 de Claude. Cabe destacar que, en pruebas especializadas de navegación web (BrowseComp), que evalúan el razonamiento complejo de varios pasos y el uso de herramientas, GLM-4.5-Air demuestra una tasa de precisión del 26,4%Esto supera a Claude-4-Opus (18,8 %) y se acerca mucho al líder o4-mini-high, que alcanza el 28,3 %. Estas cifras ponen de manifiesto el rendimiento equilibrado y sólido de GLM-4.5-Air en tareas reales, basadas en herramientas y en escenarios con agentes.

💡 Capacidades clave
- Generación avanzada de texto: Produce resultados fluidos y contextualmente precisos, adecuados para contenido extenso y diálogos complejos de múltiples turnos.
- Razonamiento agéntico eficiente: Mantiene sólidas habilidades de codificación, razonamiento y uso de herramientas tanto en el modo de "pensamiento" (resolución de problemas complejos) como en el modo de "no pensamiento" (respuesta instantánea).
- Eficiencia de los recursos: Requiere mucha menos memoria de GPU (se puede implementar en GPU de 16 GB), lo que la convierte en una excelente opción para entornos reales con recursos de hardware limitados.
- Altamente competitivo para el desarrollo práctico y las tareas de agente, ofreciendo sugerencias de código rápidas y análisis detallado de documentos.
💲 Precios de API
- Aporte: $0.21
- Producción: $1.155
Casos de uso óptimos
- Inteligencia artificial conversacional rentable: Ideal para chatbots y asistentes virtuales de alto volumen y baja latencia.
- Asistencia de codificación ligera: Proporciona autocompletado de código en tiempo real, depuración y generación eficiente de documentación.
- Análisis de documentos complejos: Capaz de analizar textos legales, científicos y comerciales a gran escala.
- Implementaciones móviles y en el borde: Destaca en entornos con recursos de hardware limitados.
- Herramientas de agencia: Permite el uso de herramientas por parte de los agentes, capacidades de navegación web y la transformación de contenido por lotes.
Ejemplo de código
Comparación con otros modelos
Vs. Soneto 4 de Claude: GLM-4.5-Air ofrece un equilibrio competitivo entre eficiencia y rendimiento, aunque se queda ligeramente atrás de Claude 4 Sonnet en ciertas tareas de codificación y razonamiento agente. Mientras que Claude 4 Sonnet admite una ventana de contexto más grande (200k tokens frente a 128k) e incluye capacidades de entrada de imágenes (lo que lo hace más adecuado para aplicaciones multimodales), GLM-4.5-Air se distingue por ser de código abierto, más rentable y que proporciona una gran fiabilidad en la llamada a funciones y el razonamiento de múltiples turnos..
Vs. GLM-4.5: GLM-4.5-Air alcanza aproximadamente entre el 80 y el 98 % del rendimiento del GLM-4.5 insignia, pero con parámetros activos significativamente menores (12 mil millones frente a 32 mil millones) y requisitos de recursos reducidos. Si bien puede quedarse un poco atrás en precisión bruta de tareas, mantiene sólidas capacidades de razonamiento, codificación y agentes, lo que lo convierte en más adecuado para su implementación en entornos con recursos de hardware limitados.
Vs. Qwen3-Coder: GLM-4.5-Air compite eficazmente con Qwen3-Coder en codificación y uso de herramientas, proporcionando una generación de código rápida y precisa para tareas de programación complejas. GLM-4.5-Air demuestra Tasas de éxito dominantes y mecanismos de llamada de herramientas fiables sobre Qwen3-Coder.
Vs. Gemini 2.5 Pro: GLM-4.5-Air se mantiene a la par en las pruebas de razonamiento práctico y codificación frente a Gemini 2.5 Pro. Si bien Gemini puede sobresalir ligeramente en algunas pruebas específicas de codificación y razonamiento, GLM-4.5-Air ofrece una Equilibrio favorable entre una amplia ventana de contexto y herramientas de agente, optimizado para implementaciones eficientes en el mundo real..
Limitaciones
- Rendimiento general y número de parámetros activos ligeramente inferiores en comparación con el modelo insignia GLM-4.5.
- Algunas tareas complejas pueden mostrar pequeñas disminuciones en el rendimiento, aunque las capacidades básicas de texto y código siguen siendo sólidas.
- No es lo ideal para organizaciones que priorizan la precisión absoluta y de vanguardia por encima de cualquier otra consideración.
- Para aprovechar al máximo su contexto completo y sus capacidades de soporte de herramientas, podría ser necesaria una nueva infraestructura que permita lograr la máxima eficiencia.
Preguntas frecuentes (FAQ)
❓ ¿Cuál es la principal ventaja del GLM-4.5-Air de Zhipu AI?
✔️ La principal ventaja del GLM-4.5-Air radica en su excepcional eficiencia y rentabilidad, logrado mediante un diseño de mezcla de expertos (MoE) con 12 mil millones de parámetros activos, lo que lo hace altamente eficiente en el uso de recursos.
❓ ¿Cuál es el tamaño de la ventana de contexto de GLM-4.5-Air?
✔️ Cuenta con una gran cantidad Ventana de contexto de 128.000 tokens, lo que permite la comprensión y la generación de textos muy largos y complejos.
❓ ¿En qué áreas muestra GLM-4.5-Air un sólido desempeño competitivo?
✔️ Destaca en Aplicaciones basadas en agentes, navegación web (con un rendimiento superior al de Claude-4-Opus).y ofrece un rendimiento sólido en codificación, razonamiento y uso de herramientas, especialmente en entornos con recursos de hardware limitados.
❓ ¿Cuáles son los casos de uso óptimos para GLM-4.5-Air?
✔️ Los casos de uso ideales incluyen: IA conversacional rentable, asistencia de codificación ligera, análisis de documentos complejos e implementaciones en dispositivos móviles y periféricos..
❓ ¿Cuáles son las principales limitaciones del GLM-4.5-Air?
✔️ Sus principales limitaciones incluyen un rendimiento general ligeramente reducido en comparación con el modelo insignia GLM-4.5, lo que lo hace menos adecuado para escenarios exigentes. Precisión absoluta de última generación por encima de todo lo demás..
Campo de juegos de IA



Acceso