



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'zhipu/glm-4.5-air',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="zhipu/glm-4.5-air",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalle del producto
✨ GLM-4.5-Air de Zhipu AI destaca como un gran eficiente y rentable Modelo de lenguaje extenso. Diseñado con un diseño avanzado de Mezcla de Expertos (MoE), cuenta con 106 mil millones de parámetros totales (con 12 mil millones activos). Perfectamente adecuado para una amplia gama de aplicaciones de texto a texto, refleja la impresionante capacidad del GLM-4.5. Ventana de contexto de 128.000 tokensEsta capacidad le permite comprender y generar textos excepcionalmente largos, al tiempo que reduce drásticamente la sobrecarga computacional.
Especificación técnica
🚀 Puntos de referencia de rendimiento
- Ventana de contexto: 128.000 tokens
- Clasificado 6º en la general en 12 puntos de referencia de la industria, logrando una puntuación promedio de 59,8.
- Destreza de razonamiento: Puntuaciones impresionantes en MMLU-Pro (81,4%), AIME24 (89,4%) y Matemáticas (98,1%), junto con sólidas capacidades de codificación.
📊 Métricas de rendimiento para aplicaciones Agentic
GLM-4.5-Air está diseñado específicamente para aplicaciones de agencia, con su robusta ventana de contexto de 128 000 tokens y capacidades integradas de ejecución de funciones. En las principales pruebas de referencia de agencia, como τ-bench y BFCL-v3, obtiene resultados prácticamente equivalentes a... Soneto Claude 4En particular, en pruebas especializadas de navegación web (BrowseComp), que evalúan el razonamiento complejo de varios pasos y el uso de herramientas, GLM-4.5-Air demuestra un tasa de precisión del 26,4%Esto supera a Claude-4-Opus (18,8 %) y se acerca al o4-mini-high de gama alta con un 28,3 %. Estas cifras destacan el sólido y equilibrado rendimiento de GLM-4.5-Air en tareas reales basadas en herramientas y escenarios de agentes.

💡 Capacidades clave
- Generación de texto avanzada: Produce resultados fluidos y contextualmente precisos, adecuados para contenido extenso y diálogos complejos de varios turnos.
- Razonamiento agente eficiente: Mantiene sólidas capacidades de codificación, razonamiento y uso de herramientas tanto en modo "pensamiento" (resolución de problemas complejos) como "no pensamiento" (respuesta instantánea).
- Eficiencia de recursos: Requiere significativamente menos memoria de GPU (implementable en GPU de 16 GB), lo que lo convierte en una excelente opción para entornos reales con limitaciones de hardware.
- Altamente competitivo para tareas de desarrollo práctico y de agente, ofreciendo sugerencias de código rápidas y análisis detallado de documentos.
💲 Precios de la API
- Aporte: $0.21
- Producción: $1.155
Casos de uso óptimos
- IA conversacional rentable: Ideal para chatbots y asistentes virtuales de gran volumen y baja latencia.
- Asistencia de codificación ligera: Proporciona finalización de código en tiempo real, depuración y generación eficiente de documentación.
- Análisis de documentos complejos: Capaz de analizar textos legales, científicos y comerciales a gran escala.
- Implementaciones móviles y de borde: Sobresale en entornos con recursos de hardware limitados.
- Herramientas de Agentic: Permite utilizar agentes de herramientas, capacidades de navegación web y transformación de contenido por lotes.
Ejemplo de código
Comparación con otros modelos
Contra. Soneto Claude 4: GLM-4.5-Air ofrece un equilibrio competitivo entre eficiencia y rendimiento, aunque se queda ligeramente por detrás de Claude 4 Sonnet en ciertas tareas de codificación y razonamiento agente. Si bien Claude 4 Sonnet admite una ventana de contexto más amplia (200 000 tokens frente a 128 000) e incluye capacidades de entrada de imágenes (lo que lo hace más adecuado para aplicaciones multimodales), GLM-4.5-Air se distingue por ser... de código abierto, más rentable y que ofrece una gran confiabilidad en las llamadas de funciones y el razonamiento de múltiples turnos.
Frente a GLM-4.5: GLM-4.5-Air alcanza aproximadamente el 80-98 % del rendimiento del GLM-4.5 insignia, pero con una cantidad significativamente menor de parámetros activos (12 000 millones frente a 32 000 millones) y una menor necesidad de recursos. Si bien puede ser ligeramente inferior en precisión de tareas brutas, mantiene sólidas capacidades de razonamiento, codificación y agencia, lo que lo convierte en... Más adecuado para la implementación en entornos con limitaciones de hardware.
Contra. Codificador Qwen3: GLM-4.5-Air compite eficazmente con Qwen3-Coder en codificación y uso de herramientas, ofreciendo una generación de código rápida y precisa para tareas de programación complejas. GLM-4.5-Air demuestra... tasas de éxito dominantes y mecanismos confiables de llamada de herramientas sobre Qwen3-Coder.
Contra. Géminis 2.5 Pro: GLM-4.5-Air se mantiene a la par en las pruebas de razonamiento práctico y codificación frente a Gemini 2.5 Pro. Si bien Gemini puede sobresalir ligeramente en algunas pruebas específicas de codificación y razonamiento, GLM-4.5-Air ofrece una Equilibrio favorable entre una gran ventana de contexto y herramientas de agente, optimizadas para implementaciones eficientes en el mundo real.
Limitaciones
- Rendimiento general y número de parámetros activos ligeramente reducidos en comparación con el modelo insignia GLM-4.5.
- Algunas tareas complejas pueden mostrar pequeñas caídas en el rendimiento, aunque las capacidades básicas del texto y del código siguen siendo sólidas.
- No es ideal para organizaciones que priorizan la precisión absoluta de última generación por sobre todas las demás consideraciones.
- La utilización óptima de su contexto "completo" y de sus capacidades de soporte de herramientas podría requerir una nueva infraestructura para lograr la mejor eficiencia.
Preguntas frecuentes (FAQ)
❓ ¿Cuál es la principal ventaja del GLM-4.5-Air de Zhipu AI?
✔️ La principal ventaja del GLM-4.5-Air radica en su excepcional eficiencia y rentabilidad, logrado a través de un diseño de mezcla de expertos (MoE) con 12 mil millones de parámetros activos, lo que lo hace altamente eficiente en el uso de recursos.
❓ ¿Cuál es el tamaño de la ventana de contexto de GLM-4.5-Air?
✔️ Cuenta con un sustancial Ventana de contexto de 128.000 tokens, permitiendo la comprensión y generación de textos muy largos y complejos.
❓ ¿En qué áreas GLM-4.5-Air muestra un fuerte desempeño competitivo?
✔️ Se destaca en Aplicaciones de agencia, navegación web (superando a Claude-4-Opus)y ofrece un sólido rendimiento en codificación, razonamiento y uso de herramientas, especialmente en entornos con limitaciones de hardware.
❓ ¿Cuáles son los casos de uso óptimos para GLM-4.5-Air?
✔️ Los casos de uso ideales incluyen IA conversacional rentable, asistencia de codificación liviana, análisis de documentos complejos e implementaciones en dispositivos móviles y de borde.
❓ ¿Cuáles son las principales limitaciones del GLM-4.5-Air?
✔️ Sus principales limitaciones incluyen un rendimiento general ligeramente reducido en comparación con el buque insignia GLM-4.5, lo que lo hace menos adecuado para escenarios exigentes. Precisión absoluta de última generación por encima de todo.
Patio de juegos de IA



Acceso