128K

Afuera

Charlar

desactivar

GLM-4.5 Aire

Al ofrecer un rendimiento casi de gama alta con una cantidad significativamente reducida de parámetros activos y requisitos de memoria, permite a las organizaciones implementar funcionalidades avanzadas de modelos de lenguaje a gran escala sin necesidad de una infraestructura informática extensa.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'zhipu/glm-4.5-air',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="zhipu/glm-4.5-air",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

GLM-4.5 Aire

Detalles del producto

✨ GLM-4.5-Air de Zhipu AI destaca como un altamente eficiente y rentable Modelo de lenguaje de gran tamaño. Diseñado con una avanzada arquitectura Mixture-of-Experts (MoE), cuenta con 106 mil millones de parámetros totales (de los cuales 12 mil millones están activos). Perfectamente adaptado a una amplia gama de aplicaciones de conversión de texto a texto, refleja las impresionantes características del GLM-4.5 completo. Ventana de contexto de 128.000 tokensEsta capacidad le permite comprender y generar textos excepcionalmente largos, al tiempo que reduce drásticamente la carga computacional.

Especificación técnica

🚀 Puntos de referencia de rendimiento

Ventana de contexto: 128.000 tokens
Clasificado 6.º en la clasificación general En 12 indicadores de referencia de la industria, logró una puntuación media de 59,8.
Habilidad de razonamiento: Excelentes puntuaciones en MMLU-Pro (81,4%), AIME24 (89,4%) y Matemáticas (98,1%), además de sólidas capacidades de programación.

📊 Métricas de rendimiento para aplicaciones ámbicas

GLM-4.5-Air está diseñado específicamente para aplicaciones agentes, y cuenta con una robusta ventana de contexto de 128.000 tokens y capacidades integradas de ejecución de funciones. En los principales benchmarks agentes, como τ-bench y BFCL-v3, logra resultados casi equivalentes a Soneto 4 de Claude. Cabe destacar que, en pruebas especializadas de navegación web (BrowseComp), que evalúan el razonamiento complejo de varios pasos y el uso de herramientas, GLM-4.5-Air demuestra una tasa de precisión del 26,4%Esto supera a Claude-4-Opus (18,8 %) y se acerca mucho al líder o4-mini-high, que alcanza el 28,3 %. Estas cifras ponen de manifiesto el rendimiento equilibrado y sólido de GLM-4.5-Air en tareas reales, basadas en herramientas y en escenarios con agentes.

💡 Capacidades clave

Generación avanzada de texto: Produce resultados fluidos y contextualmente precisos, adecuados para contenido extenso y diálogos complejos de múltiples turnos.
Razonamiento agéntico eficiente: Mantiene sólidas habilidades de codificación, razonamiento y uso de herramientas tanto en el modo de "pensamiento" (resolución de problemas complejos) como en el modo de "no pensamiento" (respuesta instantánea).
Eficiencia de los recursos: Requiere mucha menos memoria de GPU (se puede implementar en GPU de 16 GB), lo que la convierte en una excelente opción para entornos reales con recursos de hardware limitados.
Altamente competitivo para el desarrollo práctico y las tareas de agente, ofreciendo sugerencias de código rápidas y análisis detallado de documentos.

💲 Precios de API

Aporte: $0.21
Producción: $1.155

Casos de uso óptimos

Inteligencia artificial conversacional rentable: Ideal para chatbots y asistentes virtuales de alto volumen y baja latencia.
Asistencia de codificación ligera: Proporciona autocompletado de código en tiempo real, depuración y generación eficiente de documentación.
Análisis de documentos complejos: Capaz de analizar textos legales, científicos y comerciales a gran escala.
Implementaciones móviles y en el borde: Destaca en entornos con recursos de hardware limitados.
Herramientas de agencia: Permite el uso de herramientas por parte de los agentes, capacidades de navegación web y la transformación de contenido por lotes.

Ejemplo de código

Comparación con otros modelos

Vs. Soneto 4 de Claude: GLM-4.5-Air ofrece un equilibrio competitivo entre eficiencia y rendimiento, aunque se queda ligeramente atrás de Claude 4 Sonnet en ciertas tareas de codificación y razonamiento agente. Mientras que Claude 4 Sonnet admite una ventana de contexto más grande (200k tokens frente a 128k) e incluye capacidades de entrada de imágenes (lo que lo hace más adecuado para aplicaciones multimodales), GLM-4.5-Air se distingue por ser de código abierto, más rentable y que proporciona una gran fiabilidad en la llamada a funciones y el razonamiento de múltiples turnos..

Vs. GLM-4.5: GLM-4.5-Air alcanza aproximadamente entre el 80 y el 98 % del rendimiento del GLM-4.5 insignia, pero con parámetros activos significativamente menores (12 mil millones frente a 32 mil millones) y requisitos de recursos reducidos. Si bien puede quedarse un poco atrás en precisión bruta de tareas, mantiene sólidas capacidades de razonamiento, codificación y agentes, lo que lo convierte en más adecuado para su implementación en entornos con recursos de hardware limitados.

Vs. Qwen3-Coder: GLM-4.5-Air compite eficazmente con Qwen3-Coder en codificación y uso de herramientas, proporcionando una generación de código rápida y precisa para tareas de programación complejas. GLM-4.5-Air demuestra Tasas de éxito dominantes y mecanismos de llamada de herramientas fiables sobre Qwen3-Coder.

Vs. Gemini 2.5 Pro: GLM-4.5-Air se mantiene a la par en las pruebas de razonamiento práctico y codificación frente a Gemini 2.5 Pro. Si bien Gemini puede sobresalir ligeramente en algunas pruebas específicas de codificación y razonamiento, GLM-4.5-Air ofrece una Equilibrio favorable entre una amplia ventana de contexto y herramientas de agente, optimizado para implementaciones eficientes en el mundo real..

Limitaciones

Rendimiento general y número de parámetros activos ligeramente inferiores en comparación con el modelo insignia GLM-4.5.
Algunas tareas complejas pueden mostrar pequeñas disminuciones en el rendimiento, aunque las capacidades básicas de texto y código siguen siendo sólidas.
No es lo ideal para organizaciones que priorizan la precisión absoluta y de vanguardia por encima de cualquier otra consideración.
Para aprovechar al máximo su contexto completo y sus capacidades de soporte de herramientas, podría ser necesaria una nueva infraestructura que permita lograr la máxima eficiencia.

Preguntas frecuentes (FAQ)

❓ ¿Cuál es la principal ventaja del GLM-4.5-Air de Zhipu AI?

✔️ La principal ventaja del GLM-4.5-Air radica en su excepcional eficiencia y rentabilidad, logrado mediante un diseño de mezcla de expertos (MoE) con 12 mil millones de parámetros activos, lo que lo hace altamente eficiente en el uso de recursos.

❓ ¿Cuál es el tamaño de la ventana de contexto de GLM-4.5-Air?

✔️ Cuenta con una gran cantidad Ventana de contexto de 128.000 tokens, lo que permite la comprensión y la generación de textos muy largos y complejos.

❓ ¿En qué áreas muestra GLM-4.5-Air un sólido desempeño competitivo?

✔️ Destaca en Aplicaciones basadas en agentes, navegación web (con un rendimiento superior al de Claude-4-Opus).y ofrece un rendimiento sólido en codificación, razonamiento y uso de herramientas, especialmente en entornos con recursos de hardware limitados.

❓ ¿Cuáles son los casos de uso óptimos para GLM-4.5-Air?

✔️ Los casos de uso ideales incluyen: IA conversacional rentable, asistencia de codificación ligera, análisis de documentos complejos e implementaciones en dispositivos móviles y periféricos..

❓ ¿Cuáles son las principales limitaciones del GLM-4.5-Air?

✔️ Sus principales limitaciones incluyen un rendimiento general ligeramente reducido en comparación con el modelo insignia GLM-4.5, lo que lo hace menos adecuado para escenarios exigentes. Precisión absoluta de última generación por encima de todo lo demás..

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros