



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'zhipu/glm-4.5-air',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="zhipu/glm-4.5-air",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Détails du produit
✨ GLM-4.5-Air de Zhipu AI se distingue comme un très efficace et rentable Modèle de langage de grande envergure. Conçu selon une approche avancée de type Mixture-of-Experts (MoE), il comprend 106 milliards de paramètres (dont 12 milliards actifs). Parfaitement adapté à une large gamme d'applications de traitement de texte, il reproduit fidèlement les performances impressionnantes du modèle GLM-4.5. fenêtre de contexte de 128 000 jetonsCette capacité lui permet de comprendre et de générer des textes exceptionnellement longs, tout en réduisant considérablement la charge de calcul.
Spécifications techniques
🚀 Indicateurs de performance
- Fenêtre contextuelle : 128 000 jetons
- Classé 6e au classement général sur 12 indicateurs de référence du secteur, atteignant un score moyen de 59,8.
- Aptitude au raisonnement : Des scores impressionnants sur MMLU-Pro (81,4%), AIME24 (89,4%) et Math (98,1%), ainsi que de solides compétences en programmation.
📊 Indicateurs de performance pour les applications d'agents
GLM-4.5-Air est spécialement conçu pour les applications multi-agents, grâce à sa fenêtre de contexte robuste de 128 000 jetons et à ses capacités d'exécution de fonctions intégrées. Sur les principaux benchmarks multi-agents tels que τ-bench et BFCL-v3, il obtient des résultats quasi équivalents à Claude 4 Sonnet. Notamment, dans les tests de navigation web spécialisés (BrowseComp), qui évaluent le raisonnement complexe en plusieurs étapes et l'utilisation d'outils, GLM-4.5-Air démontre une taux de précision de 26,4 %Ce résultat surpasse celui de Claude-4-Opus (18,8 %) et se rapproche de celui de o4-mini-high (28,3 %), une solution de référence. Ces chiffres soulignent les performances robustes et équilibrées de GLM-4.5-Air dans des tâches concrètes, qu'elles soient basées sur des outils ou sur des agents.

💡 Fonctionnalités clés
- Génération de texte avancée : Génère des résultats fluides et contextuellement précis, adaptés aux contenus longs et aux dialogues complexes à plusieurs tours de parole.
- Raisonnement agentiel efficace : Maintient de solides capacités de codage, de raisonnement et d'utilisation d'outils, tant en mode « réflexion » (résolution de problèmes complexes) qu'en mode « non-réflexion » (réponse instantanée).
- Efficacité des ressources : Nécessite beaucoup moins de mémoire GPU (déployable sur des GPU de 16 Go), ce qui en fait un excellent choix pour les environnements réels où le matériel est limité.
- Très compétitif pour les tâches de développement pratique et d'agent, offrant une suggestion de code rapide et une analyse documentaire détaillée.
💲 Tarification de l'API
- Saisir: 0,21 $
- Sortir: 1,155 $
Cas d'utilisation optimaux
- IA conversationnelle rentable : Idéal pour les chatbots et assistants virtuels à volume élevé et faible latence.
- Assistance légère en programmation : Offre une fonction de saisie semi-automatique du code en temps réel, un débogage efficace et une génération de documentation performante.
- Analyse de documents complexes : Capable d'analyser à grande échelle des textes juridiques, scientifiques et commerciaux.
- Déploiements mobiles et en périphérie : Excellente performance dans les environnements aux ressources matérielles limitées.
- Outils d'agent : Permet aux agents utilisant des outils de contrôle, aux fonctionnalités de navigation Web et à la transformation de contenu par lots.
Exemple de code
Comparaison avec d'autres modèles
Contre. Claude 4 Sonnet: GLM-4.5-Air offre un bon compromis entre efficacité et performance, bien qu'il soit légèrement en retrait par rapport à Claude 4 Sonnet pour certaines tâches de codage et de raisonnement agentiel. Si Claude 4 Sonnet prend en charge une fenêtre de contexte plus large (200 000 jetons contre 128 000) et inclut des capacités de saisie d'images (le rendant plus adapté aux applications multimodales), GLM-4.5-Air se distingue par… open-source, plus économique et offrant une grande fiabilité pour les appels de fonctions et le raisonnement multi-tours.
Par rapport à GLM-4.5 : GLM-4.5-Air atteint environ 80 à 98 % des performances du modèle phare GLM-4.5, mais avec un nombre de paramètres actifs nettement inférieur (12 milliards contre 32 milliards) et des besoins en ressources réduits. Bien qu'il puisse être légèrement en retrait en termes de précision brute des tâches, il conserve de solides capacités de raisonnement, de codage et d'exécution, ce qui en fait un outil performant. mieux adapté au déploiement dans des environnements aux ressources matérielles limitées.
Contre. Qwen3-Coder: GLM-4.5-Air rivalise efficacement avec Qwen3-Coder en matière de codage et d'utilisation d'outils, offrant une génération de code rapide et précise pour les tâches de programmation complexes. GLM-4.5-Air démontre taux de réussite dominants et mécanismes d'appel d'outils fiables via Qwen3-Coder.
Contre. Gemini 2.5 Pro: GLM-4.5-Air se défend bien face à Gemini 2.5 Pro sur les tests de raisonnement pratique et de programmation. Bien que Gemini puisse légèrement exceller dans certains tests spécifiques de programmation et de raisonnement, GLM-4.5-Air offre un un équilibre favorable entre une large fenêtre de contexte et des outils d'agent, optimisé pour des déploiements efficaces dans le monde réel.
Limites
- Performances globales et nombre de paramètres actifs légèrement inférieurs à ceux du modèle phare GLM-4.5.
- Certaines tâches complexes peuvent présenter de légères baisses de performance, bien que les capacités de base en matière de texte et de code restent robustes.
- Pas idéal pour les organisations qui privilégient une précision absolue et optimale avant toute autre considération.
- L'utilisation optimale de son contexte « complet » et de ses capacités d'assistance technique pourrait nécessiter une nouvelle infrastructure pour une efficacité optimale.
Foire aux questions (FAQ)
❓ Quel est l'avantage principal du GLM-4.5-Air de Zhipu AI ?
✔️ Le principal avantage du GLM-4.5-Air réside dans son caractère exceptionnel efficacité et rentabilité, réalisé grâce à une conception Mixture-of-Experts (MoE) avec 12 milliards de paramètres actifs, ce qui la rend très économe en ressources.
❓ Quelle est la taille de la fenêtre de contexte de GLM-4.5-Air ?
✔️ Il comporte une taille importante fenêtre de contexte de 128 000 jetons, permettant la compréhension et la génération de textes très longs et complexes.
❓ Dans quels domaines le GLM-4.5-Air affiche-t-il de solides performances concurrentielles ?
✔️ Il excelle dans applications agentiques, navigation web (surpassant Claude-4-Opus)et offre d'excellentes performances en matière de codage, de raisonnement et d'utilisation d'outils, notamment dans des environnements où le matériel est limité.
❓ Quels sont les cas d'utilisation optimaux pour GLM-4.5-Air ?
✔️ Les cas d'utilisation idéaux comprennent IA conversationnelle économique, assistance au codage légère, analyse de documents complexes et déploiements sur appareils mobiles et périphériques.
❓ Quelles sont les principales limitations de GLM-4.5-Air ?
✔️ Ses principales limitations incluent des performances globales légèrement inférieures à celles du modèle phare GLM-4.5, le rendant moins adapté aux scénarios exigeants une précision absolue et à la pointe de la technologie avant tout..
Terrain de jeu de l'IA



Se connecter