



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'minimax/m2-5-20260218',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="minimax/m2-5-20260218",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

MiniMax-M2.5
Les MiniMax-M2.5 et MiniMax-M2.5 Highspeed constituent une solution flexible pour les charges de travail d'IA modernes. Que votre priorité soit la génération de texte intelligent, l'automatisation conversationnelle ou le déploiement en temps réel à faible latence, cette gamme de modèles offre des performances de niveau production à un coût évolutif.
Qu'est-ce que MiniMax-M2.5 ?
MiniMax-M2.5 est un modèle de langage généraliste de grande taille développé par MiniMax, conçu pour alimenter un large éventail d'applications de langage naturel, allant des chatbots intelligents et des assistants virtuels aux pipelines de génération de contenu automatisée et d'analyse de documents.
API MiniMax-M2.5
Le modèle de langage généraliste phare Développé par MiniMax, ce logiciel offre une excellente capacité à suivre les instructions, un raisonnement nuancé et une génération de contenu haute fidélité. Il est conçu pour les charges de travail où la qualité des réponses et la profondeur du contexte sont primordiales.
- Optimisé pour les tâches de génération de texte privilégiant la qualité
- Mise en cache native des invites pour réduire les coûts liés aux invites répétées
- Connaissances approfondies dans les domaines techniques et créatifs
- Fenêtre de contexte étendue pour le traitement des documents longs
- Idéal pour les pipelines asynchrones et les charges de travail par lots
- Facturation par jeton à un prix compétitif pour une utilisation évolutive
Tarification
- Entrée : 0,39 $ / 1 million de jetons
- Résultat : 1,56 $ / 1 million de jetons
API haut débit MiniMax-M2.5
UN variante optimisée pour le débit Conçu pour les applications sensibles à la latence, ce système offre un temps d'obtention du premier jeton considérablement plus rapide et une capacité de requêtes par seconde plus élevée, ce qui en fait le choix idéal pour les interactions utilisateur en direct et les services à fort trafic.
- Latence ultra-faible pour les applications de chat en temps réel
- Capacité de débit élevée pour les pics de requêtes simultanées
- Maintient la cohérence de la réponse dans des conditions de charge extrêmes
- Conçu pour les interfaces vocales, les interfaces utilisateur de streaming et les agents en direct
- Flux de jetons optimisé pour le rendu progressif
- Même intelligence de base que M2.5, pipeline de livraison plus rapide
Tarification
- Entrée : 0,78 $ / 1 million de jetons
- Résultat : 3,12 $ / 1 million de jetons
Conçu pour chaque couche de votre architecture d'IA
IA conversationnelle et chatbots
Dynamisez les conversations à plusieurs tours et contextuelles pour le service client, l'automatisation du support et les plateformes d'assistants virtuels grâce à une gestion du dialogue naturelle et cohérente.
Génération de contenu
Automatisez la création à grande échelle d'articles, de textes marketing, de descriptions de produits, de publications sur les réseaux sociaux et de contenus éditoriaux longs sans sacrifier la qualité.
Renseignements documentaires
Résumer, classer, extraire les informations clés et répondre aux questions concernant les contrats, les rapports, les documents de recherche et les documents d'entreprise en utilisant un contexte étendu.
Flux de travail des agents IA
Servir de base au raisonnement des agents autonomes, permettant la décomposition complexe des tâches, la sélection des outils, la planification en plusieurs étapes et les cycles itératifs d'auto-correction.
Terrain de jeu de l'IA



Se connecter