qwen-bg
max-ico04
Dans
2,262
Dehors
Actif
max-ico02
Chat
max-ico03
Actif
DeepSeek V4 Pro
Un modèle de mélange d'experts à 1,6 billion de paramètres conçu pour un raisonnement de classe mondiale, un codage agentique et une intelligence à long contexte à une fraction du coût des modèles de pointe comparables.
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Plus de 300 modèles d'IA pour OpenClaw et agents IA

qwenmax-bg
deepseek-copy (1).svg
DeepSeek V4 Pro

DeepSeek/Modèles/V4 Pro

DeepSeek V4 Pro

Le plus grand modèle à pondération ouverte disponible : 1,6 T de paramètres, une fenêtre de contexte de 1 million de jetons et 49 milliards de jetons actifs par jeton. La première architecture à rendre économiquement viable un contexte d’un million de jetons à l’échelle de la production.

Sortie prévue le 24 avril 2026 Poids libres Architecture du ministère de l'Éducation Contexte 1M
1,6T
Paramètres totaux
49B
Actif par jeton
1M
Fenêtre contextuelle
33T
Jetons d'entraînement
// 01 — APERÇU

Qu'est-ce que DeepSeek V4 Pro ?

Le DeepSeek V4 Pro est le modèle phare de la quatrième génération de DeepSeek. Le plus grand modèle à poids ouverts actuellement disponible — plus grande que la Kimi K2.6 (1,1T) et plus de deux fois plus grande que son prédécesseur, la DeepSeek V3.2 (685B).

En utilisant un Mélange d'experts (MoE) De par sa conception, V4 Pro n'active que 49 milliards de paramètres par jeton, soit environ 3 % de son poids total. Dans le contexte d'un million de jetons, cela ne nécessite que… 27 % des FLOP d'inférence et 10 % de la taille du cache KV par rapport à la version 3.2. Il ne s'agit pas d'améliorations progressives, mais d'un changement radical en matière de faisabilité économique à l'échelle de la production.

Tarification de l'API (par million de jetons)
Entrée (échec du cache)
2,26 $
par million de jetons
Entrée (cache atteint)
0,19 $
par million de jetons
Sortir
4,52 $
par million de jetons
// 02 — ARCHITECTURE

Trois innovations à l'origine de l'efficacité

La plupart des modèles présentent les fenêtres de contexte d'un million de jetons comme un argument marketing. À cette échelle, l'attention standard devient quadratiquement coûteuse : la mémoire explose, l'inférence ralentit et les coûts se multiplient. DeepSeek a résolu ce problème grâce à trois avancées architecturales développées et publiées avant le lancement de la version 4.

Attention hybride (CSA + HCA)
Remplace l'attention pleine et entière standard. Permet d'atteindre 27 % de FLOP d'inférence et juste 10% KV cache à 1 million de jetons — rendant l'inférence à contexte long véritablement déployable à l'échelle de la production.
Hyperconnexions à contraintes de variété
HC standard causé Amplification du signal 3 000× Dans les expériences 27B, le mHC contraint les matrices de mélange via Sinkhorn-Knopp, limitant ainsi l'amplification. 1,6× — permettant un entraînement stable à 1,6 T.
Optimiseur de muons
Remplace AdamW pour le pré-entraînement. Convergence plus rapide et stabilité d'entraînement à l'échelle de 1,6 T de paramètres — en plus des garanties offertes par mHC. Formation aux jetons 33T réalisable.
Post-formation en deux étapes
SFT + RL (GRPO) indépendants par expert de domaine, puis unifiés via distillation conforme aux politiquesLes points forts de chaque domaine sont préservés, puis combinés sans régression des capacités.
// 03 — MARQUES DE RÉFÉRENCE

Résultats de référence

V4 Pro se montre aussi compétitif que les meilleurs modèles propriétaires en matière de raisonnement, de codage et de tâches de gestion des connaissances. Sur SWE-bench Verified, il figure parmi les meilleurs. 0,2 point de Claude Opus 4.6 à environ un septième du coût de production.

RÉFÉRENCE
SCORE
STATUT
Vérifié par SWE-bench
80,6%
Près de SOTA
Diamant GPQA
~76%
Niveau supérieur
Banc terminal
#1 OS
Chef
Codage agentique
SOUS
Chef
Connaissances mondiales
#1 OS
Chef
Mathématiques / STEM
Meilleur système d'exploitation
Chef
// 04 — MODES DE RAISONNEMENT

Modes d'effort de raisonnement

V4 Pro prend en charge des modes de raisonnement configurables — il est possible de faire un compromis entre vitesse et profondeur en fonction des exigences de la tâche, plutôt que de payer pour une réflexion maximale à chaque appel.

Standard
Par défaut. Réponses rapides et directes, sans raisonnement complexe. Idéal pour la recherche, la synthèse, les résultats structurés et les tâches où la latence prime sur la complexité du raisonnement.
Pense
Active le raisonnement étape par étape avant la réponse finale. Des jetons de raisonnement visibles apparaissent dans détails_du_raisonnementAdapté au codage complexe, aux mathématiques et aux analyses en plusieurs étapes.
// 05 — CAS D'UTILISATION

Qui devrait utiliser DeepSeek V4 Pro ?

Le contexte 1M de V4 Pro, ses performances de codage agentique élevées et son prix compétitif le rendent adapté à une catégorie spécifique de charges de travail.

  • Code source complet Chargez un dépôt de taille moyenne complet dans son contexte. L'état de l'art sur Terminal-Bench et SWE-bench permet la refactorisation inter-fichiers, l'investigation des bogues et l'analyse architecturale sans troncature.
  • Tâches d'agent Automatisation en plusieurs étapes, synthèse de la recherche et exécution de flux de travail complexes où l'agent doit suivre l'état au fil de nombreuses itérations. Leader en matière de benchmarks de programmation agentique open source.
  • Mathématiques / STEM Surpasse tous les modèles open source actuels sur les benchmarks mathématiques et STEM. Rivalise avec les meilleurs modèles propriétaires sur GPQA Diamond. Convient à la recherche technique et au raisonnement scientifique.
  • Connaissance RAG Il se classe premier parmi les modèles open source pour la connaissance du monde, juste derrière Gemini 3.1 Pro au classement général. Les entreprises développant des pipelines RAG ou des systèmes de questions-réponses documentaires constateront que le rappel de V4 Pro est nettement supérieur à celui des modèles open source concurrents.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Contactez-nous
api-droite-1
modèle-bg02-1

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts