Dans

2,262

Dehors

Actif

Chat

Actif

DeepSeek V4 Pro

Un modèle de mélange d'experts à 1,6 billion de paramètres conçu pour un raisonnement de classe mondiale, un codage agentique et une intelligence à long contexte à une fraction du coût des modèles de pointe comparables.

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Plus de 300 modèles d'IA pour OpenClaw et agents IA

Contactez-nous Explorer les modèles

DeepSeek V4 Pro

Le plus grand modèle à pondération ouverte disponible : 1,6 T de paramètres, une fenêtre de contexte de 1 million de jetons et 49 milliards de jetons actifs par jeton. La première architecture à rendre économiquement viable un contexte d’un million de jetons à l’échelle de la production.

Sortie prévue le 24 avril 2026 Poids libres Architecture du ministère de l'Éducation Contexte 1M

1,6T

Paramètres totaux

49B

Actif par jeton

Fenêtre contextuelle

33T

Jetons d'entraînement

// 01 — APERÇU

Qu'est-ce que DeepSeek V4 Pro ?

Le DeepSeek V4 Pro est le modèle phare de la quatrième génération de DeepSeek. Le plus grand modèle à poids ouverts actuellement disponible — plus grande que la Kimi K2.6 (1,1T) et plus de deux fois plus grande que son prédécesseur, la DeepSeek V3.2 (685B).

En utilisant un Mélange d'experts (MoE) De par sa conception, V4 Pro n'active que 49 milliards de paramètres par jeton, soit environ 3 % de son poids total. Dans le contexte d'un million de jetons, cela ne nécessite que… 27 % des FLOP d'inférence et 10 % de la taille du cache KV par rapport à la version 3.2. Il ne s'agit pas d'améliorations progressives, mais d'un changement radical en matière de faisabilité économique à l'échelle de la production.

Tarification de l'API (par million de jetons)

Entrée (échec du cache)

2,26 $

par million de jetons

Entrée (cache atteint)

0,19 $

par million de jetons

Sortir

4,52 $

par million de jetons

// 02 — ARCHITECTURE

Trois innovations à l'origine de l'efficacité

La plupart des modèles présentent les fenêtres de contexte d'un million de jetons comme un argument marketing. À cette échelle, l'attention standard devient quadratiquement coûteuse : la mémoire explose, l'inférence ralentit et les coûts se multiplient. DeepSeek a résolu ce problème grâce à trois avancées architecturales développées et publiées avant le lancement de la version 4.

Attention hybride (CSA + HCA)

Remplace l'attention pleine et entière standard. Permet d'atteindre 27 % de FLOP d'inférence et juste 10% KV cache à 1 million de jetons — rendant l'inférence à contexte long véritablement déployable à l'échelle de la production.

Hyperconnexions à contraintes de variété

HC standard causé Amplification du signal 3 000× Dans les expériences 27B, le mHC contraint les matrices de mélange via Sinkhorn-Knopp, limitant ainsi l'amplification. 1,6× — permettant un entraînement stable à 1,6 T.

Optimiseur de muons

Remplace AdamW pour le pré-entraînement. Convergence plus rapide et stabilité d'entraînement à l'échelle de 1,6 T de paramètres — en plus des garanties offertes par mHC. Formation aux jetons 33T réalisable.

Post-formation en deux étapes

SFT + RL (GRPO) indépendants par expert de domaine, puis unifiés via distillation conforme aux politiquesLes points forts de chaque domaine sont préservés, puis combinés sans régression des capacités.

// 03 — MARQUES DE RÉFÉRENCE

Résultats de référence

V4 Pro se montre aussi compétitif que les meilleurs modèles propriétaires en matière de raisonnement, de codage et de tâches de gestion des connaissances. Sur SWE-bench Verified, il figure parmi les meilleurs. 0,2 point de Claude Opus 4.6 à environ un septième du coût de production.

RÉFÉRENCE

SCORE

STATUT

Vérifié par SWE-bench

80,6%

Près de SOTA

Diamant GPQA

~76%

Niveau supérieur

Banc terminal

#1 OS

Chef

Codage agentique

SOUS

Chef

Connaissances mondiales

#1 OS

Chef

Mathématiques / STEM

Meilleur système d'exploitation

Chef

// 04 — MODES DE RAISONNEMENT

Modes d'effort de raisonnement

V4 Pro prend en charge des modes de raisonnement configurables — il est possible de faire un compromis entre vitesse et profondeur en fonction des exigences de la tâche, plutôt que de payer pour une réflexion maximale à chaque appel.

Standard

Par défaut. Réponses rapides et directes, sans raisonnement complexe. Idéal pour la recherche, la synthèse, les résultats structurés et les tâches où la latence prime sur la complexité du raisonnement.

Pense

Active le raisonnement étape par étape avant la réponse finale. Des jetons de raisonnement visibles apparaissent dans détails_du_raisonnementAdapté au codage complexe, aux mathématiques et aux analyses en plusieurs étapes.

// 05 — CAS D'UTILISATION

Qui devrait utiliser DeepSeek V4 Pro ?

Le contexte 1M de V4 Pro, ses performances de codage agentique élevées et son prix compétitif le rendent adapté à une catégorie spécifique de charges de travail.

Code source complet Chargez un dépôt de taille moyenne complet dans son contexte. L'état de l'art sur Terminal-Bench et SWE-bench permet la refactorisation inter-fichiers, l'investigation des bogues et l'analyse architecturale sans troncature.
Tâches d'agent Automatisation en plusieurs étapes, synthèse de la recherche et exécution de flux de travail complexes où l'agent doit suivre l'état au fil de nombreuses itérations. Leader en matière de benchmarks de programmation agentique open source.
Mathématiques / STEM Surpasse tous les modèles open source actuels sur les benchmarks mathématiques et STEM. Rivalise avec les meilleurs modèles propriétaires sur GPQA Diamond. Convient à la recherche technique et au raisonnement scientifique.
Connaissance RAG Il se classe premier parmi les modèles open source pour la connaissance du monde, juste derrière Gemini 3.1 Pro au classement général. Les entreprises développant des pipelines RAG ou des systèmes de questions-réponses documentaires constateront que le rappel de V4 Pro est nettement supérieur à celui des modèles open source concurrents.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.

Contactez-nous

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts

Contactez-nous