



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-v4-pro',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-pro",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

DeepSeek V4 Pro
Le plus grand modèle à pondération ouverte disponible : 1,6 T de paramètres, une fenêtre de contexte de 1 million de jetons et 49 milliards de jetons actifs par jeton. La première architecture à rendre économiquement viable un contexte d’un million de jetons à l’échelle de la production.
Qu'est-ce que DeepSeek V4 Pro ?
Le DeepSeek V4 Pro est le modèle phare de la quatrième génération de DeepSeek. Le plus grand modèle à poids ouverts actuellement disponible — plus grande que la Kimi K2.6 (1,1T) et plus de deux fois plus grande que son prédécesseur, la DeepSeek V3.2 (685B).
En utilisant un Mélange d'experts (MoE) De par sa conception, V4 Pro n'active que 49 milliards de paramètres par jeton, soit environ 3 % de son poids total. Dans le contexte d'un million de jetons, cela ne nécessite que… 27 % des FLOP d'inférence et 10 % de la taille du cache KV par rapport à la version 3.2. Il ne s'agit pas d'améliorations progressives, mais d'un changement radical en matière de faisabilité économique à l'échelle de la production.
Trois innovations à l'origine de l'efficacité
La plupart des modèles présentent les fenêtres de contexte d'un million de jetons comme un argument marketing. À cette échelle, l'attention standard devient quadratiquement coûteuse : la mémoire explose, l'inférence ralentit et les coûts se multiplient. DeepSeek a résolu ce problème grâce à trois avancées architecturales développées et publiées avant le lancement de la version 4.
Résultats de référence
V4 Pro se montre aussi compétitif que les meilleurs modèles propriétaires en matière de raisonnement, de codage et de tâches de gestion des connaissances. Sur SWE-bench Verified, il figure parmi les meilleurs. 0,2 point de Claude Opus 4.6 à environ un septième du coût de production.
Modes d'effort de raisonnement
V4 Pro prend en charge des modes de raisonnement configurables — il est possible de faire un compromis entre vitesse et profondeur en fonction des exigences de la tâche, plutôt que de payer pour une réflexion maximale à chaque appel.
Qui devrait utiliser DeepSeek V4 Pro ?
Le contexte 1M de V4 Pro, ses performances de codage agentique élevées et son prix compétitif le rendent adapté à une catégorie spécifique de charges de travail.
- Code source complet Chargez un dépôt de taille moyenne complet dans son contexte. L'état de l'art sur Terminal-Bench et SWE-bench permet la refactorisation inter-fichiers, l'investigation des bogues et l'analyse architecturale sans troncature.
- Tâches d'agent Automatisation en plusieurs étapes, synthèse de la recherche et exécution de flux de travail complexes où l'agent doit suivre l'état au fil de nombreuses itérations. Leader en matière de benchmarks de programmation agentique open source.
- Mathématiques / STEM Surpasse tous les modèles open source actuels sur les benchmarks mathématiques et STEM. Rivalise avec les meilleurs modèles propriétaires sur GPQA Diamond. Convient à la recherche technique et au raisonnement scientifique.
- Connaissance RAG Il se classe premier parmi les modèles open source pour la connaissance du monde, juste derrière Gemini 3.1 Pro au classement général. Les entreprises développant des pipelines RAG ou des systèmes de questions-réponses documentaires constateront que le rappel de V4 Pro est nettement supérieur à celui des modèles open source concurrents.
Terrain de jeu de l'IA



Se connecter