



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-thinking-v3.2-exp',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-thinking-v3.2-exp",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Détails du produit
DeepSeek V3.2 Exp Thinking DeepSeek V3.2 Exp Thinking est un modèle d'IA de raisonnement hybride avancé, conçu avec précision pour optimiser les tâches de raisonnement complexes et multi-étapes, ainsi que le traitement cognitif en profondeur. S'appuyant sur la série V3.1, cette version améliore considérablement les performances du mode « pensée », offrant une compréhension contextuelle supérieure et des capacités de résolution de problèmes dynamiques. Elle excelle dans des domaines exigeants tels que le développement logiciel, la recherche et les industries à forte intensité de connaissances. Conçu pour les déploiements en entreprise et les flux de travail de recherche, DeepSeek V3.2 Exp Thinking propose une gestion optimisée des jetons, une inférence plus rapide et une interprétation multimodale des données plus riche, le tout prenant en charge des processus de pensée robustes et progressifs.
✨ Innovations clés et architecture
DeepSeek V3.2 Exp Thinking se distingue par plusieurs innovations fondamentales conçues pour l'efficacité et un raisonnement amélioré.
- ⚙️ Architecture : Modèle basé sur un transformateur intégré avec Attention clairsemée DeepSeek (DSA) pour une attention symbolique intelligente et sélective.
- 💡 Paramètres : Utilise 671 milliards de paramètres au total, dont 37 milliards sont actifs de manière très efficace pendant l'inférence.
- 📏 Fenêtre contextuelle : Une fenêtre de contexte massive prenant en charge jusqu'à 128 000 jetons, idéal pour une analyse documentaire approfondie.
- ✨ Attention éparse (DSA) : Elle se concentre sur la sélection des jetons les plus pertinents, réduisant considérablement la charge de calcul, passant d'une évolution quadratique à une évolution quasi linéaire en fonction de la longueur du contexte.
- 🧠 Mode Réflexion : Active la génération explicite de la chaîne de pensée avant les réponses, améliorant ainsi la transparence et la résolution de problèmes complexes.
- ⚡ Efficacité de l'entraînement : Permet d'obtenir un régime d'entraînement similaire à celui de V3.1-Terminus, mais avec un coût de calcul réduit grâce à DSA.
🚀 Performances et points de référence
Globalement, DeepSeek V3.2 Exp Thinking offre des performances équivalentes à celles de V3.1-Terminus pour les tâches de raisonnement complexes. De légères variations sont observées selon les benchmarks, avec des performances particulièrement bonnes lors des concours de mathématiques comme AIME 2025 et des défis de programmation (Codeforces).

Évaluation des performances de DeepSeek V3.2 Exp Thinking
💡 Fonctionnalités avancées
- Raisonnement par chaîne de pensée : Génère des étapes de raisonnement intermédiaires explicites avant les réponses finales, améliorant considérablement la transparence et les capacités de résolution de problèmes complexes.
- Attention parcimonieuse DeepSeek (DSA) : Permet une sélection fine des jetons pour les contextes longs, réduisant ainsi les coûts de calcul tout en préservant une qualité de sortie élevée.
- Fenêtre de contexte large : Il prend en charge jusqu'à 128 000 jetons, ce qui le rend parfaitement adapté aux flux de travail multi-documents et à l'intégration approfondie des connaissances.
- Assistance en streaming : Facilite la diffusion en continu du contenu du raisonnement et des résultats finaux pour des expériences interactives en temps réel.
🎯 Cas d'utilisation pratiques
- ✔️ Tâches de raisonnement complexes exigeant une déduction par étapes, telles que la résolution de problèmes mathématiques avancés et les énigmes logiques.
- ✔️ Analyse et résumé de documents où des fenêtres de contexte étendues et un raisonnement structuré sont primordiaux.
- ✔️ Agents conversationnels nécessitant une transparence explicite du raisonnement pour une confiance et une explicabilité accrues.
- ✔️ Applications à forte intensité de connaissances impliquant de nombreux documents liés ou des journaux volumineux.
- ✔️ Agents d'IA augmentés par des outils où l'intégration de la chaîne de pensée et des appels de fonction améliore le contrôle et l'efficacité des tâches.
💰 Tarification de l'API
- 1 million de jetons d'entrée (CACHE HIT) : 0,0294 $
- 1 million de jetons d'entrée (CACHE MISS) : 0,294 $
- 1 million de jetons de sortie : 0,441 $
📊 Comparaison de modèles
Contre. DeepSeek-V3.1-Terminus
DeepSeek V3.2 Exp Thinking utilise une attention parcimonieuse pour réduire considérablement la charge de calcul tout en conservant une qualité de sortie quasi identique à celle de V3.1-Terminus. L'une des principales différences réside dans le « mode Pensée » dédié de V3.2-Exp, qui expose explicitement le raisonnement par chaîne de pensée, une fonctionnalité absente de V3.1.
Contre. OpenAI GPT-4o
Bien que GPT-4o fournisse des réponses de haute qualité, son traitement de contextes très longs peut s'avérer coûteux. DeepSeek V3.2 Exp Thinking s'adapte efficacement jusqu'à 128 000 jetons, en tirant parti de l'attention parcimonieuse pour un raisonnement plus rapide sur des contextes longs, tandis que GPT-4o repose principalement sur une attention dense. GPT-4o offre une prise en charge multimodale plus étendue, mais DeepSeek privilégie une transparence optimisée du raisonnement textuel.
Contre. Qwen-3
Les deux modèles prennent en charge les contextes étendus. Cependant, l'attention parcimonieuse de DeepSeek réduit considérablement les coûts de calcul pour les entrées étendues. DeepSeek V3.2 Exp Thinking propose également une chaîne de pensée explicite dans son mode Thinking, tandis que Qwen-3 privilégie généralement des capacités multimodales plus larges.
❓ Foire aux questions (FAQ)
Q1 : Qu'est-ce que DeepSeek V3.2 Exp Thinking et comment améliore-t-il le raisonnement de l'IA ?
A1 : DeepSeek V3.2 Exp Thinking est un modèle d’IA spécialisé, conçu pour les tâches de raisonnement complexes, qui expose clairement son processus de réflexion. Il utilise un raisonnement systématique par chaîne de pensée, décomposant les problèmes étape par étape afin d’améliorer la précision, la transparence et la gestion des problèmes logiques à plusieurs étapes.
Q2 : Quels sont les principaux avantages du « mode de réflexion » de DeepSeek ?
A2 : Le « mode Réflexion » offre une plus grande précision pour les tâches complexes, une résolution de problèmes transparente, de meilleures performances aux défis mathématiques et logiques, une valeur pédagogique accrue grâce à la mise en valeur du raisonnement, et la capacité de détecter et de corriger les erreurs en cours de raisonnement. Il est donc idéal pour les applications exigeant fiabilité et explicabilité.
Q3 : Pour quels types de tâches DeepSeek V3.2 Exp Thinking est-il le mieux adapté ?
A3 : Il est idéal pour la résolution de problèmes mathématiques complexes, le raisonnement scientifique, les énigmes logiques, la planification stratégique, le débogage de code, le raisonnement juridique/éthique et la synthèse de la recherche – en bref, tout scénario où la compréhension du processus de raisonnement est aussi cruciale que la réponse finale.
Q4 : En quoi DeepSeek Sparse Attention (DSA) est-il bénéfique au modèle ?
A4 : L’algorithme DSA permet au modèle de se concentrer sélectivement sur les jetons les plus pertinents dans les contextes longs, réduisant ainsi considérablement les coûts de calcul et l’utilisation de la mémoire, passant d’une complexité quadratique à une complexité quasi linéaire, tout en maintenant une qualité de sortie élevée. Ceci permet un traitement efficace de fenêtres de contexte plus larges.
Q5 : DeepSeek V3.2 Exp Thinking peut-il gérer des documents volumineux et des flux de travail multi-documents ?
A5 : Oui, avec sa grande fenêtre de contexte prenant en charge jusqu'à 128 000 jetons, DeepSeek V3.2 Exp Thinking est exceptionnellement bien adapté à l'analyse, à la synthèse et aux flux de travail complets de documents qui impliquent l'intégration d'informations provenant de plusieurs documents liés ou de fichiers journaux volumineux.
Terrain de jeu de l'IA



Se connecter