



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-thinking-v3.2-exp',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-thinking-v3.2-exp",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalhes do produto
DeepSeek V3.2 Exp Pensamento O DeepSeek V3.2 Exp Thinking é um modelo avançado de IA de raciocínio híbrido, meticulosamente projetado para aprimorar tarefas de raciocínio complexo em várias etapas e processamento cognitivo profundo. Baseado na série V3.1, esta iteração aumenta significativamente o desempenho do modo "pensamento", oferecendo compreensão contextual superior e recursos dinâmicos de resolução de problemas. Ele se destaca em áreas exigentes, como desenvolvimento de software, pesquisa e indústrias de alta tecnologia. Projetado para implantação em nível empresarial e fluxos de trabalho de pesquisa, o DeepSeek V3.2 Exp Thinking apresenta tratamento otimizado de tokens, inferência mais rápida e interpretação de dados multimodais mais rica, tudo isso para suportar processos de pensamento robustos e passo a passo.
✨ Principais inovações e arquitetura
O DeepSeek V3.2 Exp Thinking se destaca por diversas inovações essenciais projetadas para aumentar a eficiência e aprimorar o raciocínio.
- ⚙️ Arquitetura: Modelo baseado em transformador integrado com Atenção Esparsa DeepSeek (DSA) Para atenção inteligente e seletiva a tokens.
- 💡 Parâmetros: Utiliza um total de 671 bilhões de parâmetros, com 37 bilhões deles ativos durante a inferência, o que é altamente eficiente.
- 📏 Janela de contexto: Uma janela de contexto enorme que suporta até 128 mil tokensIdeal para análise documental abrangente.
- ✨ Atenção Esparsa (DSA): Concentra-se na seleção apenas dos tokens mais relevantes, reduzindo drasticamente a carga computacional de uma escala quadrática para uma escala quase linear com o comprimento do contexto.
- 🧠 Modo de Pensamento: Ativa a geração explícita de uma cadeia de raciocínio antes das respostas, aumentando a transparência e a resolução de problemas complexos.
- ⚡ Eficiência do Treinamento: Obtém um regime de treinamento semelhante ao do V3.1-Terminus, mas com custo computacional reduzido devido ao DSA.
🚀 Desempenho e indicadores de desempenho
De forma geral, o DeepSeek V3.2 Exp Thinking mantém um desempenho equivalente ao do V3.1-Terminus em tarefas de raciocínio complexas. Pequenas variações são observadas em benchmarks específicos, com destaque para competições de matemática como a AIME 2025 e desafios de programação (Codeforces).

Benchmarks de desempenho para DeepSeek V3.2 Exp Thinking
💡 Recursos avançados
- Raciocínio em Cadeia de Pensamento: Gera etapas de raciocínio intermediárias explícitas antes das respostas finais, aumentando significativamente a transparência e as capacidades de resolução de problemas complexos.
- Atenção Esparsa DeepSeek (DSA): Permite a seleção precisa de tokens para contextos longos, reduzindo os custos computacionais e preservando a alta qualidade da saída.
- Janela de contexto grande: Suporta até 128 mil tokens, tornando-o altamente adequado para fluxos de trabalho com múltiplos documentos e integração profunda de conhecimento.
- Suporte para streaming: Facilita a transmissão simultânea do conteúdo de raciocínio e dos resultados finais para experiências interativas em tempo real.
🎯 Casos de uso práticos
- ✔️ Tarefas de raciocínio complexo que exigem dedução passo a passo, como resolução de problemas matemáticos avançados e quebra-cabeças lógicos.
- ✔️ Análise e sumarização de documentos onde amplas janelas contextuais e raciocínio estruturado são fundamentais.
- ✔️ Agentes conversacionais que exigem transparência explícita no raciocínio para aumentar a confiança e a explicabilidade.
- ✔️ Aplicações que exigem grande volume de conhecimento, envolvendo múltiplos documentos interligados ou registros extensos.
- ✔️ Agentes de IA aprimorados por ferramentas, onde a integração da linha de raciocínio e chamadas de função melhora o controle e a eficácia das tarefas.
💰 Preços da API
- 1 milhão de tokens de entrada (CACHE HIT): $ 0,0294
- 1 milhão de tokens de entrada (FALHA DE CACHE): $ 0,294
- 1 milhão de tokens de saída: $ 0,441
📊 Comparação de Modelos
Contra DeepSeek-V3.1-Terminus
O DeepSeek V3.2 Exp Thinking emprega atenção esparsa para reduzir significativamente a sobrecarga computacional, mantendo uma qualidade de saída quase idêntica à do V3.1-Terminus. Um diferencial fundamental é o "Modo de Pensamento" dedicado do V3.2-Exp, que expõe explicitamente o raciocínio em cadeia, um recurso ausente no V3.1.
Contra OpenAI GPT-4o
Embora o GPT-4o forneça respostas de alta qualidade, seu processamento para contextos muito longos pode ser custoso. O DeepSeek V3.2 Exp Thinking escala eficientemente até 128 mil tokens, aproveitando a atenção esparsa para um raciocínio mais rápido em contextos longos, enquanto o GPT-4o depende principalmente da atenção densa. O GPT-4o oferece suporte multimodal mais amplo, mas o DeepSeek se concentra na transparência otimizada do raciocínio textual.
Contra Qwen-3
Ambos os modelos suportam contextos amplos. No entanto, a atenção esparsa do DeepSeek reduz significativamente os custos computacionais para entradas extensas. O DeepSeek V3.2 Exp Thinking também oferece uma cadeia de raciocínio explícita em seu modo Thinking, enquanto o Qwen-3 geralmente enfatiza capacidades multimodais mais amplas.
❓ Perguntas frequentes (FAQ)
P1: O que é o DeepSeek V3.2 Exp Thinking e como ele aprimora o raciocínio da IA?
A1: O DeepSeek V3.2 Exp Thinking é um modelo de IA especializado, projetado para tarefas de raciocínio complexas, que demonstra explicitamente seu processo de pensamento. Ele utiliza raciocínio sistemático em cadeia, decompondo os problemas passo a passo para aumentar a precisão, proporcionar transparência e lidar melhor com problemas lógicos de múltiplas etapas.
P2: Quais são os principais benefícios do "Modo de Pensamento" do DeepSeek?
A2: O "Modo de Pensamento" oferece maior precisão em tarefas complexas, resolução de problemas transparente, melhor desempenho em desafios matemáticos e lógicos, maior valor educacional ao demonstrar o raciocínio e a capacidade de detectar e corrigir erros durante o processo de raciocínio. Isso o torna ideal para aplicações que exigem confiabilidade e explicabilidade.
Q3: Para que tipos de tarefas o DeepSeek V3.2 Exp Thinking é mais adequado?
A3: É ideal para a resolução de problemas matemáticos complexos, raciocínio científico, quebra-cabeças lógicos, planejamento estratégico, depuração de código, raciocínio jurídico/ético e síntese de pesquisas – essencialmente qualquer cenário em que a compreensão do processo de raciocínio seja tão crucial quanto a resposta final.
Q4: Como o DeepSeek Sparse Attention (DSA) beneficia o modelo?
A4: O DSA permite que o modelo se concentre seletivamente nos tokens mais relevantes em contextos longos, reduzindo significativamente os custos computacionais e o uso de memória de uma escala quadrática para uma escala quase linear, mantendo ao mesmo tempo alta qualidade de saída. Isso possibilita o processamento eficiente de janelas de contexto maiores.
Q5: O DeepSeek V3.2 Exp Thinking consegue lidar com documentos extensos e fluxos de trabalho com vários documentos?
A5: Sim, com sua grande janela de contexto que suporta até 128 mil tokens, o DeepSeek V3.2 Exp Thinking é excepcionalmente adequado para análise abrangente de documentos, sumarização e fluxos de trabalho que envolvem a integração de informações de vários documentos vinculados ou extensos arquivos de log.
Playground de IA



Conecte-se