128 mil

Fora

Bater papo

desativar

DeepSeek‑V3.2‑Exp pensando

O modelo se destaca em tarefas de raciocínio de contexto extenso com uma janela de contexto de até 128 mil tokens e oferece suporte à integração de dados multimodais para raciocínio avançado em cadeia de pensamento.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-thinking-v3.2-exp',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-thinking-v3.2-exp",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

DeepSeek‑V3.2‑Exp pensando

Detalhes do produto

DeepSeek V3.2 Exp Pensamento O DeepSeek V3.2 Exp Thinking é um modelo avançado de IA de raciocínio híbrido, meticulosamente projetado para aprimorar tarefas de raciocínio complexo em várias etapas e processamento cognitivo profundo. Baseado na série V3.1, esta iteração aumenta significativamente o desempenho do modo "pensamento", oferecendo compreensão contextual superior e recursos dinâmicos de resolução de problemas. Ele se destaca em áreas exigentes, como desenvolvimento de software, pesquisa e indústrias de alta tecnologia. Projetado para implantação em nível empresarial e fluxos de trabalho de pesquisa, o DeepSeek V3.2 Exp Thinking apresenta tratamento otimizado de tokens, inferência mais rápida e interpretação de dados multimodais mais rica, tudo isso para suportar processos de pensamento robustos e passo a passo.

✨ Principais inovações e arquitetura

O DeepSeek V3.2 Exp Thinking se destaca por diversas inovações essenciais projetadas para aumentar a eficiência e aprimorar o raciocínio.

⚙️ Arquitetura: Modelo baseado em transformador integrado com Atenção Esparsa DeepSeek (DSA) Para atenção inteligente e seletiva a tokens.
💡 Parâmetros: Utiliza um total de 671 bilhões de parâmetros, com 37 bilhões deles ativos durante a inferência, o que é altamente eficiente.
📏 Janela de contexto: Uma janela de contexto enorme que suporta até 128 mil tokensIdeal para análise documental abrangente.
✨ Atenção Esparsa (DSA): Concentra-se na seleção apenas dos tokens mais relevantes, reduzindo drasticamente a carga computacional de uma escala quadrática para uma escala quase linear com o comprimento do contexto.
🧠 Modo de Pensamento: Ativa a geração explícita de uma cadeia de raciocínio antes das respostas, aumentando a transparência e a resolução de problemas complexos.
⚡ Eficiência do Treinamento: Obtém um regime de treinamento semelhante ao do V3.1-Terminus, mas com custo computacional reduzido devido ao DSA.

🚀 Desempenho e indicadores de desempenho

De forma geral, o DeepSeek V3.2 Exp Thinking mantém um desempenho equivalente ao do V3.1-Terminus em tarefas de raciocínio complexas. Pequenas variações são observadas em benchmarks específicos, com destaque para competições de matemática como a AIME 2025 e desafios de programação (Codeforces).

Benchmarks de desempenho para DeepSeek V3.2 Exp Thinking

💡 Recursos avançados

Raciocínio em Cadeia de Pensamento: Gera etapas de raciocínio intermediárias explícitas antes das respostas finais, aumentando significativamente a transparência e as capacidades de resolução de problemas complexos.
Atenção Esparsa DeepSeek (DSA): Permite a seleção precisa de tokens para contextos longos, reduzindo os custos computacionais e preservando a alta qualidade da saída.
Janela de contexto grande: Suporta até 128 mil tokens, tornando-o altamente adequado para fluxos de trabalho com múltiplos documentos e integração profunda de conhecimento.
Suporte para streaming: Facilita a transmissão simultânea do conteúdo de raciocínio e dos resultados finais para experiências interativas em tempo real.

🎯 Casos de Uso Práticos

✔️ Tarefas de raciocínio complexo que exigem dedução passo a passo, como resolução de problemas matemáticos avançados e quebra-cabeças lógicos.
✔️ Análise e sumarização de documentos onde amplas janelas contextuais e raciocínio estruturado são fundamentais.
✔️ Agentes conversacionais que exigem transparência explícita no raciocínio para aumentar a confiança e a explicabilidade.
✔️ Aplicações que exigem grande volume de conhecimento, envolvendo múltiplos documentos interligados ou registros extensos.
✔️ Agentes de IA aprimorados por ferramentas, onde a integração da linha de raciocínio e chamadas de função melhora o controle e a eficácia das tarefas.

💰 Preços da API

1 milhão de tokens de entrada (CACHE HIT): $ 0,0294
1 milhão de tokens de entrada (FALHA DE CACHE): $ 0,294
1 milhão de tokens de saída: $ 0,441

📊 Comparação de Modelos

Contra DeepSeek-V3.1-Terminus

O DeepSeek V3.2 Exp Thinking emprega atenção esparsa para reduzir significativamente a sobrecarga computacional, mantendo uma qualidade de saída quase idêntica à do V3.1-Terminus. Um diferencial fundamental é o "Modo de Pensamento" dedicado do V3.2-Exp, que expõe explicitamente o raciocínio em cadeia, um recurso ausente no V3.1.

Contra OpenAI GPT-4o

Embora o GPT-4o forneça respostas de alta qualidade, seu processamento para contextos muito longos pode ser custoso. O DeepSeek V3.2 Exp Thinking escala eficientemente até 128 mil tokens, aproveitando a atenção esparsa para um raciocínio mais rápido em contextos longos, enquanto o GPT-4o depende principalmente da atenção densa. O GPT-4o oferece suporte multimodal mais amplo, mas o DeepSeek se concentra na transparência otimizada do raciocínio textual.

Contra Qwen-3

Ambos os modelos suportam contextos amplos. No entanto, a atenção esparsa do DeepSeek reduz significativamente os custos computacionais para entradas extensas. O DeepSeek V3.2 Exp Thinking também oferece uma cadeia de raciocínio explícita em seu modo Thinking, enquanto o Qwen-3 geralmente enfatiza capacidades multimodais mais amplas.

❓ Perguntas frequentes (FAQ)

P1: O que é o DeepSeek V3.2 Exp Thinking e como ele aprimora o raciocínio da IA?
A1: O DeepSeek V3.2 Exp Thinking é um modelo de IA especializado, projetado para tarefas de raciocínio complexas, que demonstra explicitamente seu processo de pensamento. Ele utiliza raciocínio sistemático em cadeia, decompondo os problemas passo a passo para aumentar a precisão, proporcionar transparência e lidar melhor com problemas lógicos de múltiplas etapas.

P2: Quais são os principais benefícios do "Modo de Pensamento" do DeepSeek?
A2: O "Modo de Pensamento" oferece maior precisão em tarefas complexas, resolução de problemas transparente, melhor desempenho em desafios matemáticos e lógicos, maior valor educacional ao demonstrar o raciocínio e a capacidade de detectar e corrigir erros durante o processo de raciocínio. Isso o torna ideal para aplicações que exigem confiabilidade e explicabilidade.

Q3: Para que tipos de tarefas o DeepSeek V3.2 Exp Thinking é mais adequado?
A3: É ideal para a resolução de problemas matemáticos complexos, raciocínio científico, quebra-cabeças lógicos, planejamento estratégico, depuração de código, raciocínio jurídico/ético e síntese de pesquisas – essencialmente qualquer cenário em que a compreensão do processo de raciocínio seja tão crucial quanto a resposta final.

Q4: Como o DeepSeek Sparse Attention (DSA) beneficia o modelo?
A4: O DSA permite que o modelo se concentre seletivamente nos tokens mais relevantes em contextos longos, reduzindo significativamente os custos computacionais e o uso de memória de uma escala quadrática para uma escala quase linear, mantendo ao mesmo tempo alta qualidade de saída. Isso possibilita o processamento eficiente de janelas de contexto maiores.

Q5: O DeepSeek V3.2 Exp Thinking consegue lidar com documentos extensos e fluxos de trabalho com vários documentos?
A5: Sim, com sua grande janela de contexto que suporta até 128 mil tokens, o DeepSeek V3.2 Exp Thinking é excepcionalmente adequado para análise abrangente de documentos, sumarização e fluxos de trabalho que envolvem a integração de informações de vários documentos vinculados ou extensos arquivos de log.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos