qwen-bg
max-ico04
Em
2,262
Fora
Ativo
max-ico02
Bater papo
max-ico03
Ativo
DeepSeek V4 Pro
Um modelo de mistura de especialistas com 1,6 trilhão de parâmetros, projetado para raciocínio de classe mundial, codificação agentiva e inteligência de longo contexto a uma fração do custo de modelos de ponta comparáveis.
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

qwenmax-bg
deepseek-copy (1).svg
DeepSeek V4 Pro

DeepSeek/Modelos/V4 Pro

DeepSeek V4 Pro

O maior modelo open-weights disponível — 1,6 trilhão de parâmetros, 1 milhão de janelas de contexto, 49 bilhões de tokens ativos por token. A primeira arquitetura a tornar o contexto de milhões de tokens economicamente viável em escala de produção.

Lançado em 24 de abril de 2026 Pesos Livres Arquitetura do Ministério da Educação Contexto 1M
1,6T
Parâmetros totais
49B
Ativo por token
1M
Janela de contexto
33T
Fichas de treinamento
// 01 — VISÃO GERAL

O que é o DeepSeek V4 Pro?

O DeepSeek V4 Pro é o modelo principal da quarta geração do DeepSeek. É o maior modelo de pesos livres atualmente disponível — maior que o Kimi K2.6, com 1,1 TB, e mais que o dobro do tamanho de seu antecessor, o DeepSeek V3.2, com 685 bytes.

Usando um Mistura de Especialistas (MoE) Em termos de design, o V4 Pro ativa apenas 49 bilhões de parâmetros por token — aproximadamente 3% de sua capacidade total. No cenário de um milhão de tokens, ele requer apenas 27% das operações de ponto flutuante de inferência e 10% do tamanho do cache KV Em comparação com a versão 3.2, essas melhorias não são incrementais — representam uma mudança radical no que é economicamente viável em escala de produção.

Preços da API (por 1 milhão de tokens)
Entrada (falha de cache)
$ 2,26
por 1 milhão de tokens
Entrada (acerto de cache)
$ 0,19
por 1 milhão de tokens
Saída
$ 4,52
por 1 milhão de tokens
// 02 — ARQUITETURA

Três inovações por trás da eficiência

A maioria dos modelos rotula janelas de contexto com milhões de tokens como um recurso de marketing. Nessa escala, a atenção padrão se torna quadraticamente cara — a memória aumenta exponencialmente, a inferência fica mais lenta e os custos se multiplicam. O DeepSeek resolveu esse problema com três inovações arquitetônicas desenvolvidas e publicadas antes do lançamento da versão 4.

Atenção Híbrida (CSA + HCA)
Substitui a atenção plena padrão. Consegue 27% de FLOPs de inferência e apenas Cache de 10% KV Com 1 milhão de tokens — tornando a inferência de contexto longo verdadeiramente implantável em escala de produção.
Hiperconexões com restrições de variedade
HC padrão causado Amplificação de sinal de 3.000× Em experimentos 27B, o mHC restringe as matrizes de mistura via Sinkhorn-Knopp, reduzindo a amplificação para 1,6× — possibilitando treinamento estável em 1,6T.
Otimizador de múons
Substitui o AdamW no pré-treinamento. Convergência mais rápida e estabilidade de treinamento em escala de 1,6T parâmetros — além das garantias do mHC. Treinamento com token 33T alcançável.
Pós-treinamento em duas etapas
SFT independente + RL (GRPO) por especialista de domínio, depois unificado via destilação de acordo com a políticaA força de cada domínio foi preservada e, em seguida, combinada sem regressão de capacidade.
// 03 — REFERÊNCIAS

Resultados de referência

O V4 Pro se mostrou competitivo com os principais modelos proprietários em tarefas de raciocínio, codificação e conhecimento. No SWE-bench Verified, ele se encontra dentro da seguinte faixa de desempenho: 0,2 pontos de Claude Opus 4.6 a um custo de produção aproximadamente sete vezes menor.

REFERÊNCIA
PONTUAÇÃO
STATUS
Verificado pelo SWE-bench
80,6%
Próximo ao SOTA
Diamante GPQA
~76%
Nível superior
Bancada terminal
#1 OS
Líder
Codificação Agêntica
SOB
Líder
Conhecimento Mundial
#1 OS
Líder
Matemática / STEM
Best OS
Líder
// 04 — MODOS DE RACIOCÍNIO

Modos de esforço de raciocínio

O V4 Pro suporta modos de raciocínio configuráveis ​​— equilibre velocidade e profundidade dependendo do que a tarefa exige, em vez de pagar pelo máximo de raciocínio em todas as chamadas.

Padrão
Padrão. Respostas rápidas e diretas, sem raciocínio complexo. Ideal para recuperação de informações, sumarização, saídas estruturadas e tarefas em que a latência é mais importante do que o raciocínio profundo.
Pensar
Ativa o raciocínio passo a passo antes da resposta final. Os marcadores de raciocínio visíveis aparecem em detalhes_de_raciocínioIdeal para codificação complexa, matemática e análises em várias etapas.
// 05 — CASOS DE USO

Quem deve usar o DeepSeek V4 Pro?

O contexto de 1 milhão de instâncias do V4 Pro, o forte desempenho de codificação agentiva e o preço competitivo o tornam adequado para uma classe específica de cargas de trabalho.

  • Código-fonte completo Carregue um repositório inteiro de tamanho médio no contexto. O SOTA no Terminal-Bench e no SWE-bench permite refatoração entre arquivos, investigação de bugs e revisão arquitetural sem truncamento.
  • Tarefas Agenciais Automação em várias etapas, síntese de pesquisas e execução de fluxos de trabalho complexos, onde o agente deve monitorar o estado ao longo de várias etapas. Lidera o desenvolvimento de benchmarks de código aberto para codificação de agentes.
  • Matemática / STEM Supera todos os modelos open-weight atuais em benchmarks de matemática e STEM. Competitivo com os melhores modelos de código fechado no GPQA Diamond. Adequado para pesquisa técnica e raciocínio científico.
  • Conhecimento RAG O V4 Pro ocupa o primeiro lugar entre os modelos abertos em termos de conhecimento global, ficando atrás apenas do Gemini 3.1 Pro no geral. Empresas que desenvolvem fluxos de trabalho RAG ou sistemas de perguntas e respostas de documentos constatarão que o recall do V4 Pro é notavelmente superior ao de modelos de código aberto similares.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Contate-nos
api-right-1
modelo-bg02-1

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos