



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-v4-pro',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-pro",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

DeepSeek V4 Pro
O maior modelo open-weights disponível — 1,6 trilhão de parâmetros, 1 milhão de janelas de contexto, 49 bilhões de tokens ativos por token. A primeira arquitetura a tornar o contexto de milhões de tokens economicamente viável em escala de produção.
O que é o DeepSeek V4 Pro?
O DeepSeek V4 Pro é o modelo principal da quarta geração do DeepSeek. É o maior modelo de pesos livres atualmente disponível — maior que o Kimi K2.6, com 1,1 TB, e mais que o dobro do tamanho de seu antecessor, o DeepSeek V3.2, com 685 bytes.
Usando um Mistura de Especialistas (MoE) Em termos de design, o V4 Pro ativa apenas 49 bilhões de parâmetros por token — aproximadamente 3% de sua capacidade total. No cenário de um milhão de tokens, ele requer apenas 27% das operações de ponto flutuante de inferência e 10% do tamanho do cache KV Em comparação com a versão 3.2, essas melhorias não são incrementais — representam uma mudança radical no que é economicamente viável em escala de produção.
Três inovações por trás da eficiência
A maioria dos modelos rotula janelas de contexto com milhões de tokens como um recurso de marketing. Nessa escala, a atenção padrão se torna quadraticamente cara — a memória aumenta exponencialmente, a inferência fica mais lenta e os custos se multiplicam. O DeepSeek resolveu esse problema com três inovações arquitetônicas desenvolvidas e publicadas antes do lançamento da versão 4.
Resultados de referência
O V4 Pro se mostrou competitivo com os principais modelos proprietários em tarefas de raciocínio, codificação e conhecimento. No SWE-bench Verified, ele se encontra dentro da seguinte faixa de desempenho: 0,2 pontos de Claude Opus 4.6 a um custo de produção aproximadamente sete vezes menor.
Modos de esforço de raciocínio
O V4 Pro suporta modos de raciocínio configuráveis — equilibre velocidade e profundidade dependendo do que a tarefa exige, em vez de pagar pelo máximo de raciocínio em todas as chamadas.
Quem deve usar o DeepSeek V4 Pro?
O contexto de 1 milhão de instâncias do V4 Pro, o forte desempenho de codificação agentiva e o preço competitivo o tornam adequado para uma classe específica de cargas de trabalho.
- Código-fonte completo Carregue um repositório inteiro de tamanho médio no contexto. O SOTA no Terminal-Bench e no SWE-bench permite refatoração entre arquivos, investigação de bugs e revisão arquitetural sem truncamento.
- Tarefas Agenciais Automação em várias etapas, síntese de pesquisas e execução de fluxos de trabalho complexos, onde o agente deve monitorar o estado ao longo de várias etapas. Lidera o desenvolvimento de benchmarks de código aberto para codificação de agentes.
- Matemática / STEM Supera todos os modelos open-weight atuais em benchmarks de matemática e STEM. Competitivo com os melhores modelos de código fechado no GPQA Diamond. Adequado para pesquisa técnica e raciocínio científico.
- Conhecimento RAG O V4 Pro ocupa o primeiro lugar entre os modelos abertos em termos de conhecimento global, ficando atrás apenas do Gemini 3.1 Pro no geral. Empresas que desenvolvem fluxos de trabalho RAG ou sistemas de perguntas e respostas de documentos constatarão que o recall do V4 Pro é notavelmente superior ao de modelos de código aberto similares.
Playground de IA



Conecte-se