



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-v4-pro',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-pro",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Búsqueda profunda V4 Pro
El modelo de ponderación abierta más grande disponible: 1,6 billones de parámetros, ventana de contexto de 1 millón, 49 mil millones de activos por token. La primera arquitectura que hace que el contexto de un millón de tokens sea económicamente viable a escala de producción.
¿Qué es DeepSeek V4 Pro?
DeepSeek V4 Pro es el modelo insignia de la cuarta generación de DeepSeek. Es el El modelo de pesas abiertas más grande disponible actualmente — más grande que Kimi K2.6, con 1,1 T, y más del doble del tamaño de su predecesor, DeepSeek V3.2, con 685 B.
Usando un Mezcla de expertos (MoE) En cuanto al diseño, V4 Pro activa solo 49 mil millones de parámetros por token, aproximadamente el 3% de su peso total. En el contexto de un millón de tokens, requiere solo 27% de las operaciones de punto flotante de inferencia y 10% del tamaño de la caché KV En comparación con la versión 3.2, no se trata de mejoras incrementales, sino que representan un cambio radical en lo que es económicamente viable a escala de producción.
Tres innovaciones detrás de la eficiencia
La mayoría de los modelos consideran las ventanas de contexto de un millón de tokens como una característica de marketing. A esa escala, la atención estándar tiene un costo cuadrático: la memoria se dispara, la inferencia se ralentiza y los costos se multiplican. DeepSeek resolvió este problema con tres avances arquitectónicos desarrollados y publicados antes del lanzamiento de la versión 4.
Resultados de referencia
V4 Pro se compara con los mejores modelos de código cerrado en tareas de razonamiento, codificación y conocimiento. En SWE-bench Verified se encuentra dentro de 0,2 puntos de Claude Opus 4.6 a aproximadamente una séptima parte del coste de producción.
Modos de esfuerzo de razonamiento
V4 Pro admite modos de razonamiento configurables: permite equilibrar la velocidad con la profundidad según lo que requiera la tarea, en lugar de pagar por el máximo nivel de análisis en cada llamada.
¿Quién debería usar DeepSeek V4 Pro?
El contexto de 1 millón de V4 Pro, su sólido rendimiento de codificación agencial y su precio competitivo lo hacen idóneo para una clase específica de cargas de trabajo.
- Código fuente completo Carga un repositorio mediano completo en contexto. SOTA en Terminal-Bench y SWE-bench permite la refactorización entre archivos, la investigación de errores y la revisión de la arquitectura sin truncamiento.
- Tareas de agente Automatización en múltiples etapas, síntesis de investigación y ejecución de flujos de trabajo complejos donde el agente debe realizar un seguimiento del estado a lo largo de múltiples etapas. Lidera proyectos de código abierto sobre pruebas comparativas de codificación agencial.
- Matemáticas / STEM Supera a todos los modelos de código abierto actuales en pruebas de matemáticas y ciencias, tecnología, ingeniería y matemáticas (STEM). Competitivo con los mejores modelos de código cerrado en GPQA Diamond. Adecuado para investigación técnica y razonamiento científico.
- Conocimiento RAG Ocupa el primer lugar entre los modelos abiertos para el conocimiento global, solo superado por Gemini 3.1 Pro en general. Las empresas que desarrollan flujos de trabajo RAG o sistemas de preguntas y respuestas sobre documentos encontrarán que la capacidad de recuperación de V4 Pro es notablemente superior a la de otros modelos de código abierto similares.
Campo de juegos de IA



Acceso