2.262

Afuera

Activo

Charlar

Activo

DeepSeek V4 Pro

Un modelo de mezcla de expertos con 1,6 billones de parámetros, diseñado para el razonamiento de primer nivel, la codificación automatizada y la inteligencia contextual a largo plazo, a una fracción del coste de los modelos de vanguardia comparables.

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Contáctanos Explorar modelos

DeepSeek V4 Pro

Búsqueda profunda V4 Pro

El modelo de ponderación abierta más grande disponible: 1,6 billones de parámetros, ventana de contexto de 1 millón, 49 mil millones de activos por token. La primera arquitectura que hace que el contexto de un millón de tokens sea económicamente viable a escala de producción.

Publicado el 24 de abril de 2026 Pesos abiertos Arquitectura del Ministerio de Educación Contexto 1M

1.6T

Parámetros totales

49B

Activo por token

Ventana de contexto

33T

Fichas de entrenamiento

// 01 — INTRODUCCIÓN

¿Qué es DeepSeek V4 Pro?

DeepSeek V4 Pro es el modelo insignia de la cuarta generación de DeepSeek. Es el El modelo de pesas abiertas más grande disponible actualmente — más grande que Kimi K2.6, con 1,1 T, y más del doble del tamaño de su predecesor, DeepSeek V3.2, con 685 B.

Usando un Mezcla de expertos (MoE) En cuanto al diseño, V4 Pro activa solo 49 mil millones de parámetros por token, aproximadamente el 3% de su peso total. En el contexto de un millón de tokens, requiere solo 27% de las operaciones de punto flotante de inferencia y 10% del tamaño de la caché KV En comparación con la versión 3.2, no se trata de mejoras incrementales, sino que representan un cambio radical en lo que es económicamente viable a escala de producción.

Precios de la API (por 1 millón de tokens)

Entrada (fallo de caché)

$2.26

por cada millón de tokens

Entrada (acierto de caché)

$0.19

por cada millón de tokens

Producción

$4.52

por cada millón de tokens

// 02 — ARQUITECTURA

Tres innovaciones detrás de la eficiencia

La mayoría de los modelos consideran las ventanas de contexto de un millón de tokens como una característica de marketing. A esa escala, la atención estándar tiene un costo cuadrático: la memoria se dispara, la inferencia se ralentiza y los costos se multiplican. DeepSeek resolvió este problema con tres avances arquitectónicos desarrollados y publicados antes del lanzamiento de la versión 4.

Atención híbrida (CSA + HCA)

Reemplaza la atención plena estándar. Logra 27% de inferencia FLOPs y solo caché KV del 10% Con 1 millón de tokens, la inferencia de contexto largo se vuelve realmente implementable a escala de producción.

Hiperconexiones con restricciones de variedad

HC estándar causó Amplificación de señal de 3000× en experimentos 27B. El mHC restringe las matrices de mezcla a través de Sinkhorn-Knopp, reduciendo la amplificación a 1,6× — permitiendo un entrenamiento estable de 1,6 T.

Optimizador de muones

Sustituye a AdamW para el preentrenamiento. Convergencia más rápida y estabilidad del entrenamiento a escala de parámetros de 1,6T, junto con las garantías de mHC. Entrenamiento con token 33T realizable.

Post-entrenamiento en dos etapas

SFT + RL (GRPO) independiente por experto en dominio, luego unificado a través de síntesis de políticasSe conservan las fortalezas de cada dominio y luego se combinan sin que se produzca una regresión de las capacidades.

// 03 — PARÁMETROS DE REFERENCIA

Resultados de referencia

V4 Pro se compara con los mejores modelos de código cerrado en tareas de razonamiento, codificación y conocimiento. En SWE-bench Verified se encuentra dentro de 0,2 puntos de Claude Opus 4.6 a aproximadamente una séptima parte del coste de producción.

PUNTO DE REFERENCIA

PUNTAJE

ESTADO

SWE-bench verificado

80,6%

Cerca de SOTA

Diamante GPQA

~76%

Nivel superior

Banco terminal

#1 Sistema operativo

Líder

Codificación agencial

BAJO

Líder

Conocimiento mundial

#1 Sistema operativo

Líder

Matemáticas / STEM

Mejor sistema operativo

Líder

// 04 — MODOS DE RAZONAMIENTO

Modos de esfuerzo de razonamiento

V4 Pro admite modos de razonamiento configurables: permite equilibrar la velocidad con la profundidad según lo que requiera la tarea, en lugar de pagar por el máximo nivel de análisis en cada llamada.

Estándar

Predeterminado. Respuestas rápidas y directas sin una cadena de pensamiento extensa. Ideal para recuperación de información, resumen, resultados estructurados y tareas donde la latencia es más importante que el razonamiento profundo.

Pensar

Activa el razonamiento paso a paso antes de la respuesta final. Los tokens de razonamiento visibles aparecen en detalles_del_razonamientoAdecuado para codificación compleja, matemáticas y análisis de varios pasos.

// 05 — CASOS DE USO

¿Quién debería usar DeepSeek V4 Pro?

El contexto de 1 millón de V4 Pro, su sólido rendimiento de codificación agencial y su precio competitivo lo hacen idóneo para una clase específica de cargas de trabajo.

Código fuente completo Carga un repositorio mediano completo en contexto. SOTA en Terminal-Bench y SWE-bench permite la refactorización entre archivos, la investigación de errores y la revisión de la arquitectura sin truncamiento.
Tareas de agente Automatización en múltiples etapas, síntesis de investigación y ejecución de flujos de trabajo complejos donde el agente debe realizar un seguimiento del estado a lo largo de múltiples etapas. Lidera proyectos de código abierto sobre pruebas comparativas de codificación agencial.
Matemáticas / STEM Supera a todos los modelos de código abierto actuales en pruebas de matemáticas y ciencias, tecnología, ingeniería y matemáticas (STEM). Competitivo con los mejores modelos de código cerrado en GPQA Diamond. Adecuado para investigación técnica y razonamiento científico.
Conocimiento RAG Ocupa el primer lugar entre los modelos abiertos para el conocimiento global, solo superado por Gemini 3.1 Pro en general. Las empresas que desarrollan flujos de trabajo RAG o sistemas de preguntas y respuestas sobre documentos encontrarán que la capacidad de recuperación de V4 Pro es notablemente superior a la de otros modelos de código abierto similares.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Contáctanos

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Contáctanos