2.262

Вне

Активный

Чат

Активный

DeepSeek V4 Pro

Модель, объединяющая 1,6 триллиона параметров и представляющая собой смесь экспертов, разработана для обеспечения рассуждений мирового класса, агентного кодирования и интеллектуального анализа в длительном контексте при значительно меньших затратах по сравнению с аналогичными моделями передового уровня.

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Более 300 моделей ИИ для OpenClaw и агентов ИИ.

Получить ключ API Изучите модели

DeepSeek V4 Pro

Самая большая из доступных моделей с открытыми весами — 1,6 триллиона параметров, контекстное окно 1 миллион, 49 миллиардов активных токенов на токен. Первая архитектура, которая сделала экономически целесообразным использование контекста в миллион токенов в производственных масштабах.

Выпущено 24 апреля 2026 года. Открытые веса Архитектура Министерства образования Контекст 1М

1.6Т

Всего параметров

49Б

Активно для каждого токена

1М

Контекстное окно

33Т

Тренировочные токены

// 01 — ОБЗОР

Что такое DeepSeek V4 Pro?

DeepSeek V4 Pro — это флагманская модель четвертого поколения от DeepSeek. самая большая из доступных в настоящее время моделей с открытыми весами — больше, чем Kimi K2.6 (1,1 Тл) и более чем в два раза больше своего предшественника, DeepSeek V3.2 (685 Б).

Используя Смешанный состав экспертов (MoE) В рамках своей архитектуры V4 Pro активирует всего 49 миллиардов параметров на токен — примерно 3% от его полного веса. В контексте с миллионом токенов ему требуется всего лишь 27% операций вывода FLOPs и 10% от размера кэша ключ-значение по сравнению с версией 3.2. Это не просто незначительные улучшения — это качественный скачок в том, что экономически целесообразно в производственных масштабах.

Ценообразование API (за 1 млн токенов)

Ввод (промах кэша)

2,26 доллара

за 1 миллион токенов

Ввод (попадание в кэш)

0,19 доллара

за 1 миллион токенов

Выход

4,52 доллара

за 1 миллион токенов

// 02 — АРХИТЕКТУРА

Три инновации, обеспечивающие эффективность

Большинство моделей позиционируют контекстные окна в миллион токенов как маркетинговую фишку. При таком масштабе стандартное внимание обходится в квадратичном порядке — происходит накопление памяти, замедляется вывод результатов, и затраты многократно возрастают. DeepSeek решил эту проблему благодаря трем архитектурным прорывам, разработанным и опубликованным до запуска версии V4.

Гибридное внимание (CSA + HCA)

Заменяет стандартную функцию полного внимания. Обеспечивает достижение... 27% операций вывода FLOPs и просто 10% кэш KV при цене в 1 миллион токенов — что делает вывод долговременного контекста действительно пригодным для внедрения в производственных масштабах.

Гиперсвязи с ограничениями на многообразии

Стандартная HC вызвала Усиление сигнала в 3000 раз в экспериментах 27B. mHC ограничивает смешивание матриц с помощью механизма Синкхорна-Кноппа, снижая усиление до 1,6× — обеспечивая стабильную тренировку при напряженности магнитного поля 1,6 Тл.

Оптимизатор мюонов

Заменяет AdamW для предварительного обучения. Обеспечивает более быструю сходимость и стабильность обучения в масштабе 1,6 Т параметров — наряду с гарантиями, предоставляемыми mHC. 33T-токеновое обучение достижимо.

Двухэтапная пост-тренировка

Независимая SFT + RL (GRPO) для каждого эксперта в предметной области, затем объединенная посредством дистилляция политикиСильные стороны каждой области были сохранены, а затем объединены без снижения функциональных возможностей.

// 03 — ТЕСТЫ ПРОИЗВОДИТЕЛЬНОСТИ

Результаты сравнительных тестов

В тестах производительности V4 Pro демонстрирует конкурентоспособные результаты по сравнению с лучшими моделями с закрытым исходным кодом в задачах логического мышления, программирования и обработки знаний. По данным SWE-bench Verified, он находится в пределах... 0,2 балла из 4,6 баллов по шкале Клода Опуса примерно в семь раз дешевле производства.

бенчмарк

СЧЕТ

СТАТУС

Проверено с помощью SWE-bench

80,6%

Рядом с SOTA

GPQA Diamond

~76%

Высший уровень

Терминальный стенд

#1 ОС

Лидер

Агентное кодирование

ПОД

Лидер

Мировые знания

#1 ОС

Лидер

Математика / STEM

Лучшая ОС

Лидер

// 04 — РЕЖИМЫ РАССУЖДЕНИЯ

Режимы усилий рассуждения

V4 Pro поддерживает настраиваемые режимы логического мышления — вы можете выбирать между скоростью и глубиной анализа в зависимости от требований задачи, вместо того чтобы платить за максимальную глубину мышления при каждом вызове.

Стандарт

По умолчанию. Быстрые и прямые ответы без длительной цепочки рассуждений. Лучше всего подходит для поиска информации, обобщения, структурированного вывода и задач, где задержка важнее, чем глубокое осмысление.

Думать

Активирует пошаговое логическое рассуждение перед окончательным ответом. Видимые жетоны рассуждения появляются в подробности_рассужденияПодходит для сложного программирования, математических вычислений и многоэтапного анализа.

// 05 — ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ

Кому следует использовать DeepSeek V4 Pro?

Благодаря контексту 1M, высокой производительности агентного кодирования и конкурентоспособной цене V4 Pro подходит для определенного класса рабочих нагрузок.

Полный код Загрузите весь репозиторий среднего размера в контекст. SOTA на Terminal-Bench и SWE-bench позволяет выполнять рефакторинг файлов, расследование ошибок и архитектурный анализ без усечения данных.
Агентские задачи Многоэтапная автоматизация, анализ результатов исследований и выполнение сложных рабочих процессов, в которых агент должен отслеживать состояние на протяжении множества этапов. Лидер в разработке открытого программного обеспечения для тестирования производительности агентных систем.
Математика / STEM Превосходит все существующие модели с открытым исходным кодом в математических и STEM-тестах. Конкурентоспособен с лучшими моделями с закрытым исходным кодом в GPQA Diamond. Подходит для технических исследований и научного мышления.
Знание RAG Занимает первое место среди открытых моделей для управления мировыми знаниями, уступая в общем зачете только Gemini 3.1 Pro. Предприятия, создающие конвейеры RAG или системы вопросов и ответов по документам, обнаружат, что запоминаемость V4 Pro заметно превосходит аналогичные модели с открытым исходным кодом.

Игровая площадка для ИИ

Перед интеграцией протестируйте все модели API в тестовой среде. Мы предоставляем более 300 моделей для интеграции в ваше приложение.

связаться с нами

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах

Новые участники получат бесплатные токены номиналом 1 доллар.

Более 300 моделей ИИ для OpenClaw и агентов ИИ.

DeepSeek V4 Pro

Что такое DeepSeek V4 Pro?

Три инновации, обеспечивающие эффективность

Результаты сравнительных тестов

Режимы усилий рассуждения

Кому следует использовать DeepSeek V4 Pro?

Игровая площадка для ИИ

Более 300 моделей ИИ для OpenClaw и агенты искусственного интеллекта

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта