2.262

Aus

Aktiv

Chat

Aktiv

DeepSeek V4 Pro

Ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern, das für erstklassiges Schlussfolgerungsvermögen, agentenbasierte Codierung und kontextbezogene Intelligenz zu einem Bruchteil der Kosten vergleichbarer Spitzenmodelle entwickelt wurde.

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Über 300 KI-Modelle für OpenClaw & KI-Agenten

Kontaktieren Sie uns Modelle entdecken

DeepSeek V4 Pro

Das größte verfügbare Open-Weights-Modell – 1,6 Billionen Parameter, 1 Million Kontextfenster, 49 Milliarden aktive Token pro Token. Die erste Architektur, die Kontext mit Millionen von Token im Produktionsmaßstab wirtschaftlich rentabel macht.

Veröffentlicht am 24. April 2026 Offene Gewichtsklassen Architektur des Bildungsministeriums 1M Kontext

1,6 Tonnen

Gesamtparameter

49B

Aktiv pro Token

1 Million

Kontextfenster

33T

Trainingsmarken

// 01 — ÜBERSICHT

Was ist DeepSeek V4 Pro?

DeepSeek V4 Pro ist das Flaggschiffmodell der vierten Generation von DeepSeek. Es ist das größtes derzeit verfügbares Modell mit offenen Gewichtsklassen — größer als Kimi K2.6 mit 1,1 TB und mehr als doppelt so groß wie sein Vorgänger DeepSeek V3.2 mit 685 B.

Verwendung eines Expertenmix (MoE) Das Design von V4 Pro aktiviert nur 49 Milliarden Parameter pro Token – etwa 3 % seines Gesamtgewichts. Im Kontext einer Million Token benötigt es lediglich 27 % der Inferenz-FLOPs Und 10 % der KV-Cache-Größe im Vergleich zu V3.2. Das sind keine inkrementellen Verbesserungen – sie stellen einen Quantensprung in dem dar, was im Produktionsmaßstab wirtschaftlich machbar ist.

API-Preise (pro 1 Million Token)

Eingabe (Cache-Fehler)

2,26 $

pro 1 Million Token

Eingabe (Cache-Treffer)

0,19 $

pro 1 Million Token

Ausgabe

4,52 €

pro 1 Million Token

// 02 — ARCHITEKTUR

Drei Innovationen hinter der Effizienz

Die meisten Modelle stufen Kontextfenster mit Millionen von Token als Marketingmerkmal ein. In diesem Umfang steigt der Aufwand für die Standardaufmerksamkeit quadratisch an – der Speicherbedarf explodiert, die Inferenz verlangsamt sich und die Kosten vervielfachen sich. DeepSeek löste dieses Problem mit drei architektonischen Durchbrüchen, die vor dem Start von Version 4 entwickelt und veröffentlicht wurden.

Hybride Aufmerksamkeit (CSA + HCA)

Ersetzt die übliche volle Aufmerksamkeit. Erreicht 27% Inferenz FLOPs und einfach 10% KV-Cache bei 1 Million Tokens – wodurch Langzeitkontextinferenz tatsächlich im Produktionsmaßstab einsetzbar wird.

Mannigfaltigkeitsbeschränkte Hyperverbindungen

Standard HC verursacht 3.000-fache Signalverstärkung in 27B-Experimenten. mHC schränkt die Mischungsmatrizen über den Sinkhorn-Knopp-Mechanismus ein und reduziert so die Amplifikation auf 1,6× — ermöglicht stabiles Training mit 1,6T.

Myon-Optimierer

Ersetzt AdamW für das Vortraining. Schnellere Konvergenz und Trainingsstabilität bei 1,6T-Parametern – zusätzlich zu den Garantien von mHC. 33T-Token-Training erreichbar.

Zweistufiges Nachschulungsprogramm

Unabhängiges SFT + RL (GRPO) pro Domänenexperte, dann vereinheitlicht über Politische DestillationDie Stärken der einzelnen Domänen wurden erhalten und anschließend ohne Leistungseinbußen miteinander kombiniert.

// 03 — BENCHMARKS

Vergleichsergebnisse

V4 Pro erzielt in Benchmarks vergleichbare Ergebnisse wie führende proprietäre Modelle in den Bereichen logisches Denken, Codierung und Wissensverarbeitung. Im SWE-bench Verified-Ranking liegt es unter den besten 4 %. 0,2 Punkte von Claude Opus 4.6 zu etwa einem Siebtel der Produktionskosten.

BENCHMARK

PUNKTZAHL

STATUS

SWE-bench-verifiziert

80,6 %

In der Nähe von SOTA

GPQA Diamond

~76%

Spitzenklasse

Terminalbank

#1 Betriebssystem

Führer

Agentische Codierung

UNTER

Führer

Weltwissen

#1 Betriebssystem

Führer

Mathematik / MINT

Bestes Betriebssystem

Führer

// 04 — DENKSATZMODI

Denkanstrengungsmodi

V4 Pro unterstützt konfigurierbare Denkmodi – je nach Aufgabenstellung kann zwischen Geschwindigkeit und Tiefe abgewogen werden, anstatt bei jedem Anruf für maximale Denkleistung zu bezahlen.

Standard

Standardeinstellung. Schnelle, direkte Antworten ohne lange Gedankengänge. Am besten geeignet für Abruf, Zusammenfassung, strukturierte Ausgaben und Aufgaben, bei denen die Reaktionszeit wichtiger ist als tiefgründiges Denken.

Denken

Aktiviert schrittweises Schlussfolgern vor der endgültigen Antwort. Sichtbare Logikbausteine erscheinen in BegründungsdetailsGeeignet für komplexe Codierung, Mathematik und mehrstufige Analysen.

// 05 — ANWENDUNGSFÄLLE

Für wen ist DeepSeek V4 Pro geeignet?

Der 1M-Kontext, die starke agentenbasierte Codierungsleistung und der wettbewerbsfähige Preis des V4 Pro machen ihn für eine bestimmte Klasse von Arbeitslasten geeignet.

Vollständiger Quellcode Laden Sie ein komplettes mittelgroßes Repository in den Kontext. SOTA auf Terminal-Bench und SWE-bench ermöglicht dateiübergreifendes Refactoring, Fehleruntersuchung und Architekturprüfung ohne Datenkürzung.
Agentische Aufgaben Mehrstufige Automatisierung, Forschungssynthese und komplexe Workflow-Ausführung, bei der der Agent den Zustand über viele Durchläufe hinweg verfolgen muss. Führt Open-Source-Benchmarks für agentenbasierte Programmierung an.
Mathematik / MINT Übertrifft alle aktuellen Open-Source-Modelle in Mathematik- und MINT-Benchmarks. Wettbewerbsfähig mit führenden proprietären Modellen auf GPQA Diamond. Geeignet für technische Forschung und wissenschaftliches Denken.
Wissens-RAG V4 Pro belegt den ersten Platz unter den Open-Source-Modellen für weltweites Wissen und liegt insgesamt nur hinter Gemini 3.1 Pro. Unternehmen, die RAG-Pipelines oder Dokumenten-Frage-Antwort-Systeme entwickeln, werden feststellen, dass die Recall-Rate von V4 Pro deutlich über der vergleichbarer Open-Source-Modelle liegt.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.

Kontaktieren Sie uns

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten

Kontaktieren Sie uns

Über 300 KI-Modelle für OpenClaw & KI-Agenten

DeepSeek V4 Pro

Was ist DeepSeek V4 Pro?

Drei Innovationen hinter der Effizienz

Vergleichsergebnisse

Denkanstrengungsmodi

Für wen ist DeepSeek V4 Pro geeignet?

KI-Spielplatz

Mehr als 300 KI-Modelle für OpenClaw & KI-Agenten

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten