qwen-bg
max-ico04
In
2.262
Aus
Aktiv
max-ico02
Chat
max-ico03
Aktiv
DeepSeek V4 Pro
Ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern, das für erstklassiges Schlussfolgerungsvermögen, agentenbasierte Codierung und kontextbezogene Intelligenz zu einem Bruchteil der Kosten vergleichbarer Spitzenmodelle entwickelt wurde.
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'deepseek/deepseek-v4-pro',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Über 300 KI-Modelle für OpenClaw & KI-Agenten

qwenmax-bg
deepseek-copy (1).svg
DeepSeek V4 Pro

DeepSeek/Modelle/V4 Pro

DeepSeek V4 Pro

Das größte verfügbare Open-Weights-Modell – 1,6 Billionen Parameter, 1 Million Kontextfenster, 49 Milliarden aktive Token pro Token. Die erste Architektur, die Kontext mit Millionen von Token im Produktionsmaßstab wirtschaftlich rentabel macht.

Veröffentlicht am 24. April 2026 Offene Gewichtsklassen Architektur des Bildungsministeriums 1M Kontext
1,6 Tonnen
Gesamtparameter
49B
Aktiv pro Token
1 Million
Kontextfenster
33T
Trainingsmarken
// 01 — ÜBERSICHT

Was ist DeepSeek V4 Pro?

DeepSeek V4 Pro ist das Flaggschiffmodell der vierten Generation von DeepSeek. Es ist das größtes derzeit verfügbares Modell mit offenen Gewichtsklassen — größer als Kimi K2.6 mit 1,1 TB und mehr als doppelt so groß wie sein Vorgänger DeepSeek V3.2 mit 685 B.

Verwendung eines Expertenmix (MoE) Das Design von V4 Pro aktiviert nur 49 Milliarden Parameter pro Token – etwa 3 % seines Gesamtgewichts. Im Kontext einer Million Token benötigt es lediglich 27 % der Inferenz-FLOPs Und 10 % der KV-Cache-Größe im Vergleich zu V3.2. Das sind keine inkrementellen Verbesserungen – sie stellen einen Quantensprung in dem dar, was im Produktionsmaßstab wirtschaftlich machbar ist.

API-Preise (pro 1 Million Token)
Eingabe (Cache-Fehler)
2,26 $
pro 1 Million Token
Eingabe (Cache-Treffer)
0,19 $
pro 1 Million Token
Ausgabe
4,52 €
pro 1 Million Token
// 02 — ARCHITEKTUR

Drei Innovationen hinter der Effizienz

Die meisten Modelle stufen Kontextfenster mit Millionen von Token als Marketingmerkmal ein. In diesem Umfang steigt der Aufwand für die Standardaufmerksamkeit quadratisch an – der Speicherbedarf explodiert, die Inferenz verlangsamt sich und die Kosten vervielfachen sich. DeepSeek löste dieses Problem mit drei architektonischen Durchbrüchen, die vor dem Start von Version 4 entwickelt und veröffentlicht wurden.

Hybride Aufmerksamkeit (CSA + HCA)
Ersetzt die übliche volle Aufmerksamkeit. Erreicht 27% Inferenz FLOPs und einfach 10% KV-Cache bei 1 Million Tokens – wodurch Langzeitkontextinferenz tatsächlich im Produktionsmaßstab einsetzbar wird.
Mannigfaltigkeitsbeschränkte Hyperverbindungen
Standard HC verursacht 3.000-fache Signalverstärkung in 27B-Experimenten. mHC schränkt die Mischungsmatrizen über den Sinkhorn-Knopp-Mechanismus ein und reduziert so die Amplifikation auf 1,6× — ermöglicht stabiles Training mit 1,6T.
Myon-Optimierer
Ersetzt AdamW für das Vortraining. Schnellere Konvergenz und Trainingsstabilität bei 1,6T-Parametern – zusätzlich zu den Garantien von mHC. 33T-Token-Training erreichbar.
Zweistufiges Nachschulungsprogramm
Unabhängiges SFT + RL (GRPO) pro Domänenexperte, dann vereinheitlicht über Politische DestillationDie Stärken der einzelnen Domänen wurden erhalten und anschließend ohne Leistungseinbußen miteinander kombiniert.
// 03 — BENCHMARKS

Vergleichsergebnisse

V4 Pro erzielt in Benchmarks vergleichbare Ergebnisse wie führende proprietäre Modelle in den Bereichen logisches Denken, Codierung und Wissensverarbeitung. Im SWE-bench Verified-Ranking liegt es unter den besten 4 %. 0,2 Punkte von Claude Opus 4.6 zu etwa einem Siebtel der Produktionskosten.

BENCHMARK
PUNKTZAHL
STATUS
SWE-bench-verifiziert
80,6 %
In der Nähe von SOTA
GPQA Diamond
~76%
Spitzenklasse
Terminalbank
#1 Betriebssystem
Führer
Agentische Codierung
UNTER
Führer
Weltwissen
#1 Betriebssystem
Führer
Mathematik / MINT
Bestes Betriebssystem
Führer
// 04 — DENKSATZMODI

Denkanstrengungsmodi

V4 Pro unterstützt konfigurierbare Denkmodi – je nach Aufgabenstellung kann zwischen Geschwindigkeit und Tiefe abgewogen werden, anstatt bei jedem Anruf für maximale Denkleistung zu bezahlen.

Standard
Standardeinstellung. Schnelle, direkte Antworten ohne lange Gedankengänge. Am besten geeignet für Abruf, Zusammenfassung, strukturierte Ausgaben und Aufgaben, bei denen die Reaktionszeit wichtiger ist als tiefgründiges Denken.
Denken
Aktiviert schrittweises Schlussfolgern vor der endgültigen Antwort. Sichtbare Logikbausteine ​​erscheinen in BegründungsdetailsGeeignet für komplexe Codierung, Mathematik und mehrstufige Analysen.
// 05 — ANWENDUNGSFÄLLE

Für wen ist DeepSeek V4 Pro geeignet?

Der 1M-Kontext, die starke agentenbasierte Codierungsleistung und der wettbewerbsfähige Preis des V4 Pro machen ihn für eine bestimmte Klasse von Arbeitslasten geeignet.

  • Vollständiger Quellcode Laden Sie ein komplettes mittelgroßes Repository in den Kontext. SOTA auf Terminal-Bench und SWE-bench ermöglicht dateiübergreifendes Refactoring, Fehleruntersuchung und Architekturprüfung ohne Datenkürzung.
  • Agentische Aufgaben Mehrstufige Automatisierung, Forschungssynthese und komplexe Workflow-Ausführung, bei der der Agent den Zustand über viele Durchläufe hinweg verfolgen muss. Führt Open-Source-Benchmarks für agentenbasierte Programmierung an.
  • Mathematik / MINT Übertrifft alle aktuellen Open-Source-Modelle in Mathematik- und MINT-Benchmarks. Wettbewerbsfähig mit führenden proprietären Modellen auf GPQA Diamond. Geeignet für technische Forschung und wissenschaftliches Denken.
  • Wissens-RAG V4 Pro belegt den ersten Platz unter den Open-Source-Modellen für weltweites Wissen und liegt insgesamt nur hinter Gemini 3.1 Pro. Unternehmen, die RAG-Pipelines oder Dokumenten-Frage-Antwort-Systeme entwickeln, werden feststellen, dass die Recall-Rate von V4 Pro deutlich über der vergleichbarer Open-Source-Modelle liegt.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.
Kontaktieren Sie uns
api-right-1
Modell-BG02-1

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten