



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'deepseek/deepseek-v4-pro',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-pro",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

DeepSeek V4 Pro
Das größte verfügbare Open-Weights-Modell – 1,6 Billionen Parameter, 1 Million Kontextfenster, 49 Milliarden aktive Token pro Token. Die erste Architektur, die Kontext mit Millionen von Token im Produktionsmaßstab wirtschaftlich rentabel macht.
Was ist DeepSeek V4 Pro?
DeepSeek V4 Pro ist das Flaggschiffmodell der vierten Generation von DeepSeek. Es ist das größtes derzeit verfügbares Modell mit offenen Gewichtsklassen — größer als Kimi K2.6 mit 1,1 TB und mehr als doppelt so groß wie sein Vorgänger DeepSeek V3.2 mit 685 B.
Verwendung eines Expertenmix (MoE) Das Design von V4 Pro aktiviert nur 49 Milliarden Parameter pro Token – etwa 3 % seines Gesamtgewichts. Im Kontext einer Million Token benötigt es lediglich 27 % der Inferenz-FLOPs Und 10 % der KV-Cache-Größe im Vergleich zu V3.2. Das sind keine inkrementellen Verbesserungen – sie stellen einen Quantensprung in dem dar, was im Produktionsmaßstab wirtschaftlich machbar ist.
Drei Innovationen hinter der Effizienz
Die meisten Modelle stufen Kontextfenster mit Millionen von Token als Marketingmerkmal ein. In diesem Umfang steigt der Aufwand für die Standardaufmerksamkeit quadratisch an – der Speicherbedarf explodiert, die Inferenz verlangsamt sich und die Kosten vervielfachen sich. DeepSeek löste dieses Problem mit drei architektonischen Durchbrüchen, die vor dem Start von Version 4 entwickelt und veröffentlicht wurden.
Vergleichsergebnisse
V4 Pro erzielt in Benchmarks vergleichbare Ergebnisse wie führende proprietäre Modelle in den Bereichen logisches Denken, Codierung und Wissensverarbeitung. Im SWE-bench Verified-Ranking liegt es unter den besten 4 %. 0,2 Punkte von Claude Opus 4.6 zu etwa einem Siebtel der Produktionskosten.
Denkanstrengungsmodi
V4 Pro unterstützt konfigurierbare Denkmodi – je nach Aufgabenstellung kann zwischen Geschwindigkeit und Tiefe abgewogen werden, anstatt bei jedem Anruf für maximale Denkleistung zu bezahlen.
Für wen ist DeepSeek V4 Pro geeignet?
Der 1M-Kontext, die starke agentenbasierte Codierungsleistung und der wettbewerbsfähige Preis des V4 Pro machen ihn für eine bestimmte Klasse von Arbeitslasten geeignet.
- Vollständiger Quellcode Laden Sie ein komplettes mittelgroßes Repository in den Kontext. SOTA auf Terminal-Bench und SWE-bench ermöglicht dateiübergreifendes Refactoring, Fehleruntersuchung und Architekturprüfung ohne Datenkürzung.
- Agentische Aufgaben Mehrstufige Automatisierung, Forschungssynthese und komplexe Workflow-Ausführung, bei der der Agent den Zustand über viele Durchläufe hinweg verfolgen muss. Führt Open-Source-Benchmarks für agentenbasierte Programmierung an.
- Mathematik / MINT Übertrifft alle aktuellen Open-Source-Modelle in Mathematik- und MINT-Benchmarks. Wettbewerbsfähig mit führenden proprietären Modellen auf GPQA Diamond. Geeignet für technische Forschung und wissenschaftliches Denken.
- Wissens-RAG V4 Pro belegt den ersten Platz unter den Open-Source-Modellen für weltweites Wissen und liegt insgesamt nur hinter Gemini 3.1 Pro. Unternehmen, die RAG-Pipelines oder Dokumenten-Frage-Antwort-Systeme entwickeln, werden feststellen, dass die Recall-Rate von V4 Pro deutlich über der vergleichbarer Open-Source-Modelle liegt.
KI-Spielplatz



Einloggen