



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_list: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_list": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalles del producto
🚀 API de Kling Video O1: Generación de referencias a vídeo revolucionaria
Kuaishou's Vídeo de Kling O1 Referencia al vídeo Genera vídeos con una coherencia temática sin precedentes, directamente a partir de imágenes de referencia. Este modelo multimodal unificado aprovecha la extracción avanzada de características para preservar de forma impecable la identidad de los personajes, los objetos y las escenas en escenarios completamente nuevos y diversos, estableciendo un nuevo estándar en la creación de vídeos con inteligencia artificial.
⚙️ Especificaciones técnicas
- Soporte de entrada: Admite imágenes de referencia individuales o múltiples (hasta 4 puntos de vista por elemento) en formato JPG, JPEG o PNG. También admite referencias de vídeo opcionales de hasta 10 segundos, 200 MB y resolución 2K.
- Capacidades de salida: Genera vídeos de entre 5 y 10 segundos de duración, con resoluciones de hasta 2K (estándar 1080p) a 30 fotogramas por segundo (fps). Admite sin problemas las relaciones de aspecto más comunes, incluyendo 16:9.
- Arquitectura del modelo: Construido sobre un potente motor multimodal unificado que incorpora Razonamiento de la cadena de pensamiento (CoT)Fusión de múltiples elementos y procesamiento sofisticado de visión y lenguaje para una retención precisa de la identidad y una comprensión profunda del contexto.
📈 Pruebas de rendimiento
Kling Video O1 destaca tanto por su coherencia de identidad como por su calidad de movimiento, superando a la competencia en tareas críticas de generación de referencias:
- ✅ Demuestra una Mejora del 247% en tareas de generación de referencia en comparación con Google Veo 3.1.
- ✅ Logró un Mejora del 230% encima Pista de aterrizaje Aleph en puntos de referencia similares.
- ✨ Ofrece una estabilidad de fotograma superior, lo que reduce eficazmente el parpadeo en escenas complejas con múltiples sujetos.
- 🧠 El razonamiento mejorado mediante CoT aumenta significativamente la precisión de las indicaciones al analizar de forma inteligente las entradas antes de su renderizado.
🌟 Características principales de Kling Video O1
- 🖼️ Construcción de temas con múltiples referencias: Extrae características completas desde diversos puntos de vista, lo que garantiza una identidad muy estable y coherente para los sujetos dentro de escenas dinámicas.
- 🌍 Generación de nuevos escenarios: Permite la creación de contenido totalmente novedoso y único, como caminatas de personajes futuristas o interacciones complejas, manteniendo rigurosamente los detalles de referencia.
- 🎛️ Modos profesional/estándar: Ofrece modos flexibles para equilibrar calidad y velocidad, junto con una sólida compatibilidad con el control avanzado de la cámara, una precisión de movimiento exacta y una simulación física realista.
- Yung Gestión de referencias todo en uno: Fusiona a la perfección múltiples elementos (personajes, accesorios y escenas completas) para producir vídeos complejos, coherentes y de alta calidad.
💲 Precios de la API de Kling Video O1
La API Kling Video O1 se ofrece a un precio competitivo:
- $0,1176 por segundo del vídeo generado
💻 Ejemplo de código
Aquí tienes un ejemplo de cómo integrar la API de Kling Video O1:
Comparación con los principales modelos de IA
Kling Video O1 destaca en el competitivo panorama de la generación de vídeo mediante IA:
- 🆚 vs. Google Veo 3.1: Kling O1 supera a Veo 3.1 en un notable 247 % en fidelidad de referencia, ofreciendo una fusión multivista superior sin pérdida de coherencia. Veo suele presentar limitaciones al manejar interacciones complejas entre sujetos.
- 🆚 vs. Runway Gen-4.5: Kling ofrece una retención de identidad excepcional desde diversos ángulos, lo que lo hace ideal para lograr una consistencia de nivel profesional. Runway Gen-4.5 se centra más en el movimiento basado en texto, pero presenta problemas de estabilidad al incorporar múltiples entradas de referencia.
- 🆚 vs. Hailuo 2.3: El avanzado algoritmo Chain of Thought de Kling garantiza una física y un movimiento de cámara más fluidos, lo que se traduce en una mayor calidad y una mayor naturalidad. Si bien Hailuo 2.3 destaca por su velocidad de generación, suele tener dificultades para mantener la estabilidad del sujeto en videoclips más largos.
❓ Preguntas frecuentes (FAQ)
¿Qué es Kling Video O1 Reference-to-Video?
Kling Video O1 es un modelo de IA multimodal unificado desarrollado por Kuaishou que genera vídeos con sujetos, objetos y escenas coherentes directamente a partir de imágenes de referencia, incluso en escenarios nuevos.
¿Cuáles son los principales tipos de entrada compatibles con Kling Video O1?
Admite principalmente imágenes de referencia individuales o múltiples (JPG, JPEG, PNG) con hasta 4 puntos de vista por elemento, y opcionalmente referencias de vídeo de hasta 10 segundos, 200 MB y resolución 2K.
¿Cuánto duran los vídeos generados por Kling Video O1 y con qué resolución?
Los vídeos generados suelen durar entre 5 y 10 segundos, con una resolución estándar de 1080p y un máximo de 2K, a 30 fotogramas por segundo.
¿Qué hace que Kling Video O1 sea superior en consistencia de identidad?
Su motor multimodal unificado, junto con el razonamiento de Cadena de Pensamiento (CoT), la fusión de múltiples elementos y el procesamiento de visión y lenguaje, garantiza una retención de identidad precisa y estable en escenas complejas.
¿Cuál es el coste de utilizar la API Kling Video O1?
La API Kling Video O1 tiene un precio de 0,1176 dólares por segundo de contenido de vídeo generado.
Campo de juegos de IA



Acceso