



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_list: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_list": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalle del producto
API Kling Video O1: Generación innovadora de referencias a video
Kuaishou's Referencia a vídeo de Kling Video O1 Ofrece una generación de video con consistencia de sujeto inigualable directamente a partir de imágenes de referencia. Este modelo multimodal unificado aprovecha la extracción avanzada de características para preservar impecablemente la identidad de personajes, accesorios y escenas en escenarios completamente nuevos y diversos, estableciendo un nuevo estándar en la creación de video con IA.
⚙️ Especificaciones técnicas
- Soporte de entrada: Acepta imágenes de referencia individuales o múltiples (hasta 4 puntos de vista por elemento) en formatos JPG, JPEG o PNG. También se admiten referencias de vídeo opcionales de hasta 10 segundos, 200 MB y resolución 2K.
- Capacidades de salida: Genera vídeos de entre 5 y 10 segundos de duración, con resoluciones de hasta 2K (1080p estándar) a 30 fotogramas por segundo (fps). Compatible con las relaciones de aspecto habituales, como 16:9.
- Arquitectura del modelo: Construido sobre un potente motor multimodal unificado que incorpora Razonamiento en cadena de pensamiento (CdP), fusión de múltiples elementos y procesamiento sofisticado de visión y lenguaje para una retención precisa de la identidad y una comprensión contextual profunda.
📈 Puntos de referencia de rendimiento
Kling Video O1 destaca tanto en consistencia de identidad como en calidad de movimiento, superando a sus competidores en tareas críticas de generación de referencias:
- ✅ Demuestra una Mejora del 247% en tareas de generación de referencias en comparación con Google Veo 3.1.
- ✅ Se logró un Mejora del 230% encima Pista Aleph en puntos de referencia similares.
- ✨ Presenta una estabilidad de cuadro superior, lo que reduce eficazmente el parpadeo en escenas complejas de múltiples sujetos.
- 🧠 El razonamiento mejorado a través de CoT aumenta significativamente la precisión rápida al analizar de manera inteligente las entradas antes de la representación.
🌟 Características principales de Kling Video O1
- 🖼️ Edificio de asignaturas multirreferenciales: Extrae características completas desde diversos puntos de vista, lo que garantiza una identidad altamente estable y consistente para los sujetos dentro de escenas dinámicas.
- 🌍 Nueva generación de escenarios: Permite la creación de contenido completamente nuevo y único, como paseos de personajes futuristas o interacciones complejas, manteniendo rigurosamente los detalles de referencia.
- 🎛️ Modos Profesional/Estándar: Ofrece modos flexibles para equilibrar la calidad y la velocidad, junto con un soporte sólido para control avanzado de la cámara, precisión de movimiento y simulación de física realista.
- Yong Manejo de referencias todo en uno: Fusiona de forma fluida múltiples temas (personajes, accesorios y escenas enteras) para producir resultados de video intrincados, consistentemente coherentes y de alta calidad.
Precios de la API de Kling Video O1
La API de Kling Video O1 se ofrece a una tarifa competitiva:
- $0,1176/segundo de vídeo generado
Ejemplo de código
A continuación se muestra un ejemplo de cómo integrar la API de Kling Video O1:
Comparación con los principales modelos de IA
Kling Video O1 se destaca en el panorama competitivo de la generación de video con IA:
- 🆚 vs. Google Veo 3.1: Kling O1 supera a Veo 3.1 en un notable 247 % en fidelidad de referencia, ofreciendo una fusión multivista superior sin pérdida de coherencia. Veo suele presentar limitaciones al gestionar interacciones complejas con sujetos.
- 🆚 frente a Runway Gen-4.5: Kling ofrece una retención de identidad excepcional desde diversos ángulos, lo que lo hace ideal para una consistencia de nivel profesional. Runway Gen-4.5 se centra más en el movimiento basado en texto, pero presenta dificultades con la estabilidad al incorporar múltiples entradas de referencia.
- 🆚 contra Hailuo 2.3: El razonamiento avanzado de Cadena de Pensamiento de Kling garantiza una física y un trabajo de cámara más fluidos, lo que resulta en una mayor calidad y un movimiento más natural. Hailuo 2.3 puede destacar en velocidad de generación, pero suele ser deficiente en el mantenimiento de la estabilidad del sujeto en videoclips más largos.
❓ Preguntas frecuentes (FAQ)
¿Qué es Kling Video O1 Reference-to-Video?
Kling Video O1 es un modelo de IA multimodal unificado de Kuaishou que genera videos con sujetos, accesorios y escenas consistentes directamente a partir de referencias de imágenes, incluso en nuevos escenarios.
¿Cuáles son los principales tipos de entrada admitidos por Kling Video O1?
Acepta principalmente imágenes de referencia individuales o múltiples (JPG, JPEG, PNG) con hasta 4 puntos de vista por elemento y, opcionalmente, referencias de video de hasta 10 segundos, 200 MB y resolución 2K.
¿Cuánto duran los vídeos generados por Kling Video O1 y con qué resolución?
Los videos generados suelen tener una duración de 5 a 10 segundos, con una resolución estándar de 1080p y un máximo de 2K, a 30 cuadros por segundo.
¿Qué hace que Kling Video O1 sea superior en cuanto a consistencia de identidad?
Su motor multimodal unificado, combinado con el razonamiento en cadena de pensamiento (CoT), la fusión de múltiples elementos y el procesamiento de visión-lenguaje, garantiza una retención de identidad precisa y estable en escenas complejas.
¿Cuál es el costo de utilizar la API de Kling Video O1?
La API de Kling Video O1 tiene un precio de $0,1176 por segundo de contenido de video generado.
Patio de juegos de IA



Acceso