



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-image-to-video',
prompt: 'A jellyfish in the ocean',
image_url: 'https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-image-to-video",
"prompt": "A jellyfish in the ocean",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalle del producto
💡Kling Video O1: Impulsando la generación de video dinámico
El API de Kling Video O1 Es una solución de vanguardia diseñada para transformar imágenes estáticas en videos dinámicos y cautivadores. Se especializa en crear transiciones fluidas desde fotogramas iniciales y finales específicos, combinando magistralmente las entradas de imagen con indicaciones de texto definidas por el usuario para un control inigualable del movimiento, el estilo artístico y el flujo narrativo. Este potente modelo multimodal unificado está optimizado para... narración cinematográfica mediante técnicas avanzadas de interpolación de cuadros.
⚙️Especificaciones técnicas
- • Arquitectura: Construido sobre la robusta Modelo de base de vídeo multimodal Kling O1, incorporando razonamiento en cadena de pensamiento (CoT) para un análisis rápido y preciso y una fidelidad de salida significativamente mejorada.
- • Formatos de entrada: Acepta una variedad de entradas de imágenes, incluidas .png, .jpeg, .tiff y .webp, junto con indicaciones de texto completas para guiar la animación de cuadros.
- • Formatos de salida: Genera alta calidad Vídeo MP4 clips con duraciones de 5 o 10 segundos, compatibles con relaciones de aspecto flexibles de hasta 16:9.
🚀Puntos de referencia de rendimiento
Kling O1 logra un liderazgo en la industria consistencia del movimiento, lo que garantiza que los personajes y objetos conserven sus propiedades impecablemente sin deformarse. Esto representa un avance significativo con respecto a los modelos anteriores en términos de estabilidad fotograma a fotograma. El paso de razonamiento integrado mejora la calidad general, ofreciendo flujos de cámara realistas en clips de 5 a 10 segundos con resoluciones de hasta 2K. Las pruebas de rendimiento destacan constantemente su excelente manejo de la física compleja y las interacciones entre múltiples sujetos, en particular. superando a Kling 2.1.
✨Características principales de Kling Video O1
- • Motor multimodal: Procesa imágenes, vídeos y entradas de texto para lograr una precisión transferencia de estilo, preservación precisa de elementos y simulaciones de física natural, incluido el movimiento de fluidos y la dinámica de los tejidos.
- • Interpolación de cuadros avanzada: Anima de forma fluida transiciones entre fotogramas clave, manteniendo de forma constante la identidad del sujeto y los intrincados detalles ambientales a lo largo de toda la secuencia de vídeo.
- • Controles de cámara sofisticados: Ofrece un control granular sobre los movimientos de la cámara, lo que permite realizar panorámicas, inclinaciones y tomas de seguimiento de gran precisión, lo que reduce significativamente los artefactos visuales en escenas dinámicas.
- • Generación basada en referencia: Admite la integración de 1 a 7 imágenes de referencia, lo que garantiza una sólida consistencia multielemento. Esta función es ideal para mantener la estabilidad de personajes u objetos en diversos ángulos y escenarios complejos.
💲Precios de la API de Kling O1
La API Kling O1 tiene un precio competitivo en $0,1176 por segundo de salida de vídeo generada.
💻Ejemplo de código
Integre la funcionalidad de imagen a video de Kling Video O1 con este sencillo fragmento:
nombre-datos = "video.imagen-a-video" modelo-datos = "klingai/video-o1-imagen-a-video" > ⚖️Comparaciones de modelos
Kling O1 contra Kling 2.1: Kling O1 presenta un avanzado Razonamiento de CoT y apoya entradas multimodales, logrando aproximadamente 2 veces mayor precisión de movimiento y una consistencia superior del tema. Kling 2.1, en cambio, se centra en la conversión de imagen a vídeo estándar y rentable sin estas funciones de edición avanzadas.
Kling O1 contra Runway Gen-4: O1 se distingue por su excepcional interpolación específica del cuadro y un realismo físico avanzado, especialmente para clips de 5 a 10 segundos. Si bien Gen-4 prioriza el contenido de texto a video más largo, presenta limitaciones en la estabilidad de referencia multiimagen en comparación con Kling O1.
Kling O1 frente a Google Veo 3.1: Kling O1 proporciona conservación superior de elementos al animar entre fotogramas duales y permite ediciones conversacionales sofisticadas para una mayor precisión. Si bien Veo 3.1 podría ofrecer capacidades para la generación de video RAW más largo, Kling O1 es la opción preferida para aplicaciones comerciales que exigen alta precisión y ofrece una mayor Tarifa por segundo rentable.
❓Preguntas frecuentes
Pregunta 1: ¿Cuál es la funcionalidad principal de Kling Video O1?
A: Kling Video O1 transforma fotogramas estáticos de inicio y fin en vídeos dinámicos, aprovechando indicaciones de texto para controlar el movimiento y el estilo, especializándose en la narración cinematográfica a través de la interpolación de fotogramas.
Pregunta 2: ¿Cómo garantiza Kling O1 una alta consistencia de movimiento?
R: Utiliza una arquitectura multimodal unificada con razonamiento en cadena de pensamiento (CoT), que analiza profundamente las indicaciones para garantizar que los personajes y los objetos conserven sus propiedades sin transformarse a lo largo del video, superando a los modelos anteriores en estabilidad.
Pregunta 3: ¿Cuáles son las principales ventajas de Kling O1 en comparación con Kling 2.1?
R: Kling O1 cuenta con razonamiento CoT y entradas multimodales, lo que da como resultado una precisión de movimiento y una consistencia del sujeto aproximadamente dos veces mejores, que están ausentes en las capacidades de imagen a video más básicas de Kling 2.1.
Pregunta 4: ¿Puede el Kling O1 gestionar movimientos de cámara complejos?
R: Sí, ofrece controles de cámara avanzados para realizar movimientos panorámicos, inclinaciones y tomas de seguimiento precisos, diseñados para minimizar los artefactos y garantizar una alta precisión de movimiento en escenas dinámicas.
Pregunta 5: ¿Cuáles son las especificaciones de salida del Kling Video O1?
A: Produce videos MP4 con duraciones de 5 o 10 segundos, admite relaciones de aspecto de hasta 16:9 y capacidades para resoluciones de hasta 2K.
Patio de juegos de IA



Acceso