qwen-bg
max-ico04
En
Afuera
max-ico02
Charlar
max-ico03
activo
Referencia a vídeo de Kling Video O1
Utiliza extracción de características avanzada para preservar la identidad visual, como la apariencia, la textura y el estilo, en escenarios y movimientos completamente nuevos.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'klingai/video-o1-reference-to-video',
      prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
      image_list: [
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "klingai/video-o1-reference-to-video",
        "prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
        "image_list": [
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
        ]
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Referencia a vídeo de Kling Video O1

Detalle del producto

API Kling Video O1: Generación innovadora de referencias a video

Kuaishou's Referencia a vídeo de Kling Video O1 Ofrece una generación de video con consistencia de sujeto inigualable directamente a partir de imágenes de referencia. Este modelo multimodal unificado aprovecha la extracción avanzada de características para preservar impecablemente la identidad de personajes, accesorios y escenas en escenarios completamente nuevos y diversos, estableciendo un nuevo estándar en la creación de video con IA.

⚙️ Especificaciones técnicas

  • Soporte de entrada: Acepta imágenes de referencia individuales o múltiples (hasta 4 puntos de vista por elemento) en formatos JPG, JPEG o PNG. También se admiten referencias de vídeo opcionales de hasta 10 segundos, 200 MB y resolución 2K.
  • Capacidades de salida: Genera vídeos de entre 5 y 10 segundos de duración, con resoluciones de hasta 2K (1080p estándar) a 30 fotogramas por segundo (fps). Compatible con las relaciones de aspecto habituales, como 16:9.
  • Arquitectura del modelo: Construido sobre un potente motor multimodal unificado que incorpora Razonamiento en cadena de pensamiento (CdP), fusión de múltiples elementos y procesamiento sofisticado de visión y lenguaje para una retención precisa de la identidad y una comprensión contextual profunda.

📈 Puntos de referencia de rendimiento

Kling Video O1 destaca tanto en consistencia de identidad como en calidad de movimiento, superando a sus competidores en tareas críticas de generación de referencias:

  • ✅ Demuestra una Mejora del 247% en tareas de generación de referencias en comparación con Google Veo 3.1.
  • ✅ Se logró un Mejora del 230% encima Pista Aleph en puntos de referencia similares.
  • ✨ Presenta una estabilidad de cuadro superior, lo que reduce eficazmente el parpadeo en escenas complejas de múltiples sujetos.
  • 🧠 El razonamiento mejorado a través de CoT aumenta significativamente la precisión rápida al analizar de manera inteligente las entradas antes de la representación.
Comparación del rendimiento del Kling Video O1

🌟 Características principales de Kling Video O1

  • 🖼️ Edificio de asignaturas multirreferenciales: Extrae características completas desde diversos puntos de vista, lo que garantiza una identidad altamente estable y consistente para los sujetos dentro de escenas dinámicas.
  • 🌍 Nueva generación de escenarios: Permite la creación de contenido completamente nuevo y único, como paseos de personajes futuristas o interacciones complejas, manteniendo rigurosamente los detalles de referencia.
  • 🎛️ Modos Profesional/Estándar: Ofrece modos flexibles para equilibrar la calidad y la velocidad, junto con un soporte sólido para control avanzado de la cámara, precisión de movimiento y simulación de física realista.
  • Yong Manejo de referencias todo en uno: Fusiona de forma fluida múltiples temas (personajes, accesorios y escenas enteras) para producir resultados de video intrincados, consistentemente coherentes y de alta calidad.

Precios de la API de Kling Video O1

La API de Kling Video O1 se ofrece a una tarifa competitiva:

  • $0,1176/segundo de vídeo generado

Ejemplo de código

A continuación se muestra un ejemplo de cómo integrar la API de Kling Video O1:

Comparación con los principales modelos de IA

Kling Video O1 se destaca en el panorama competitivo de la generación de video con IA:

  • 🆚 vs. Google Veo 3.1: Kling O1 supera a Veo 3.1 en un notable 247 % en fidelidad de referencia, ofreciendo una fusión multivista superior sin pérdida de coherencia. Veo suele presentar limitaciones al gestionar interacciones complejas con sujetos.
  • 🆚 frente a Runway Gen-4.5: Kling ofrece una retención de identidad excepcional desde diversos ángulos, lo que lo hace ideal para una consistencia de nivel profesional. Runway Gen-4.5 se centra más en el movimiento basado en texto, pero presenta dificultades con la estabilidad al incorporar múltiples entradas de referencia.
  • 🆚 contra Hailuo 2.3: El razonamiento avanzado de Cadena de Pensamiento de Kling garantiza una física y un trabajo de cámara más fluidos, lo que resulta en una mayor calidad y un movimiento más natural. Hailuo 2.3 puede destacar en velocidad de generación, pero suele ser deficiente en el mantenimiento de la estabilidad del sujeto en videoclips más largos.

❓ Preguntas frecuentes (FAQ)

¿Qué es Kling Video O1 Reference-to-Video?

Kling Video O1 es un modelo de IA multimodal unificado de Kuaishou que genera videos con sujetos, accesorios y escenas consistentes directamente a partir de referencias de imágenes, incluso en nuevos escenarios.

¿Cuáles son los principales tipos de entrada admitidos por Kling Video O1?

Acepta principalmente imágenes de referencia individuales o múltiples (JPG, JPEG, PNG) con hasta 4 puntos de vista por elemento y, opcionalmente, referencias de video de hasta 10 segundos, 200 MB y resolución 2K.

¿Cuánto duran los vídeos generados por Kling Video O1 y con qué resolución?

Los videos generados suelen tener una duración de 5 a 10 segundos, con una resolución estándar de 1080p y un máximo de 2K, a 30 cuadros por segundo.

¿Qué hace que Kling Video O1 sea superior en cuanto a consistencia de identidad?

Su motor multimodal unificado, combinado con el razonamiento en cadena de pensamiento (CoT), la fusión de múltiples elementos y el procesamiento de visión-lenguaje, garantiza una retención de identidad precisa y estable en escenas complejas.

¿Cuál es el costo de utilizar la API de Kling Video O1?

La API de Kling Video O1 tiene un precio de $0,1176 por segundo de contenido de video generado.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos