qwen-bg
max-ico04
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Kandinsky 5 Destilar
Este modelo es ideal para desarrolladores, creadores de contenido e investigadores que necesitan generar contenido de video a partir de indicaciones de texto de manera eficiente.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'sber-ai/kandinsky5-distill-t2v',
      prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "sber-ai/kandinsky5-distill-t2v",
        "prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background"
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Kandinsky 5 Destilar

Detalle del producto

API de Kandinsky 5 Distill: Conversión de texto a vídeo ligera y ultrarrápida

Kandinsky 5 Distill es una versión avanzada y optimizada del potente modelo de difusión de texto a vídeo Kandinsky 5. Diseñado para una velocidad y eficiencia inigualables,... acelera la generación de vídeo Sin comprometer la calidad artística. Esto lo convierte en la opción perfecta para la creación rápida de prototipos, la exploración creativa y la generación de contenido impactante que requiere previsualizaciones rápidas y flujos de trabajo iterativos. Experimente resultados de video de alta calidad con una velocidad excepcional, lo que hará que su proceso creativo sea más ágil y productivo.

⚙️ Especificaciones técnicas

  • Tipo de modelo: Modelo de difusión latente que emplea una arquitectura de Transformador de Difusión (DiT).
  • Incrustaciones de texto: Aprovecha Qwen2.5-VL y CLIP para un condicionamiento semántico sólido, lo que garantiza que sus indicaciones se comprendan en profundidad.
  • Codificación de vídeo: Utiliza el autocodificador variacional 3D (VAE) de HunyuanVideo para comprimir videos de manera eficiente en un espacio latente.
  • Mejoramiento: El proceso de destilación significativamente reduce la sobrecarga computacional, lo que conduce a tiempos de inferencia drásticamente más rápidos.
  • Aporte: Acepta indicaciones de texto intuitivas en lenguaje natural.
  • Producción: Genera vídeos de alta calidad con duraciones personalizables, que normalmente varían entre 5 y 10 segundos.

Puntos de referencia de rendimiento

  • Velocidad de inferencia: Logra un aceleración sustancial en comparación con el Kandinsky 5 original, lo que lo hace ideal para vistas previas en tiempo real y aplicaciones interactivas.
  • Calidad: Mantiene una alta calidad perceptiva, ofreciendo detalles finos y una progresión temporal coherente en los fotogramas de vídeo generados.
  • Eficiencia de recursos: Cuenta con un menor consumo de memoria de GPU, lo que permite su uso en GPU convencionales para tareas de generación de video rápidas y accesibles.

Características principales

  • Generación de velocidad optimizada: Diseñado desde cero para una síntesis de video más rápida sin pérdida significativa de fidelidad.
  • Resultados de alta calidad: Mantiene una riqueza visual y semántica comparable al modelo completo Kandinsky 5, lo que garantiza resultados sorprendentes.
  • Fácil de usar: Admite entradas de lenguaje natural, lo que permite una iteración rápida y una integración perfecta en flujos de trabajo creativos.
  • Compatible con código abierto: Construido sobre arquitecturas de difusión abiertas, fomentando la investigación, la personalización y las contribuciones de la comunidad.
  • Acondicionamiento de texto incorporado: Cuenta con profundos mecanismos de atención cruzada que garantizan que las indicaciones de texto tengan una influencia fuerte y precisa en el contenido de video generado.

💰 Precios de la API de Kandinsky 5 Distill

Experimente la generación de texto a video de vanguardia a un precio accesible: $0,105 por segundo de vídeo generado.

💡 Casos de uso versátiles

  • Prototipado rápido: Visualice rápidamente guiones gráficos, ideas conceptuales y borradores de diseño con una velocidad sin precedentes.
  • Vistas previas de contenido: Genere borradores rápidos para campañas en redes sociales, imágenes publicitarias o fragmentos de videos musicales.
  • Sandbox creativo: Experimente libremente con diversos estilos artísticos y técnicas avanzadas de ingeniería de indicaciones para desbloquear nuevas vías creativas.
  • Demostraciones educativas: Muestre las capacidades dinámicas de la IA de texto a video en entornos de tiempo real o casi en tiempo real con fines educativos o demostrativos.
  • Integración de aplicaciones: Potencie sin problemas las funciones dentro de las aplicaciones que requieren retroalimentación inmediata de generación de video y creación rápida de contenido visual.

💻 Ejemplo de código de generación

A continuación se muestra un ejemplo de cómo interactuar con la API Kandinsky 5 Distill para la generación de videos:

 importar solicitudes API_URL = "YOUR_API_ENDPOINT/sber-ai/kandinsky5-distill-t2v" # Reemplazar con el punto final real headers = {"Authorization": "Bearer YOUR_API_KEY"} # Reemplazar con su clave API real payload = { "prompt": "Una ciudad futurista al atardecer, autos voladores, luces de neón, muy detallada, cinematográfica", "duration": 7, # Generar un video de 7 segundos "resolution": "512x512" # Especificar la resolución del video } response = requests.post(API_URL, headers=headers, json=payload) response.raise_for_status() # Generar una excepción para errores HTTP video_generation_id = response.json()["id"] print(f"Generación de video iniciada con ID: {video_generation_id}") 

🎬 Ejemplo de código de salida

Después de iniciar una generación, puede obtener la salida (por ejemplo, URL del video) utilizando el siguiente código:

 importar solicitudes importar tiempo API_URL_FETCH = "YOUR_API_ENDPOINT/video_generations/{video_generation_id}" # Reemplazar con el punto final real headers = {"Authorization": "Bearer YOUR_API_KEY"} # Suponiendo que video_generation_id se obtuvo del ejemplo de generación anterior # Para la demostración, usemos un marcador de posición if not # video_generation_id = "your_actual_generation_id_here" status = "pending" while status == "pending": response = requests.get(API_URL_FETCH.format(video_generation_id=video_generation_id), headers=headers) response.raise_for_status() result = response.json() status = result.get("status") if status == "completed": video_url = result.get("output_url") print(f"Video generado exitosamente: {video_url}") elif status == "failed": print(f"Error en la generación del video: {result.get('error')}") break else: print(f"Estado del video: {status}. Esperando...") time.sleep(10) # Espere 10 segundos antes de volver a verificar 

⚖️ Comparación con otros modelos

Comprender la posición única de Kandinsky 5 Distill en el panorama del texto a vídeo:

  • vs. Kandinsky 5 Estándar: Destilar ofertas tiempos de generación significativamente más rápidos, lo que lo hace superior para iteraciones rápidas y previsualizaciones. Si bien el Kandinsky 5 original podía aportar matices ligeramente más profundos en generaciones muy complejas, Distill mantiene una excelente calidad para la gran mayoría de aplicaciones prácticas.
  • vs. Modelos de vídeo de difusión estable: Kandinsky 5 Distill ofrece capacidades especializadas de conversión de texto a video con una arquitectura optimizada basada en transformadores, que frecuentemente produce videos que son más preciso semánticamente y coherente temporalmenteLas variantes de difusión estable suelen ser más generales, pero pueden ser más lentas o presentar menos consistencia temporal en las salidas de video.
  • vs. Imagen Video: Kandinsky 5 Distill prioriza velocidad y accesibilidad, basado en arquitecturas abiertas. Por el contrario, Imagen Video es un modelo propietario centrado en la altísima calidad, generalmente con un mayor coste computacional y acceso limitado.

🔗 Integración de API

La API de Kandinsky 5 Distill es fácilmente accesible a través de la API de IA/ML. La documentación completa para la integración está disponible. disponible aquí.

Preguntas frecuentes (FAQ)

  • P: ¿Qué es Kandinsky 5 Distill y cuál es su principal beneficio?

    R: Kandinsky 5 Distill es un modelo de difusión de texto a vídeo optimizado y ligero. Su principal ventaja es la generación de vídeo considerablemente más rápida, manteniendo una alta calidad visual, ideal para la creación rápida de prototipos y flujos de trabajo creativos iterativos.

  • P: ¿Cómo se compara Kandinsky 5 Distill en velocidad y calidad con el Kandinsky 5 original?

    R: Distill logra una aceleración sustancial en las vistas previas en tiempo real en comparación con la versión original, lo que la hace mucho más rápida. Mantiene una alta calidad perceptual con detalles finos, ideal para la mayoría de las aplicaciones prácticas, aunque la versión completa podría ofrecer algo más de matices en escenarios extremadamente complejos.

  • P: ¿Cuáles son algunos casos de uso típicos de Kandinsky 5 Distill?

    R: Es excelente para creación rápida de prototipos (guiones gráficos, conceptos), vistas previas de contenido (redes sociales, anuncios), entornos sandbox creativos, demostraciones educativas e integración en aplicaciones que requieren retroalimentación de generación de video rápida.

  • P: ¿Cuáles son los tipos de entrada y salida de la API Kandinsky 5 Distill?

    R: La API toma indicaciones de texto en lenguaje natural como entrada y genera videos generados de alta calidad con duraciones personalizables (por ejemplo, 5 a 10 segundos).

  • P: ¿Kandinsky 5 Distill es eficiente en el uso de recursos?

    R: Sí, es altamente eficiente en el uso de recursos con un menor consumo de memoria de GPU, lo que permite su uso en GPU convencionales para tareas rápidas de generación de video.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos