



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/veo-3.1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_urls: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "google/veo-3.1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_urls": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalle del producto
Presentamos Veo 3.1 Reference-to-Video
Google DeepMind Referencia a vídeo de Veo 3.1 Es un modelo avanzado de IA que establece nuevos estándares en la generación de video. Ofrece a los usuarios un control creativo inigualable, permitiéndoles controlar el estilo del video y la composición de la escena usando imágenes de referencia. Esta innovadora funcionalidad garantiza... consistencia artística e integración perfecta de elementos de la escena. Veo 3.1 produce de forma nativa vídeos de 8 segundos de alta fidelidad en Resolución de 720p o 1080p, completo con audio sincronizado para una experiencia sensorial completa.
Fuente: Veo 3.1 - Ingredients to video
Especificaciones técnicas y rendimiento
✅ Especificaciones principales
- Modalidades de entrada: Texto a vídeo, Imagen a vídeo (imágenes de referencia), Vídeo a vídeo
- Resolución de salida: 720p y 1080p (relación de aspecto 16:9)
- Duración del vídeo: 8 segundos máximo al utilizar imágenes de referencia (ampliable para narraciones más largas)
- Velocidad de cuadros: 24 fps para un movimiento fluido
- Audio: Generado de forma nativa y perfectamente sincronizado con el contenido de vídeo.
📈 Puntos de referencia de rendimiento
- Vídeos visualmente ricos: Genera videos impresionantes con iluminación realista, sombras intrincadas y movimientos fluidos en cuestión de minutos.
- Estilos cinematográficos y diversos: Se destaca en la adaptación y preservación de diversos estilos cinematográficos y artísticos a partir de imágenes de referencia, garantizando la cohesión del diseño.
- Estable y en evolución: Ofrece disponibilidad de modelos estables, con mejoras continuas y funciones avanzadas actualmente en vista previa.
Características principales de Veo 3.1
- 🖼️ Control de referencia a vídeo: Aproveche hasta tres imágenes de referencia para determinar con precisión el estilo estético y el diseño intrincado de la escena.
- 🎵 Generación de audio nativo: Produce automáticamente música sincronizada de alta calidad o efectos de sonido atractivos que complementan perfectamente su video.
- 💻 Resolución de alta definición: Ofrece una salida de 720p y 1080p de calidad profesional, ideal para una amplia gama de aplicaciones.
- ⏱️ Duración del vídeo corto: Optimizado para crear clips impactantes de hasta 8 segundos, perfecto para contenido dinámico y conciso.
- ⭐ Generación específica de trama: Obtenga el máximo control al definir el primer y el último fotograma, lo que permite generar secuencias de vídeo precisas.
- 📏 Extensión de vídeo: Amplíe sin problemas vídeos generados previamente para contar historias más largas o crear narrativas extendidas.
Precios de la API
- 💰 $0,21/seg (audio apagado)
- 💰 $0,42/seg (audio activado)
Una solución rentable para la generación de vídeo de alta calidad adaptada a sus necesidades.
Casos de uso versátiles
- 🎦 Cine y storyboard: Agilice la creación de clips cinematográficos cortos a partir de indicaciones de texto e imágenes de referencia, ideales para la previsualización.
- 📂 Publicidad y marketing: Produzca promociones de productos atractivas y vídeos dinámicos para redes sociales de forma eficiente y rentable.
- 📱 Contenido de redes sociales: Genere cortos, TikToks y Reels cautivadores con audiovisuales estilizados únicos para lograr el máximo impacto.
- 🎓 Vídeos educativos: Desarrollar recursos didácticos animados y contenido instructivo enriquecido con sonido sincronizado generado por IA.
Consideraciones importantes
- 💭 Imágenes de referencia óptimas: Las imágenes de referencia producen mejores resultados cuando representan claramente el tema y el estilo artístico deseados.
- 💭 Aprovechar múltiples referencias: El uso de múltiples imágenes de referencia mejora la capacidad del modelo para comprender e integrar diversos elementos de la escena y composiciones complejas.
- 💭 Optimización de contenido de formato corto: Veo 3.1 está específicamente optimizado para generar videoclips cortos y de alta calidad, lo que lo hace ideal para contenido conciso e impactante en lugar de producciones extensas.
Ejemplo de código y detalles de la API
Para obtener guías completas de integración de API, ejemplos de código y documentación detallada sobre el uso de Veo 3.1, consulte la documentación oficial de la API de IA/ML:
Acceda a la documentación de la API de Veo 3.1
(Los desarrolladores encontrarán fragmentos de código integrados y ejemplos interactivos dentro de la documentación vinculada).
Veo 3.1 comparado con otros modelos líderes
📈 Veo 3.1 vs. Sora 2
Veo 3.1 se distingue por superar a Sora 2 en Realismo visual, coherencia de escena y sincronización audiovisual crucialEsto hace que Veo 3.1 sea especialmente adecuado para la narrativa cinematográfica y la producción de vídeo comercial. Si bien Sora 2 es reconocido por su rápida generación, Veo 3.1 ofrece duraciones más largas y transiciones multiescena superiores con una calidad profesional mejorada.
📈 Veo 3.1 vs. Veo 3.0
Veo 3.1 representa un avance significativo respecto a Veo 3.0. Amplía la duración del vídeo de hasta 12 segundos a una impresionante... 60 segundos y eleva la resolución de 720p a nítida Alta definición 1080pLas novedades clave incluyen audio sincronizado nativo, control avanzado de múltiples escenas, ajustes preestablecidos de cámara cinematográfica integrados y una continuidad enormemente mejorada de los personajes y la iluminación, transformándolo en un instrumento narrativo de nivel de director.
📈 Veo 3.1 frente a Kling 2.1
Kling 2.1 ofrece una generación de vídeo con un estilo potente, pero generalmente produce clips más cortos con una composición de escena menos compleja. La capacidad de Veo 3.1 para generar... Vídeos fluidos de un minuto de duración con audio integrado y efectos cinematográficos Proporciona una ventaja definitiva para proyectos que exigen vídeos narrativos pulidos con un flujo audiovisual consistente.
📈 Veo 3.1 frente a Wan 2.5
Wan 2.5 se centra en la generación rápida de vídeo con una estructuración básica de escenas. Sin embargo, carece de las transiciones de escena multitoma avanzadas y las robustas capacidades de generación de audio de Veo 3.1. La integración de preajustes cinematográficos y el control detallado de escenas de Veo es, por naturaleza, más adecuada para crear contenido de vídeo altamente dirigido y con matices profesionales.
Preguntas frecuentes (FAQ)
❓ ¿Qué es Veo 3.1 Reference-to-Video?
Veo 3.1 es el modelo avanzado de IA de Google DeepMind para generar videos de alta fidelidad. Permite a los usuarios controlar el estilo del video y la composición de la escena mediante imágenes de referencia, lo que garantiza la coherencia artística y la flexibilidad creativa.
❓ ¿Cómo funciona el control de imagen de referencia?
Los usuarios pueden subir hasta tres imágenes de referencia. El modelo las analiza para capturar los estilos artísticos, las paletas de colores, la iluminación y la distribución de las escenas deseadas, integrando estas pistas visuales en el vídeo generado según las indicaciones textuales.
❓ ¿Cuáles son las especificaciones de salida clave de Veo 3.1?
Genera vídeos de hasta 8 segundos de duración (con posibilidad de extensión), con resolución de 720p o 1080p, relación de aspecto de 16:9 y 24 fotogramas por segundo. Una característica destacada es su generación nativa de audio sincronizado, perfectamente adaptado al contenido del vídeo.
❓ How does Veo 3.1 improve upon Veo 3.0?
Veo 3.1 ofrece avances significativos, que incluyen una mayor duración del video hasta 60 segundos (desde 12), una mayor resolución HD de 1080p (desde 720p), audio sincronizado nativo, control de múltiples escenas y ajustes preestablecidos de cámara cinematográfica avanzados, lo que lo convierte en una herramienta narrativa más completa.
❓ ¿Cuáles son las principales aplicaciones de Veo 3.1?
Veo 3.1 es ideal para diversas aplicaciones, como la creación de guiones gráficos de películas, la creación de contenido publicitario y de marketing atractivo, la producción de videos dinámicos para redes sociales (como Shorts, TikToks y Reels) y el desarrollo de materiales educativos animados con sonido generado por IA.
Patio de juegos de IA



Acceso