



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/veo-3.1-i2v',
prompt: 'A jellyfish in the ocean',
image_url: 'https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "google/veo-3.1-i2v",
"prompt": "A jellyfish in the ocean",
"image_url": "https://upload.wikimedia.org/wikipedia/commons/3/35/Maldivesfish2.jpg",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
💡 Veo 3.1: Transformando imagens em vídeos cinematográficos
O Veo 3.1 , desenvolvido pelo Google DeepMind, é um modelo avançado de geração de vídeo projetado para converter imagens estáticas em sequências de vídeo fluidas e cinematográficas. Ele se destaca na criação de movimentos naturais, iluminação realista e trilhas sonoras contextuais, tornando-o altamente versátil para diversas aplicações multimídia.
🔧 Especificações Técnicas
- Tipos de entrada: Imagem estática única
- Duração do vídeo: até 8 segundos
- Resolução máxima: 720p
- Formatos suportados: Horizontal (16:9) e Vertical (9:16)
- Áudio: Geração de áudio contextual nativa integrada
Indicadores de desempenho
- Duração do vídeo: Geração estável de clipes de até 8 segundos sem perda significativa de qualidade.
- Qualidade da resolução: Mantém imagens nítidas em até 720p com efeitos de iluminação natural.
- Realismo de movimento: Alta fidelidade nos movimentos de câmera e animações de objetos que imitam a física do mundo real.
- Sincronização de áudio: Trilha sonora e efeitos sonoros perfeitamente sincronizados com os eventos visuais e o contexto.
⭐ Principais características
- Animação Cinematográfica: Adiciona movimentos de câmera, incluindo panorâmica, inclinação, zoom e efeitos de dolly para criar profundidade e volume.
- Interpolação de quadros: Suporta animações de um único quadro e transições suaves entre diferentes imagens.
- Geração de áudio contextual: gera automaticamente trilhas sonoras e efeitos sonoros que se sincronizam com a ação na tela.
- Compreensão contextual: interpreta o conteúdo visual e as instruções textuais para orientar o fluxo da cena e a atmosfera.
💰 Preços da API Veo 3.1
- US$ 0,21/seg (áudio desligado)
- US$ 0,42/seg (áudio ligado)
📊 Casos de uso
- Criação de conteúdo de marketing: Gere vídeos promocionais curtos e envolventes a partir de imagens estáticas.
- Histórias para redes sociais: Produza vídeos verticais otimizados para plataformas como Instagram e TikTok.
- Storyboard cinematográfico: Visualize cenas complexas usando quadros inicial e final com interpolações suaves.
- Apresentações multimídia: aprimore imagens estáticas com movimento dinâmico e áudio para apresentações impactantes.
- Expressão Criativa: Inserir novos personagens ou objetos em conteúdo de vídeo para fins narrativos ou artísticos.
💻 Exemplo de código
// Example API call for Veo 3.1 Image-to-Video generation POST /v1/video/generate // Request Body { "model" : "google/veo-3.1-i2v" , "image_url" : "https://example.com/static-image.jpg" , "prompt" : "A serene landscape with gentle camera pan and a bird flying in the distance." , "duration_seconds" : 5 , "audio_enabled" : true , "resolution" : "720p" }
📈 Comparação com outros modelos
- vs. Vídeo de imagem: O Veo 3.1 é especializado na transformação de imagens estáticas em vídeo com áudio nativo. O Imagen Video concentra-se principalmente na síntese de texto para vídeo, sem design de som integrado.
- vs. Pista de pouso Gen-4: O Veo 3.1 oferece áudio contextual de alta qualidade e efeitos de câmera cinematográficos. O Runway Gen-4 prioriza a geração de vídeo em alta resolução, mas geralmente requer processamento de áudio externo.
- vs. Meta Make-A-Video: O Veo 3.1 suporta inserção detalhada de objetos após a geração e múltiplas proporções de tela. O Make-A-Video oferece geração de texto para vídeo mais abrangente, mas não possui áudio integrado.
🔗 Integração de API
Acesse o Veo 3.1 por meio da API de IA/ML. Para obter documentação completa, consulte o Documentação da API de conversão de imagem em vídeo do Veo 3.1.
❓ Perguntas frequentes (FAQ)
P: O que é o modelo de IA de imagem para vídeo Veo 3.1?
A: O Veo 3.1 Image to Video é um modelo avançado de IA que transforma imagens estáticas em vídeos dinâmicos e animados, gerando movimento coerente, movimentos de câmera e evolução de cena, preservando a qualidade visual e a composição da imagem original.
P: Quais são as principais características do Veo 3.1?
A: Os principais recursos incluem animação cinematográfica com diversos efeitos de câmera, interpolação suave de quadros, geração automática de áudio contextual e compreensão contextual sofisticada para orientar o fluxo da cena e a atmosfera.
P: Qual é a duração e a resolução máximas de vídeo suportadas?
A: O Veo 3.1 pode gerar vídeos com duração de até 8 segundos e resolução máxima de 720p, garantindo uma geração estável sem perda significativa de qualidade.
P: Como o Veo 3.1 lida com a geração de áudio?
A: O Veo 3.1 integra a geração de áudio contextual nativo, criando automaticamente trilhas sonoras e efeitos sonoros que são sincronizados com precisão com os eventos visuais e o contexto geral do vídeo gerado.
P: O Veo 3.1 pode ser usado para fins comerciais?
R: Sim, o Veo 3.1 Image to Video é altamente adequado para aplicações comerciais, como conteúdo de marketing, stories para redes sociais, storyboard cinematográfico e apresentações multimídia, sujeito aos termos de serviço da API de IA/ML.
Playground de IA



Conecte-se