Fora

Bater papo

desativar

Veo 3.1 Referência ao vídeo

O áudio nativo pode ser criado e sincronizado automaticamente com o conteúdo visual, melhorando o realismo e a coerência da saída.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/veo-3.1-reference-to-video',
      prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
      image_urls: [
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "google/veo-3.1-reference-to-video",
        "prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
        "image_urls": [
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
        ]
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

Veo 3.1 Referência ao vídeo

Detalhes do produto

Apresentando o Veo 3.1 Reference-to-Video

Google DeepMind Veo 3.1 Referência ao vídeo é um modelo avançado de IA que estabelece novos padrões na geração de vídeos. Ele oferece aos usuários um controle criativo incomparável, permitindo que eles orientem o estilo do vídeo e a composição da cena usando imagens de referência. Essa funcionalidade inovadora garante consistência artística e integração perfeita de elementos de cena. O Veo 3.1 produz nativamente vídeos de alta fidelidade de 8 segundos em Resolução 720p ou 1080p, com áudio sincronizado para uma experiência sensorial completa.

Fonte: Veo 3.1 - Ingredientes para vídeo

Especificações técnicas e desempenho

✅ Especificações principais

Modalidades de entrada: Texto para vídeo, Imagem para vídeo (Imagens de referência), Vídeo para vídeo
Resolução de saída: 720p e 1080p (proporção de aspecto 16:9)
Duração do vídeo: Tempo máximo de 8 segundos ao usar imagens de referência (expansível para narrativas mais longas).
Taxa de quadros: 24 fps para movimentos suaves
Áudio: Gerado nativamente e perfeitamente sincronizado com o conteúdo de vídeo.

📈 Indicadores de desempenho

Vídeos visualmente ricos: Gera vídeos impressionantes com iluminação realista, sombras complexas e movimentos fluidos em poucos minutos.
Estilos cinematográficos e diversos: Destaca-se na adaptação e preservação de diversos estilos cinematográficos e artísticos a partir de imagens de referência, garantindo a coesão do layout.
Estável e em evolução: Oferece disponibilidade estável do modelo, com melhorias contínuas e recursos avançados atualmente em versão prévia.

Principais características do Veo 3.1

🖼️ Controle de referência ao vídeo: Utilize até três imagens de referência para definir com precisão o estilo estético e o layout detalhado da cena.
🎵 Geração de áudio nativo: Gera automaticamente música sincronizada de alta qualidade ou efeitos sonoros envolventes que complementam perfeitamente o seu vídeo.
💻 Resolução de alta definição: Oferece saída de qualidade profissional em 720p e 1080p, ideal para uma ampla gama de aplicações.
⏱️ Duração do vídeo: Otimizado para criar vídeos impactantes de até 8 segundos, perfeito para conteúdo dinâmico e conciso.
⭐ Geração específica de quadros: Obtenha controle total definindo o primeiro e o último quadro, permitindo a geração de sequências de vídeo precisas.
📏 Extensão de vídeo: Expanda vídeos gerados anteriormente de forma integrada para contar histórias mais longas ou criar narrativas mais extensas.

Preços da API

💰 US$ 0,21/seg (áudio desligado)
💰 US$ 0,42/seg (áudio ligado)

Uma solução econômica para geração de vídeos de alta qualidade, personalizada para suas necessidades.

Casos de uso versáteis

🎦 Filme e Storyboard: Agilize a criação de vídeos curtos cinematográficos a partir de textos e imagens de referência, ideais para pré-visualização.
📂 Publicidade e Marketing: Produza promoções de produtos envolventes e vídeos dinâmicos para redes sociais de forma eficiente e econômica.
📱 Conteúdo para redes sociais: Crie vídeos curtos, TikToks e Reels cativantes com recursos audiovisuais estilizados exclusivos para obter o máximo impacto.
🎓 Vídeos educativos: Desenvolver recursos didáticos animados e conteúdo instrucional enriquecido com som sincronizado gerado por IA.

Considerações importantes

💭 Imagens de referência ideais: Imagens de referência produzem os melhores resultados quando retratam claramente o tema e o estilo artístico desejados.
💭 Aproveitando múltiplas referências: O uso de múltiplas imagens de referência aprimora a capacidade do modelo de compreender e integrar diversos elementos de cena e composições complexas.
💭 Otimização de conteúdo de formato curto: O Veo 3.1 foi especificamente otimizado para gerar videoclipes curtos e de alta qualidade, sendo ideal para conteúdo conciso e impactante, em vez de produções longas.

Exemplo de código e detalhes da API

Para obter guias completos de integração de API, exemplos de código e documentação detalhada sobre como utilizar o Veo 3.1, consulte a documentação oficial da API de IA/ML:

Acesse a documentação da API do Veo 3.1.

(Os desenvolvedores encontrarão trechos de código incorporados e exemplos interativos na documentação vinculada.)

Veo 3.1 comparado a outros modelos líderes

📈 Vejo 3.1 contra Sora 2

O Veo 3.1 se destaca por superar o Sora 2 em Realismo visual, coerência de cena e sincronização audiovisual crucial.Isso torna o Veo 3.1 particularmente adequado para narrativas cinematográficas e produção de vídeos comerciais. Embora o Sora 2 seja reconhecido pela geração rápida, o Veo 3.1 oferece durações mais longas e transições multicena superiores com qualidade profissional aprimorada.

📈 Vejo 3,1 vs. Vejo 3,0

O Veo 3.1 representa um salto significativo em relação ao Veo 3.0. Ele estende a duração dos vídeos de até 12 segundos para impressionantes 12 segundos. 60 segundos e eleva a resolução de 720p para uma imagem nítida. 1080p HDAs principais novidades incluem áudio sincronizado nativo, controle avançado de múltiplas cenas, predefinições de câmera cinematográficas incorporadas e continuidade de personagens e iluminação muito aprimorada, transformando-o em um instrumento narrativo de nível profissional.

📈 Veo 3.1 vs. Kling 2.1

O Kling 2.1 oferece uma forte geração de vídeos com estilo próprio, mas geralmente produz clipes mais curtos com composições de cena menos complexas. A capacidade do Veo 3.1 de gerar Vídeos contínuos de um minuto com áudio integrado e efeitos cinematográficos. Oferece uma vantagem definitiva para projetos que exigem vídeos narrativos refinados com fluxo audiovisual consistente.

📈 Veo 3.1 vs. Wan 2.5

O Wan 2.5 foca na geração rápida de vídeos com estruturação básica de cenas. No entanto, ele não possui as transições avançadas de cenas com múltiplas tomadas e os recursos robustos de geração de áudio encontrados no Veo 3.1. A integração de predefinições cinematográficas e o controle detalhado de cenas do Veo são inerentemente mais adequados para a criação de conteúdo de vídeo altamente dirigido e com nuances profissionais.

Perguntas frequentes (FAQ)

❓ O que é Veo 3.1 Reference-to-Video?

O Veo 3.1 é o modelo avançado de IA do Google DeepMind para geração de vídeos de alta fidelidade. Ele permite que os usuários controlem o estilo do vídeo e a composição da cena, fornecendo imagens de referência, garantindo consistência artística e flexibilidade criativa.

❓ Como funciona o controle da imagem de referência?

Os usuários podem enviar até três imagens de referência. O modelo analisa essas imagens para capturar os estilos artísticos, paletas de cores, iluminação e layouts de cena desejados, integrando essas pistas visuais ao vídeo gerado com base em instruções de texto que as acompanham.

❓ Quais são as principais especificações de saída do Veo 3.1?

Ele gera vídeos com duração de até 8 segundos (com possibilidade de extensão), suportando resoluções de 720p ou 1080p, proporção de 16:9 e 24 quadros por segundo. Um recurso de destaque é a geração nativa de áudio sincronizado, perfeitamente ajustado ao conteúdo do vídeo.

❓ Como o Veo 3.1 melhora em relação ao Veo 3.0?

O Veo 3.1 oferece avanços significativos, incluindo aumento na duração dos vídeos para até 60 segundos (antes eram 12), resolução HD 1080p mais alta (antes eram 720p), áudio sincronizado nativo, controle de múltiplas cenas e predefinições de câmera cinematográficas avançadas, tornando-o uma ferramenta narrativa mais completa.

❓ Quais são as principais aplicações do Veo 3.1?

O Veo 3.1 é ideal para diversas aplicações, como storyboard de filmes, criação de conteúdo publicitário e de marketing envolvente, produção de vídeos dinâmicos para redes sociais (como Shorts, TikToks e Reels) e desenvolvimento de materiais educacionais animados com som gerado por IA.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos