Fora

Bater papo

desativar

Kandinsky 5 Destilar

Este modelo é ideal para desenvolvedores, criadores de conteúdo e pesquisadores que precisam gerar conteúdo de vídeo a partir de instruções de texto de forma eficiente.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'sber-ai/kandinsky5-distill-t2v',
      prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "sber-ai/kandinsky5-distill-t2v",
        "prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background"
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

Kandinsky 5 Destilar

Detalhes do produto

✨ API Kandinsky 5 Distill: Conversão de texto em vídeo leve e extremamente rápida

O Kandinsky 5 Distill é uma versão avançada e otimizada do poderoso modelo de difusão de texto para vídeo Kandinsky 5. Projetado para velocidade e eficiência incomparáveis, ele oferece significativamente mais recursos. acelera a geração de vídeo sem comprometer a qualidade artística. Isso a torna a escolha perfeita para prototipagem rápida, exploração criativa e geração de conteúdo impactante que exige pré-visualizações rápidas e fluxos de trabalho iterativos. Experimente resultados de vídeo de alta qualidade com velocidade notável, tornando seu processo criativo mais ágil e produtivo.

⚙️ Especificações técnicas

Tipo de modelo: Modelo de difusão latente que emprega uma arquitetura de Transformador de Difusão (DiT).
Incorporação de texto: Utiliza Qwen2.5-VL e CLIP para um condicionamento semântico robusto, garantindo que suas instruções sejam profundamente compreendidas.
Codificação de vídeo: Utiliza o Autoencoder Variacional 3D (VAE) da HunyuanVideo para comprimir vídeos de forma eficiente em um espaço latente.
Otimização: O processo de destilação é significativamente reduz a sobrecarga computacional, resultando em tempos de inferência drasticamente mais rápidos.
Entrada: Aceita comandos de texto intuitivos em linguagem natural.
Saída: Gera vídeos de alta qualidade com durações personalizáveis, geralmente variando de 5 a 10 segundos.

⚡ Indicadores de desempenho

Velocidade de inferência: Consegue um aceleração substancial Em comparação com o Kandinsky 5 original, ele se torna ideal para pré-visualizações em tempo real e aplicações interativas.
Qualidade: Mantém alta qualidade perceptiva, oferecendo detalhes precisos e progressão temporal coerente ao longo dos quadros de vídeo gerados.
Eficiência de recursos: Apresenta menor consumo de memória da GPU, permitindo seu uso em GPUs convencionais para tarefas de geração de vídeo rápidas e acessíveis.

✅ Principais características

Geração otimizada para velocidade: Projetado desde o início para uma síntese de vídeo mais rápida, sem perda significativa de fidelidade.
Resultados de alta qualidade: Mantém a riqueza visual e semântica comparável ao modelo completo Kandinsky 5, garantindo resultados impressionantes.
Amigo do usuário: Suporta entradas em linguagem natural, permitindo iterações rápidas e integração perfeita em fluxos de trabalho criativos.
Compatível com código aberto: Construído sobre arquiteturas de difusão aberta, fomentando pesquisa, personalização e contribuições da comunidade.
Condicionamento de texto integrado: Apresenta mecanismos avançados de atenção cruzada que garantem que os comandos de texto tenham uma influência forte e precisa no conteúdo de vídeo gerado.

💰 Preços da API Kandinsky 5 Distill

Experimente a geração de vídeo a partir de texto de última geração a um preço acessível: US$ 0,105 por segundo de vídeo gerado.

💡 Casos de uso versáteis

Prototipagem rápida: Visualize storyboards, ideias conceituais e esboços de design com uma velocidade sem precedentes.
Pré-visualizações de conteúdo: Crie rascunhos rápidos para campanhas de mídia social, peças visuais para anúncios ou trechos de videoclipes.
Ambiente de experimentação criativo: Experimente livremente com diversos estilos artísticos e técnicas avançadas de engenharia de prompts para descobrir novas vias criativas.
Demonstrações educacionais: Demonstre as capacidades dinâmicas da IA de conversão de texto em vídeo em ambientes em tempo real ou quase em tempo real para fins educacionais ou demonstrativos.
Integração de aplicativos: Integre perfeitamente funcionalidades em aplicativos que exigem feedback imediato na geração de vídeo e criação rápida de conteúdo visual.

💻 Exemplo de código de geração

Aqui está um exemplo de como interagir com a API Kandinsky 5 Distill para geração de vídeo:

 import requests API_URL = "YOUR_API_ENDPOINT/sber-ai/kandinsky5-distill-t2v" # Substitua pelo endpoint real headers = {"Authorization": "Bearer YOUR_API_KEY"} # Substitua pela sua chave de API real payload = { "prompt": "Uma cidade futurista ao pôr do sol, carros voadores, luzes de néon, altamente detalhado, cinematográfico", "duration": 7, # Gera um vídeo de 7 segundos "resolution": "512x512" # Especifica a resolução do vídeo } response = requests.post(API_URL, headers=headers, json=payload) response.raise_for_status() # Gera uma exceção para erros HTTP video_generation_id = response.json()["id"] print(f"Geração de vídeo iniciada com o ID: {video_generation_id}")

🎬 Exemplo de código de saída

Após iniciar uma geração, você pode obter o resultado (por exemplo, URL do vídeo) usando o seguinte código:

 import requests import time API_URL_FETCH = "SEU_ENDPOINT_DA_API/video_generations/{video_generation_id}" # Substitua pelo endpoint real headers = {"Authorization": "Bearer SUA_CHAVE_DE_API"} # Supondo que video_generation_id foi obtido do exemplo de geração acima # Para demonstração, vamos usar um marcador se não for # video_generation_id = "seu_id_de_geração_real_aqui" status = "pending" while status == "pending": response = requests.get(API_URL_FETCH.format(video_generation_id=video_generation_id), headers=headers) response.raise_for_status() result = response.json() status = result.get("status") if status == "completed": video_url = result.get("output_url") print(f"Vídeo gerado com sucesso: {video_url}") elif status == "failed": print(f"Falha na geração do vídeo: {result.get('error')}") break else: print(f"Status do vídeo: {status}. Aguardando...") time.sleep(10) # Aguarde 10 segundos antes de verificar novamente

⚖️ Comparação com outros modelos

Entendendo a posição única da Kandinsky 5 Distill no cenário de conversão de texto em vídeo:

vs. Kandinsky 5 Padrão: A Distill oferece tempos de geração significativamente mais rápidosIsso o torna superior para iterações rápidas e pré-visualizações. Embora o Kandinsky 5 original possa oferecer nuances ligeiramente mais profundas em gerações altamente complexas, o Distill mantém uma excelente qualidade para a grande maioria das aplicações práticas.
vs. Modelos de vídeo de difusão estável: O Kandinsky 5 Distill oferece recursos especializados de conversão de texto em vídeo com uma arquitetura otimizada baseada em transformadores, produzindo frequentemente vídeos que são mais semanticamente preciso e temporalmente coerenteAs variantes de difusão estável costumam ser mais versáteis, mas podem ser mais lentas ou apresentar menor consistência temporal nas saídas de vídeo.
vs. Vídeo de imagem: Kandinsky 5 Destilar prioriza velocidade e acessibilidade, construída sobre arquiteturas abertas. Em contraste, a Imagen Video é um modelo proprietário focado em altíssima qualidade, geralmente com um custo computacional mais elevado e acesso limitado.

🔗 Integração de API

A API Kandinsky 5 Distill é facilmente acessível através da API de IA/ML. A documentação completa para integração está disponível. disponível aqui.

❓ Perguntas frequentes (FAQ)

P: O que é o Kandinsky 5 Distill e qual é o seu principal benefício?
A: O Kandinsky 5 Distill é um modelo de difusão de texto para vídeo otimizado e leve. Seu principal benefício é proporcionar velocidades de geração de vídeo significativamente mais rápidas, mantendo alta qualidade visual, ideal para prototipagem rápida e fluxos de trabalho criativos iterativos.
P: Como o Kandinsky 5 Distill se compara, em termos de velocidade e qualidade, ao Kandinsky 5 original?
A: O Distill proporciona um aumento substancial de velocidade nas pré-visualizações em tempo real em comparação com a versão original, tornando-o muito mais rápido. Ele mantém alta qualidade de percepção com detalhes precisos, adequado para a maioria das aplicações práticas, embora a versão completa possa oferecer um pouco mais de nuances em cenários extremamente complexos.
P: Quais são alguns casos de uso típicos para o Kandinsky 5 Distill?
A: É excelente para prototipagem rápida (storyboards, conceitos), prévias de conteúdo (mídias sociais, anúncios), testes criativos, demonstrações educacionais e integração em aplicativos que exigem feedback rápido na geração de vídeos.
P: Quais são os tipos de entrada e saída da API Kandinsky 5 Distill?
A: A API recebe instruções de texto em linguagem natural como entrada e gera vídeos de alta qualidade com durações personalizáveis (por exemplo, de 5 a 10 segundos).
P: O processo Kandinsky 5 Distill é eficiente em termos de recursos?
A: Sim, é altamente eficiente em termos de recursos, com menor consumo de memória da GPU, permitindo seu uso em GPUs convencionais para tarefas rápidas de geração de vídeo.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos