



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'sber-ai/kandinsky5-distill-t2v',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "sber-ai/kandinsky5-distill-t2v",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background"
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
✨ API Kandinsky 5 Distill: Conversão de texto em vídeo leve e extremamente rápida
O Kandinsky 5 Distill é uma versão avançada e otimizada do poderoso modelo de difusão de texto para vídeo Kandinsky 5. Projetado para velocidade e eficiência incomparáveis, ele oferece significativamente mais recursos. acelera a geração de vídeo sem comprometer a qualidade artística. Isso a torna a escolha perfeita para prototipagem rápida, exploração criativa e geração de conteúdo impactante que exige pré-visualizações rápidas e fluxos de trabalho iterativos. Experimente resultados de vídeo de alta qualidade com velocidade notável, tornando seu processo criativo mais ágil e produtivo.
⚙️ Especificações técnicas
- Tipo de modelo: Modelo de difusão latente que emprega uma arquitetura de Transformador de Difusão (DiT).
- Incorporação de texto: Utiliza Qwen2.5-VL e CLIP para um condicionamento semântico robusto, garantindo que suas instruções sejam profundamente compreendidas.
- Codificação de vídeo: Utiliza o Autoencoder Variacional 3D (VAE) da HunyuanVideo para comprimir vídeos de forma eficiente em um espaço latente.
- Otimização: O processo de destilação é significativamente reduz a sobrecarga computacional, resultando em tempos de inferência drasticamente mais rápidos.
- Entrada: Aceita comandos de texto intuitivos em linguagem natural.
- Saída: Gera vídeos de alta qualidade com durações personalizáveis, geralmente variando de 5 a 10 segundos.
⚡ Indicadores de desempenho
- Velocidade de inferência: Consegue um aceleração substancial Em comparação com o Kandinsky 5 original, ele se torna ideal para pré-visualizações em tempo real e aplicações interativas.
- Qualidade: Mantém alta qualidade perceptiva, oferecendo detalhes precisos e progressão temporal coerente ao longo dos quadros de vídeo gerados.
- Eficiência de recursos: Apresenta menor consumo de memória da GPU, permitindo seu uso em GPUs convencionais para tarefas de geração de vídeo rápidas e acessíveis.
✅ Principais características
- Geração otimizada para velocidade: Projetado desde o início para uma síntese de vídeo mais rápida, sem perda significativa de fidelidade.
- Resultados de alta qualidade: Mantém a riqueza visual e semântica comparável ao modelo completo Kandinsky 5, garantindo resultados impressionantes.
- Amigo do usuário: Suporta entradas em linguagem natural, permitindo iterações rápidas e integração perfeita em fluxos de trabalho criativos.
- Compatível com código aberto: Construído sobre arquiteturas de difusão aberta, fomentando pesquisa, personalização e contribuições da comunidade.
- Condicionamento de texto integrado: Apresenta mecanismos avançados de atenção cruzada que garantem que os comandos de texto tenham uma influência forte e precisa no conteúdo de vídeo gerado.
💰 Preços da API Kandinsky 5 Distill
Experimente a geração de vídeo a partir de texto de última geração a um preço acessível: US$ 0,105 por segundo de vídeo gerado.
💡 Casos de uso versáteis
- Prototipagem rápida: Visualize storyboards, ideias conceituais e esboços de design com uma velocidade sem precedentes.
- Pré-visualizações de conteúdo: Crie rascunhos rápidos para campanhas de mídia social, peças visuais para anúncios ou trechos de videoclipes.
- Ambiente de experimentação criativo: Experimente livremente com diversos estilos artísticos e técnicas avançadas de engenharia de prompts para descobrir novas vias criativas.
- Demonstrações educacionais: Demonstre as capacidades dinâmicas da IA de conversão de texto em vídeo em ambientes em tempo real ou quase em tempo real para fins educacionais ou demonstrativos.
- Integração de aplicativos: Integre perfeitamente funcionalidades em aplicativos que exigem feedback imediato na geração de vídeo e criação rápida de conteúdo visual.
💻 Exemplo de código de geração
Aqui está um exemplo de como interagir com a API Kandinsky 5 Distill para geração de vídeo:
import requests API_URL = "YOUR_API_ENDPOINT/sber-ai/kandinsky5-distill-t2v" # Substitua pelo endpoint real headers = {"Authorization": "Bearer YOUR_API_KEY"} # Substitua pela sua chave de API real payload = { "prompt": "Uma cidade futurista ao pôr do sol, carros voadores, luzes de néon, altamente detalhado, cinematográfico", "duration": 7, # Gera um vídeo de 7 segundos "resolution": "512x512" # Especifica a resolução do vídeo } response = requests.post(API_URL, headers=headers, json=payload) response.raise_for_status() # Gera uma exceção para erros HTTP video_generation_id = response.json()["id"] print(f"Geração de vídeo iniciada com o ID: {video_generation_id}") 🎬 Exemplo de código de saída
Após iniciar uma geração, você pode obter o resultado (por exemplo, URL do vídeo) usando o seguinte código:
import requests import time API_URL_FETCH = "SEU_ENDPOINT_DA_API/video_generations/{video_generation_id}" # Substitua pelo endpoint real headers = {"Authorization": "Bearer SUA_CHAVE_DE_API"} # Supondo que video_generation_id foi obtido do exemplo de geração acima # Para demonstração, vamos usar um marcador se não for # video_generation_id = "seu_id_de_geração_real_aqui" status = "pending" while status == "pending": response = requests.get(API_URL_FETCH.format(video_generation_id=video_generation_id), headers=headers) response.raise_for_status() result = response.json() status = result.get("status") if status == "completed": video_url = result.get("output_url") print(f"Vídeo gerado com sucesso: {video_url}") elif status == "failed": print(f"Falha na geração do vídeo: {result.get('error')}") break else: print(f"Status do vídeo: {status}. Aguardando...") time.sleep(10) # Aguarde 10 segundos antes de verificar novamente ⚖️ Comparação com outros modelos
Entendendo a posição única da Kandinsky 5 Distill no cenário de conversão de texto em vídeo:
- vs. Kandinsky 5 Padrão: A Distill oferece tempos de geração significativamente mais rápidosIsso o torna superior para iterações rápidas e pré-visualizações. Embora o Kandinsky 5 original possa oferecer nuances ligeiramente mais profundas em gerações altamente complexas, o Distill mantém uma excelente qualidade para a grande maioria das aplicações práticas.
- vs. Modelos de vídeo de difusão estável: O Kandinsky 5 Distill oferece recursos especializados de conversão de texto em vídeo com uma arquitetura otimizada baseada em transformadores, produzindo frequentemente vídeos que são mais semanticamente preciso e temporalmente coerenteAs variantes de difusão estável costumam ser mais versáteis, mas podem ser mais lentas ou apresentar menor consistência temporal nas saídas de vídeo.
- vs. Vídeo de imagem: Kandinsky 5 Destilar prioriza velocidade e acessibilidade, construída sobre arquiteturas abertas. Em contraste, a Imagen Video é um modelo proprietário focado em altíssima qualidade, geralmente com um custo computacional mais elevado e acesso limitado.
🔗 Integração de API
A API Kandinsky 5 Distill é facilmente acessível através da API de IA/ML. A documentação completa para integração está disponível. disponível aqui.
❓ Perguntas frequentes (FAQ)
- P: O que é o Kandinsky 5 Distill e qual é o seu principal benefício?
A: O Kandinsky 5 Distill é um modelo de difusão de texto para vídeo otimizado e leve. Seu principal benefício é proporcionar velocidades de geração de vídeo significativamente mais rápidas, mantendo alta qualidade visual, ideal para prototipagem rápida e fluxos de trabalho criativos iterativos.
- P: Como o Kandinsky 5 Distill se compara, em termos de velocidade e qualidade, ao Kandinsky 5 original?
A: O Distill proporciona um aumento substancial de velocidade nas pré-visualizações em tempo real em comparação com a versão original, tornando-o muito mais rápido. Ele mantém alta qualidade de percepção com detalhes precisos, adequado para a maioria das aplicações práticas, embora a versão completa possa oferecer um pouco mais de nuances em cenários extremamente complexos.
- P: Quais são alguns casos de uso típicos para o Kandinsky 5 Distill?
A: É excelente para prototipagem rápida (storyboards, conceitos), prévias de conteúdo (mídias sociais, anúncios), testes criativos, demonstrações educacionais e integração em aplicativos que exigem feedback rápido na geração de vídeos.
- P: Quais são os tipos de entrada e saída da API Kandinsky 5 Distill?
A: A API recebe instruções de texto em linguagem natural como entrada e gera vídeos de alta qualidade com durações personalizáveis (por exemplo, de 5 a 10 segundos).
- P: O processo Kandinsky 5 Distill é eficiente em termos de recursos?
A: Sim, é altamente eficiente em termos de recursos, com menor consumo de memória da GPU, permitindo seu uso em GPUs convencionais para tarefas rápidas de geração de vídeo.
Playground de IA



Conecte-se