



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/kling/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'kling-video/v2.1/pro/image-to-video',
prompt: 'Mona Lisa puts on glasses with her hands.',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
duration: '5',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/kling/generation"
payload = {
"model": "kling-video/v2.1/pro/image-to-video",
"prompt": "Mona Lisa puts on glasses with her hands.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"duration": "5",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
Kling V2.1 Pro Representa o mais recente avanço na tecnologia de geração de vídeo a partir de imagens da série Kling. Oferece qualidade de síntese de vídeo incomparável, relevância semântica aprimorada e maior controle criativo. Baseada na sólida estrutura do Kling V2.0 Standard, esta versão profissional atende aos fluxos de trabalho de produção multimídia mais exigentes, integrando compreensão avançada de imagens, geração de vídeos de longa duração e renderização estilística adaptativa. Projetada para artistas visuais, estúdios de produção e empresas que necessitam de geração de vídeo escalável e de alta fidelidade a partir de imagens estáticas, a Kling V2.1 Pro Image-to-Video introduz incorporação contextual aprimorada e dinâmicas temporais sofisticadas para suportar narrativas visuais complexas e fluxos de trabalho orientados à inovação.
⚙️Especificações técnicas
- Qualidade de geração de vídeo: Utiliza algoritmos de síntese espaço-temporal e interpolação de quadros de última geração que garantem uma continuidade de movimento extremamente suave e um fotorrealismo impressionante, minimizando significativamente artefatos visuais e ruído temporal nas sequências geradas.
- Resolução e taxa de quadros: Suporta geração contínua de vídeos de até Resolução 4K Ultra HD a 30 quadros por segundo estáveis., alcançado por meio de mecanismos de renderização otimizados que priorizam tanto a fidelidade visual quanto a eficiência computacional.
- Processamento de imagem de entrada: Utiliza um pipeline de codificação de imagens refinado, capaz de extrair características semânticas e composicionais profundas de diversos formatos e resoluções de imagem, permitindo extrapolação narrativa precisa e expansão visual a partir de uma única imagem ou de um lote de imagens.
- Câmera e efeitos cinematográficos: Integra cinematografia virtual avançada, incluindo rastreamento dinâmico, tomadas com grua, zooms, mudanças de paralaxe e efeitos de profundidade de campo programáveis, facilitando composições de vídeo imersivas e profissionais, mantendo velocidades de síntese em tempo real.
🔬Detalhes técnicos
Arquitetura do Modelo
Apresenta um design híbrido aprimorado de Transformer-GAN com atenção hierárquica multiescala e módulos de coerência temporal projetados explicitamente para modelagem espaço-temporal de longo alcance e consistência em nível de quadro. A arquitetura incorpora novos blocos de fusão de codificadores de imagem que sinergizam pistas visuais estáticas com vias de síntese de vídeo dinâmicas, permitindo progressão de cena sofisticada e animação sensível ao contexto.
Dados de treinamento
Treinado em um conjunto de dados proprietário de grande escala que combina diversas imagens de alta resolução com sequências de vídeo sincronizadas, abrangendo múltiplos gêneros, incluindo narrativas cinematográficas, conteúdo publicitário, documentários e animações altamente estilizadas. O conjunto de dados enfatiza anotações multilíngues e metadados ricos para reforçar a adaptabilidade entre domínios e o controle preciso do estilo.
Métricas de desempenho
Alcança o equilíbrio ideal entre altíssima fidelidade visual, latência e uso de recursos computacionais, oferecendo recursos robustos de processamento em lote e controle preciso sobre a duração, a complexidade da cena e os parâmetros estilísticos para atender às diversas necessidades de produção.
💰Preços da API
Apenas US$ 0,1029 por segundo de vídeo
✨Principais características
- Geração de vídeo a partir de imagens de alta fidelidade: Transforma imagens estáticas em sequências de vídeo coerentes e ricas em detalhes, com movimentos fluidos, preservando as principais características visuais e, ao mesmo tempo, expandindo criativamente o conteúdo original.
- Escopo Temporal Ampliado: Suporta vídeos com duração de até 30 segundos, aproveitando uma vasta memória contextual para manter a consistência temática e visual ao longo das cenas em desenvolvimento.
- Simulação Cinematográfica Dinâmica: Oferece um conjunto avançado de ferramentas para manobras de câmera, incluindo movimentos suaves de dolly e grua, rotação em múltiplos eixos, modulação de profundidade e transições de foco, permitindo a criação de narrativas visuais profissionais e efeitos dramáticos.
- Adaptabilidade a múltiplos estilos e gêneros: Treinado em extensos conjuntos de dados de diversos gêneros, permitindo a reprodução fiel de estilos como live-action, animação, documentário e experimental, com nuances estilísticas de alta fidelidade e variabilidade de conteúdo.
- Solicitação multilíngue e multimodal: Incorpora uma sólida compreensão multilíngue (inglês, chinês mandarim e outros idiomas) e suporta entradas multimodais, combinando anotações de texto e pistas visuais para permitir controle preciso e localização para requisitos de produção global.
💡Casos de uso
- ✅Criação de conteúdo de vídeo extenso e rico em narrativa a partir de imagens para fins publicitários, de marketing e educacionais.
- ✅Criação de storyboards cinematográficos e desenvolvimento de conceitos, traduzindo arte estática em sequências dinâmicas.
- ✅Aprimoramento e ampliação criativa de vídeos para mídias sociais por meio de animação de imagens.
- ✅Aprimoramento de vídeos documentais e narrativos impulsionado por arquivos fotográficos.
- ✅Síntese de animação e vídeo com atores reais a partir de imagens de alta resolução.
- ✅Geração de conteúdo multimídia de nível empresarial para estúdios criativos e equipes de comunicação corporativa.
- ✅Prototipagem visual rápida e desenvolvimento iterativo de histórias utilizando imagens como entrada.
- ✅Produção de vídeo multilíngue adaptada a diversos mercados internacionais.
💻Exemplo de código
📊Comparação com outros modelos
vs Kling V2.0 Standard I2V: O Kling V2.1 Pro aumenta significativamente a duração do vídeo de 15 para 30 segundos, melhora a resolução máxima e a estabilidade da taxa de quadros para 4K/30fpsA versão Pro introduz uma abordagem mais sofisticada de codificação de imagem e consistência temporal, e aprimora os recursos de simulação de câmera com efeitos dinâmicos multieixos. A versão Pro também melhora a eficiência da inferência, suportando processamento em lote em escala empresarial com controle refinado de cena e estilo.
vs Kling V1.5 Pro T2V: Enquanto o Kling V1.5 Pro se concentra na geração de texto para vídeo, o Kling V2.1 Pro I2V inova na síntese sofisticada de imagem para vídeo com maior resolução, maior duração de vídeo, realismo de movimento aprimorado e integração multimodal de múltiplas fontes, refletindo inovações arquitetônicas significativas e escopo de aplicação expandido.
❓Perguntas frequentes (FAQ)
P: O que torna o Kling V2.1 Pro ideal para produção multimídia profissional?
A: O Kling V2.1 Pro oferece qualidade de síntese de vídeo incomparável, resolução 4K Ultra HD a 30 fps, duração de vídeo estendida de até 30 segundos e efeitos cinematográficos avançados. Esses recursos, combinados com sua sólida compreensão de imagem e renderização estilística adaptativa, o tornam ideal para fluxos de trabalho profissionais exigentes em cinema, publicidade e criação de conteúdo corporativo.
P: Quais as diferenças entre o Kling V2.1 Pro e o Kling V2.0 Standard?
A: A versão 2.1 Pro aumenta significativamente a duração dos vídeos de 15 para 30 segundos, atualiza a resolução e a taxa de quadros para 4K/30fps e introduz um pipeline de codificação de imagem mais sofisticado. Também aprimora a simulação de câmera com efeitos dinâmicos multieixos e melhora a eficiência de inferência para processamento em lote em escala empresarial.
P: Que tipo de controle criativo o Kling V2.1 Pro oferece?
A: Os usuários obtêm amplo controle criativo por meio de simulação cinematográfica dinâmica (dolly, grua, zoom, profundidade de campo), adaptabilidade a múltiplos estilos e gêneros, e recursos robustos de interação multilíngue e multimodal. Isso permite uma extrapolação narrativa precisa e uma narrativa visual personalizada.
P: Qual é a estrutura de preços da API do Kling V2.1 Pro?
A: O preço da API é de US$ 0,1029 por segundo de vídeo, oferecendo um preço competitivo para geração de vídeo de alta fidelidade.
P: O Kling V2.1 Pro consegue lidar com diferentes idiomas para geração de conteúdo?
R: Sim, incorpora uma sólida compreensão multilíngue, com suporte para inglês, chinês mandarim e outros idiomas. Esse recurso, combinado com entradas multimodais, permite controle e localização precisos para atender às necessidades de produção global.
Playground de IA



Conecte-se