



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/kling/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/v2.1-master-image-to-video',
prompt: 'Mona Lisa puts on glasses with her hands.',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
duration: '5',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/kling/generation"
payload = {
"model": "klingai/v2.1-master-image-to-video",
"prompt": "Mona Lisa puts on glasses with her hands.",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"duration": "5",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
Kling 2.1: Geração Avançada de Vídeo com IA
Kuaishou's Kling 2.1 é um modelo avançado de geração de vídeo com IA, projetado para transformar textos ou imagens em videoclipes de alta definição e com muita movimentação. Baseado na versão 2.0, o Kling 2.1 introduz simulações físicas mais precisas, velocidades de renderização mais rápidase um sistema flexível de modos de qualidade em níveis que permite aos usuários equilibrar custo e fidelidade de forma integrada.
Especificações técnicas
Indicadores de desempenho
O Kling 2.1 foi meticulosamente ajustado para movimentos realistas, consistência de personagens e obediência precisa aos comandos.
- ✨ Resolução de saída: 720p (Padrão) ou 1080p (Pro/Master).
- ✨ Duração do vídeo: Sequências nativas de 5s ou 10s; sequências mais longas podem ser obtidas através de junção de imagens.
- ✨ Velocidade de geração: Aproximadamente 5 segundos para um vídeo em 1080p em GPUs na nuvem; ainda mais rápido no modo Padrão.
- ✨ Módulo de Física: Utiliza atenção conjunta espaço-temporal 3D para trajetórias de objetos excepcionalmente mais suaves.
- ✨ Classificação de referência: Atualmente em 2º lugar na tabela de classificação ELO de Análise Artificial (1.332), posicionado logo atrás de Seedance-1.
Preços da API:
- ➡️ US$ 0,294 por segundo
Métricas de desempenho
O Kling 2.1 empatou notavelmente com o Veo 3 do Google no quesito... 1º lugar no Generative Video Benchmark de junho de 2025, alcançando uma pontuação composta de 93,5/100. Em 4.800 votações cegas A/B, 61% dos usuários preferiram o realismo de movimento e a rápida adaptação.Seu plano "HQ" em 1080p é notavelmente econômico, custando aproximadamente [valor em branco]. 0,4 centavos por quadro—aproximadamente um terço do preço da Veo—tendo como principal desvantagem o leve desfoque em cenas muito movimentadas.
Veja o Kling 2.1 em ação.
Principais capacidades
O Kling 2.1 oferece resultados precisos e de alta qualidade, essenciais para diversos fluxos de trabalho de vídeo criativos e comerciais.
- ✅ Movimento hiper-realista: O motor de física 3D aprimorado garante movimentos fluidos dos personagens e operações dinâmicas da câmera.
- ✅ Referenciamento de múltiplas imagens: Faça o upload de vários quadros de referência para manter um estilo consistente e a identidade do assunto em todas as cenas.
- ✅ Ferramentas de pincel de movimento e câmera: Use comandos de texto (por exemplo, “panorâmica para baixo”, “zoom dolly”) ou pinceladas intuitivas para ditar com precisão os trajetos dos objetos e os tipos de tomada.
- ✅ Personagens consistentes: Aproveite o rastreamento facial aprimorado e a coerência da postura corporal, mesmo durante acrobacias complexas.
- ✅ Entradas flexíveis: Suporta fluxos de trabalho de texto para vídeo (T2V) e de imagem para vídeo (I2V) em todos os níveis de qualidade.
- ✅ Controle de custos: Alterne facilmente entre os modos Standard, Pro e Master sem alterar as instruções, otimizando a relação custo-benefício.
- ✅ Camada de som (beta): As notas de lançamento mais recentes indicam efeitos sonoros automáticos e sincronização labial básica; a integração de áudio externo ainda é recomendada para controle total.
Casos de uso ideais
- 🎯 Conteúdo em formato resumido: Ideal para TikTok, YouTube Shorts e Instagram Reels que precisam de imagens rápidas em 1080p.
- 🎯 Marketing e Publicidade: Ideal para teasers de produtos, pôsteres animados e vídeos institucionais com orçamentos limitados.
- 🎯 Criação de storyboard e pré-visualização: Permite a criação rápida de vídeos conceituais que mostram movimentos de câmera e ações dos personagens.
- 🎯 Campanhas sociais: Facilita a produção rápida de vídeos de memes ou tendências, onde o custo por clipe é um fator crítico.
- 🎯 Explicações educacionais: Gere animações gráficas ou clipes ilustrativos diretamente a partir de diagramas estáticos para conteúdo de aprendizagem.
Exemplos de código para integração
Geração de texto para vídeo
Geração de imagem para vídeo
Comparação com outros modelos líderes
- Em comparação com o Google Veo 3: O Kling 2.1 está melhor classificado no benchmark de Análise Artificial (2º lugar contra 3º lugar). Os usuários frequentemente observam que o Kling 2.1 oferece movimentos mais fluidos e uma física mais precisa. Em contrapartida, Google Veo 3 Oferece excelente desempenho em resolução 4K nativa e recursos de áudio integrados.
- Contra Hailuo 02: O Kling 2.1 oferece qualidade 1080p comparável com um tempo médio de geração menor (aproximadamente 30 segundos contra 30 a 300 segundos) e inclui modos de qualidade escalonados que reduzem custos. No entanto, Hailuo 02 É conhecida por sua iluminação cinematográfica mais rica e um conjunto de ferramentas de controle para o diretor mais abrangente.
Integração de API
O Kling 2.1 está acessível através da API de IA/ML. A documentação completa está disponível para:
Perguntas frequentes (FAQ)
P1: O que é o Kling 2.1 e quais são seus principais avanços na geração de vídeo?
O Kling 2.1 é o modelo avançado de geração de vídeo da Kuaishou, que representa melhorias significativas na coerência temporal, na física de movimento realista e na capacidade de prolongar a duração dos vídeos. Os principais avanços incluem melhor tratamento de interações complexas entre personagens, maior consistência nas expressões faciais, movimentos de objetos mais naturais e melhor compreensão das relações de causa e efeito em cenas dinâmicas.
Q2: Que tipos de conteúdo de vídeo o Kling 2.1 gera com maior eficácia?
O Kling 2.1 se destaca na geração de: interações humanas realistas com gestos e expressões naturais, sequências de ação dinâmicas com física adequada, cenas ambientais com mudanças de clima e iluminação convincentes, demonstrações de produtos com operação fluida, conteúdo educacional com explicações visuais claras e narrativa criativa com movimentos de personagens consistentes. Ele brilha particularmente em cenários que exigem movimentos e expressões emocionais semelhantes aos humanos.
P3: Como o Kling 2.1 alcança uma consistência temporal superior em comparação com as versões anteriores?
O Kling 2.1 alcança consistência temporal por meio de: algoritmos avançados de interpolação de quadros, rastreamento persistente de objetos em sequências, modelagem aprimorada de trajetórias de movimento, iluminação coerente e propagação de sombras, além de uma compreensão aprimorada da dinâmica física. O modelo mantém as características dos personagens, as propriedades dos objetos e as condições ambientais de forma consistente ao longo dos vídeos gerados, minimizando oscilações ou transições não naturais.
Q4: Quais são as aplicações práticas dos recursos de geração de vídeo do Kling 2.1?
As aplicações práticas incluem: criação de conteúdo para redes sociais, vídeos de produtos para e-commerce, materiais educacionais e de treinamento, produção de entretenimento e curtas-metragens, conteúdo de marketing e publicidade, animação de influenciadores virtuais e mensagens de vídeo personalizadas. Sua capacidade de gerar conteúdo centrado no ser humano o torna valioso para aplicações que exigem interações e expressões de personagens com aparência autêntica.
Q5: Quais especificações de entrada produzem os melhores resultados com o Kling 2.1?
Os melhores resultados são obtidos com: descrições claras das ações e emoções dos personagens, instruções específicas de movimento de câmera, especificações de duração adequadas ao tipo de conteúdo, contexto ambiental detalhado e indicadores de estilo que correspondam ao resultado desejado. Exemplo: 'Uma mulher demonstrando alegremente um utensílio de cozinha, expressões faciais claras mostrando satisfação, movimentos suaves das mãos demonstrando o uso do produto, ambiente de cozinha bem iluminado, duração de 10 segundos, estilo realista com iluminação quente.'
Playground de IA



Conecte-se