Fora

Bater papo

desativar

Áudio estável

Descubra o Stable Audio da Stability AI, um modelo avançado de geração de áudio que cria faixas de alta qualidade a partir de comandos de texto com recursos inovadores.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/audio', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'stable-audio',
      prompt: 'lo-fi pop hip-hop ambient music',
      steps: 100,
      seconds_total: 10,
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/audio"
    payload = {
        "model": "stable-audio",
        "prompt": "lo-fi pop hip-hop ambient music",
        "steps": 100,
        "seconds_total": 10,
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

Áudio estável

Detalhes do produto

🎵 Stable Audio: Visão geral do modelo avançado de geração de áudio por IA

Áudio estável é um modelo inovador de geração de áudio desenvolvido por IA de estabilidade, lançado oficialmente em Setembro de 2023Essa tecnologia de IA de ponta foi projetada para criar faixas de áudio de alta qualidade diretamente a partir de instruções textuais, atendendo a um amplo espectro de aplicações criativas e profissionais.

✨ Principais recursos e funcionalidades

✓ Saída de alta fidelidade: Gera áudio estéreo de nível profissional com uma impressionante taxa de amostragem. Taxa de amostragem de 44,1 kHz, garantindo uma qualidade de som rica e nítida, adequada para diversas mídias.
✓ Duração do áudio estruturado: Capaz de produzir faixas coesas que incorporam estruturas musicais distintas, incluindo introduções envolventes, desenvolvimentos dinâmicos e finais claros.
✓ Criação Sonora Diversificada: A Stable Audio se destaca na geração de uma ampla gama de conteúdo de áudio, desde melodias complexas e estilos musicais variados até efeitos sonoros realistas, atendendo às necessidades específicas de músicos e designers de som.

🎯 Casos de uso pretendidos

Este modelo foi projetado principalmente para:

● Músicos e compositores: Para auxiliar na criação de novas peças musicais, faixas de acompanhamento ou paisagens sonoras experimentais.
● Designers de som: Para gerar efeitos sonoros personalizados ou fundos ambientais para jogos, filmes, mídias interativas e outros projetos multimídia.
● Desenvolvedores: Integrar recursos de geração de áudio com inteligência artificial em diversas aplicações e plataformas.

O Stable Audio processa principalmente Sugestões de texto em inglês, mas sua arquitetura robusta permite o processamento de entradas multilíngues, dependendo do contexto específico fornecido.

⚙️ Especificações técnicas e arquitetura

Arquitetura Subjacente

O Stable Audio é construído sobre uma base sofisticada. arquitetura do modelo de difusão latente, meticulosamente otimizado para síntese de áudio. Os principais componentes de seu design incluem:

● Autoencoder altamente comprimido: Facilita a representação eficiente e de alta qualidade de formas de onda de áudio complexas, crucial para processamento e geração.
● Transformador de Difusão (DiT): Este componente se destaca na manipulação de dados em longas sequências, permitindo a geração de peças de áudio coerentes e bem estruturadas.

Dados de treinamento e curadoria

As amplas capacidades do modelo têm origem no seu treinamento em um conjunto de dados vasto e diversificado:

● Fonte e escala dos dados: O conjunto de dados de treinamento foi selecionado a partir de Biblioteca de música AudioSparx, abrangendo mais de 800.000 arquivos de áudioEsta rica coleção inclui uma ampla variedade de músicas, diversos efeitos sonoros e faixas individuais de instrumentos, proporcionando uma base abrangente para a compreensão de elementos de áudio.
● Curadoria Ética e Diversidade: Foi dada ênfase ao respeito. direitos do criador Durante a curadoria de dados, incluímos uma opção de exclusão para artistas. Essa abordagem cuidadosa minimiza possíveis vieses e garante que os resultados gerados mantenham uma representação diversificada.

Métricas de desempenho

A Stable Audio demonstra consistentemente um forte desempenho em todos os principais indicadores:

Métrica	Pontuação
Índice de Qualidade	Alto
Comprimento máximo da trilha gerada	Até 47 segundos
Taxa de amostragem	44,1 kHz

Nota: Em telas menores, o conteúdo da tabela pode ser rolado horizontalmente para melhor legibilidade.

💻 Guia de utilização e integração de API

Acesso à API e exemplos de código

O Stable Audio está prontamente disponível para integração através do Plataforma de API de IA/ML, onde está listado como "Áudio Estável".

Geração programática de áudio:

// Exemplo de solicitação de API para criar geração de áudio POST /audio.create-generation-stable Content-Type: application/json { "prompt": "uma faixa synthwave futurista com uma batida envolvente e melodias neon", "model": "stable-audio", "duration": 45 // em segundos, até 47 }

Recuperando o áudio gerado:

// Exemplo de chamada de API para obter o arquivo de áudio gerado GET /audio.fetch-generation?id={generation_id} Accept: audio/mpeg

Documentação completa da API

Para obter detalhes aprofundados sobre parâmetros de solicitação, formatos de resposta, autenticação e tratamento de erros, consulte o documento oficial. Documentação da API.

⚖️ Diretrizes Éticas e Licenciamento

Quadro de Desenvolvimento Ético

A Stability AI está profundamente comprometida em promover... desenvolvimento ético de IAOs principais aspectos da abordagem deles para o Stable Audio incluem:

● Transparência: Manter uma comunicação clara sobre as capacidades do modelo, suas aplicações potenciais e limitações inerentes.
● Direitos do Criador: Garantir que todos os dados de treinamento utilizados estejam em estrita conformidade com as leis de direitos autorais e fornecer aos artistas um ambiente claro. mecanismo de exclusão para que seu conteúdo seja utilizado em treinamentos futuros.

Informações sobre licenciamento

O Stable Audio está disponível sob um acordo. licença comercialEsta licença concede aos usuários direitos tanto para fins de pesquisa quanto comerciais, mantendo a conformidade com os padrões éticos estabelecidos e respeitando os direitos de propriedade intelectual.

Comece sua jornada criativa com a Stable Audio. Acesse a API e comece agora mesmo. aqui.

❓ Perguntas frequentes (FAQ)

P: O que é Stable Audio e quem o desenvolveu?

A: O Stable Audio é um modelo avançado de geração de áudio com IA desenvolvido pela Stability AI, capaz de criar faixas de áudio de alta qualidade a partir de instruções de texto.

P: Qual é a duração máxima do áudio que o Stable Audio pode gerar?

A: O Stable Audio pode gerar estruturas musicais coerentes e faixas com até 47 segundos de duração.

P: Que tipo de dados foram usados para treinar o Stable Audio?

A: O modelo foi treinado em um vasto e diversificado conjunto de dados com mais de 800.000 arquivos de áudio da biblioteca musical AudioSparx, incluindo músicas, efeitos sonoros e faixas individuais de instrumentos.

P: O Stable Audio pode ser usado em projetos comerciais?

R: Sim, o Stable Audio está disponível sob uma licença comercial que permite o uso tanto para pesquisa quanto para fins comerciais, desde que sejam respeitadas as diretrizes éticas e os direitos do criador.

P: Onde posso acessar a API do Stable Audio e sua documentação?

A: A API da Stable Audio está disponível na plataforma AI/ML API, e a documentação completa pode ser encontrada em seu site. portal de documentação oficial.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos