32 mil

Fora

Bater papo

desativar

Qwen 1.5 (1.8B)

O Qwen 1.5 (1.8B), uma versão beta do Qwen2, destaca-se na geração de texto, chatbots e moderação de conteúdo com sua arquitetura baseada em transformadores. Ele supera os concorrentes em testes de desempenho, oferecendo suporte multilíngue e recursos avançados em diversas áreas.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

const main = async () => {
  const prompt = `
All of the states in the USA:
- Alabama, Mongomery;
- Arkansas, Little Rock;
`;
  const response = await api.completions.create({
    prompt,
    model: 'Qwen/Qwen1.5-1.8B',
  });
  const text = response.choices[0].text;

  console.log('Completion:', text);
};

main();

                                        from openai import OpenAI

client = OpenAI(
    api_key="",
    base_url="https://api.ai.cc/v1",
)


def main():
    response = client.completions.create(
        model="Qwen/Qwen1.5-1.8B",
        prompt="""
  All of the states in the USA:
  - Alabama, Mongomery;
  - Arkansas, Little Rock;
  """,
    )

    completion = response.choices[0].text
    print(f"Completion: {completion}")


main()

Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

Qwen 1.5 (1.8B)

Detalhes do produto

Descubra o poderoso Qwen 1.5 (1.8B)O Qwen 1.5 é o mais recente avanço da série Qwen de modelos de linguagem de ponta da Alibaba Cloud. Esta impressionante série oferece uma gama diversificada de modelos, escaláveis de 0,5 bilhão até impressionantes 72 bilhões de parâmetros. Projetado para superar seus concorrentes, o Qwen 1.5 traz melhorias significativas tanto no desempenho bruto quanto na adequação às preferências humanas, estabelecendo um novo padrão para IA acessível e robusta.

✨ Desempacotando Qwen 1.5 (1.8B): Descrição principal

O Qwen 1.5 (1.8B) O modelo, uma versão inicial da série Qwen2, é um modelo de linguagem sofisticado baseado em Transformers e que utiliza apenas decodificadores. Ele passou por um extenso pré-treinamento em um corpus substancial de dados, garantindo amplo conhecimento e fortes capacidades generativas. A família Qwen 1.5 abrange uma variedade de tamanhos: 0,5B, 1,8 bilhões, 4B, 7B, 14B e 72B. Cada tamanho está disponível tanto como um modelo de linguagem base quanto como um modelo de bate-papo alinhado a instruções, atendendo a diversas necessidades de aplicação.

Sua arquitetura fundamental é construída sobre o design avançado do Transformer, incorporando inovações importantes como:

✅ Ativação do SwiGLU: Aumenta a não linearidade e o desempenho do modelo.
✅ Atenção, viés QKV: Melhora a estabilidade e a eficácia do mecanismo de atenção.
✅ Atenção à consulta em grupo: Otimiza a eficiência para modelos maiores.
✅ Atenção Híbrida: Uma combinação de atenção intermitente e atenção plena para gerenciar o contexto de forma eficaz.

💡 Duração do contexto: Qwen 1.5 suporta uma impressionante Contexto de token de 32K, permitindo processar e gerar sequências de texto significativamente mais longas e complexas, cruciais para aplicações avançadas.

🌐 Capacidades multilíngues: Um dos seus principais pontos fortes é o suporte multilíngue aprimorado, que inclui um tokenizador aperfeiçoado, especificamente adaptado para lidar com uma ampla gama de linguagens naturais e códigos de programação com alta precisão.

🚀 Qwen 1.5 Contra a Concorrência

No cenário em rápida evolução dos grandes modelos de linguagem, Qwen 1.5 Apresenta uma concorrência formidável. Quando comparado com líderes do setor como Claude 2.1, GPT-3.5-Turbo, e Mixtral, Qwen 1.5 demonstra consistentemente desempenho superior em diversas métricas.

Em benchmarks tradicionais que abrangem capacidades fundamentais como compreensão de linguagem e raciocínio, o Qwen 1.5 demonstra um desempenho excepcional. Além disso, seus modelos de bate-papo alcançaram pontuações impressionantes em benchmarks amplamente reconhecidos, como... MT-Banco e AlpacaEval, indicando um alto grau de alinhamento com as preferências humanas e a qualidade da conversa.

Ilustração do desempenho de ajuste fino do Qwen 1.5.

A capacidade multilíngue do modelo também é notável, demonstrando excelentes resultados em um conjunto diversificado de idiomas. Ele foi rigorosamente avaliado em inúmeros testes que abrangem exames, tarefas de compreensão, tradução e resolução de problemas matemáticos, consolidando sua versatilidade para aplicações globais.

🛠️ Dicas essenciais de uso para o Qwen 1.5

⚙️ Instalação: Para garantir o bom funcionamento e evitar erros comuns, é altamente recomendável instalar transformadores>=4.37.0.
⚠️ Atenção ao modelo básico: Para obter a melhor qualidade de geração de texto, geralmente é recomendável não usar os modelos de linguagem base diretamente.
💡 Técnicas pós-treino: Para explorar todo o potencial do Qwen 1.5, considere aplicar técnicas de pós-treinamento, como o Ajuste Fino Supervisionado (SFT), o Aprendizado por Reforço a partir do Feedback Humano (RLHF) ou o pré-treinamento contínuo do modelo para tarefas ou domínios específicos.

⚖️ Contrato de Licença para Qwen 1.5

Cada modelo da série Qwen 1.5 possui sua licença específica, detalhada em seu repositório da Hugging Face. É importante que você... NÃO É necessário submeter um pedido especial para uso comercial, simplificando a implementação para empresas e desenvolvedores.

🌟 Conclusão: O futuro dos LLMs com Qwen 1.5

O Qwen 1.5 (1.8B) O modelo representa uma conquista fundamental no campo dos grandes modelos de linguagem. Suas impressionantes capacidades, aliadas a um desempenho competitivo e um robusto suporte multilíngue, o posicionam como uma ferramenta altamente promissora para uma ampla gama de aplicações de IA. À medida que este modelo continua a evoluir, podemos antecipar recursos ainda mais avançados e melhorias de desempenho adicionais, tornando-o um ativo essencial para a inovação.

❓ Perguntas frequentes (FAQs)

P: O que é Qwen 1.5 (1.8B)?
A: Qwen 1.5 (1.8B) é a versão beta do Qwen2, um modelo de linguagem de grande porte baseado em transformadores e somente decodificador, desenvolvido pela Alibaba Cloud, notável por seu equilíbrio entre desempenho e eficiência.

P: Quais são as principais características arquitetônicas do Qwen 1.5?
A: Utiliza uma arquitetura Transformer com ativação SwiGLU, viés de atenção QKV, atenção de consulta em grupo e uma combinação de janela deslizante e atenção completa, suportando um comprimento de contexto de 32K tokens.

P: Como o Qwen 1.5 se compara a outros LLMs como o GPT-3.5-Turbo ou o Mixtral?
A: O Qwen 1.5 demonstra desempenho superior em capacidades básicas, compreensão da linguagem, raciocínio e alinhamento com as preferências humanas em vários parâmetros de avaliação.

P: Posso usar o Qwen 1.5 para fins comerciais?
R: Sim, você pode. Não é necessário enviar uma solicitação especial para uso comercial. Consulte a licença específica de cada modelo no repositório da Hugging Face.

P: Há alguma recomendação para usar o Qwen 1.5 de forma eficaz?
A: Recomenda-se instalar transformadores>=4.37.0 e aplicar técnicas de pós-treinamento como SFT ou RLHF em vez de usar os modelos base diretamente para geração de texto.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos