



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'Qwen/Qwen2-1.5B-Instruct',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="Qwen/Qwen2-1.5B-Instruct",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalhes do produto
✨ Qwen2 1.5B Instruct: Um modelo de linguagem compacto e poderoso
Apresentando Qwen2 1.5B Instruções, um modelo de linguagem de última geração, otimizado para instruções, desenvolvido pela renomada equipe Qwen do Alibaba Group. Lançado em 7 de junho de 2024A partir da versão 2.0, este modelo de conversão de texto em texto atinge um equilíbrio ideal entre alto desempenho e utilização eficiente de recursos, tornando-o uma excelente escolha para uma ampla gama de aplicações de processamento de linguagem natural (PLN).
Informações básicas:
- Nome do modelo: Qwen2 1.5B Instruções
- Desenvolvedor/Criador: Equipe Qwen (Grupo Alibaba)
- Data de lançamento: 7 de junho de 2024
- Versão: 2.0
- Tipo de modelo: Modelo de linguagem texto-para-texto
🚀 Principais Características e Vantagens de Desempenho
A Qwen2 1.5B Instruct foi projetada com recursos avançados para oferecer desempenho e eficiência superiores:
- Ajustado por instruções: Otimizado para melhor compreensão e execução de tarefas específicas, resultando em maior precisão e relevância.
- Atenção de consulta em grupo (GQA): Aumenta significativamente a velocidade de inferência e reduz o consumo de memória, tornando-o altamente eficiente para diversas aplicações.
- Incorporações em série: Aumenta a eficiência dos parâmetros, contribuindo para o tamanho compacto do modelo sem comprometer a capacidade.
- Comprimento do contexto estendido: Processa entradas de até 128.000 tokens e gera saídas contendo até 8.000 tokens, permitindo uma compreensão contextual mais profunda.
- Suporte multilíngue robusto: Suporta 29 idiomas além do inglês e do chinês, incluindo francês, espanhol, português, alemão, italiano, russo, japonês, coreano, vietnamita, tailandês e árabe, atendendo a uma base de usuários global.
✅ Casos de uso e aplicações pretendidos
O Qwen2 1.5B Instruct é um modelo altamente versátil, adequado para uma ampla gama de tarefas de processamento de linguagem natural, incluindo:
- Geração de texto: Criar conteúdo coerente e contextualizado.
- Respostas a perguntas: Fornecer respostas precisas e esclarecedoras às perguntas.
- Compreensão da linguagem: Analisar e interpretar padrões linguísticos complexos.
- Geração de código: Auxiliar desenvolvedores na geração de trechos de código e funções.
- Resolução de problemas matemáticos: Enfrentando desafios numéricos e lógicos.
⚙️ Detalhes técnicos e arquitetura
Arquitetura:
O modelo é construído sobre a robustez Arquitetura de transformadores, aprimorado com diversas modificações importantes:
- Ativação do SwiGLU: Melhora a não linearidade e o desempenho do modelo.
- Atenção ao viés QKV: Aprimora o mecanismo de atenção para melhor foco e compreensão.
- Atenção de consulta em grupo (GQA): Otimiza o processamento para operações mais rápidas e com maior eficiência de memória.
- Tokenizador Avançado: Um tokenizador aprimorado, projetado especificamente para lidar de forma superior com múltiplas linguagens naturais e código.
Dados de treinamento:
- Fonte e tamanho dos dados: O modelo foi treinado em um extenso conjunto de dados que compreende aproximadamente 18 trilhões de tokens.
- Nível de conhecimento limite: O conhecimento do modelo está atualizado até Setembro de 2024.
- Diversidade e Viés: Os dados de treinamento incorporam um amplo espectro de idiomas e domínios, meticulosamente selecionados para reduzir o viés e aumentar a robustez do modelo em diversos tópicos.
Métricas de desempenho:
O Qwen2 1.5B Instruct demonstra melhorias significativas de desempenho em comparação com seu antecessor.

Imagem: Comparação de desempenho entre o Qwen2 1.5B Instruct e seu antecessor.
Comparação com outros modelos:
- Precisão: Apresenta melhorias significativas em relação ao seu antecessor em diversos indicadores da indústria.
- Velocidade: A implementação do Group Query Attention (GQA) garante taxas de inferência significativamente mais rápidas em comparação com as versões anteriores.
- Robustez: Recursos multilíngues aprimorados e um conjunto de dados de treinamento diversificado contribuem para uma melhor generalização em uma variedade de tópicos e idiomas.
- Testes no mundo real: Em nossas avaliações internas, incluindo análises abrangentes como Comparação entre LLama 3 e Qwen 2 e Comparação entre Qwen 2 72B e ChatGPT 4oO Qwen2 demonstrou um desempenho louvável, mesmo diante de instruções culturalmente específicas e não óbvias. É particularmente recomendado para aplicações que envolvam grupos linguísticos asiáticos devido ao seu forte suporte.
📚 Diretrizes de Uso e Ética
Exemplos de código:
A integração do Qwen2 1.5B Instruct em seus projetos foi projetada para ser simples. Aqui está um exemplo típico de preenchimento automático de chat:
Observação: Os detalhes específicos de implementação podem variar dependendo do seu ambiente de desenvolvimento e da integração da API.
Diretrizes Éticas:
O uso responsável e ético é fundamental. Os usuários são fortemente encorajados a aderir aos seguintes princípios:
- Respeito direitos de propriedade intelectual Ao incorporar conteúdo gerado em projetos pessoais ou comerciais.
- Esteja criticamente atento e aborde os potenciais problemas. preconceitos que podem aparecer nos resultados do modelo.
- Use o modelo de forma responsável e evite ativamente gerar conteúdo prejudicial, enganoso ou inadequado.
Licenciamento:
O Qwen2 1.5B Instruct está disponível sob licença permissiva. Licença Apache 2.0, o que permite uma ampla utilização tanto em aplicações comerciais quanto não comerciais.
❓ Perguntas frequentes (FAQ)
Q1: O que é a instrução Qwen2 1.5B?
A1: O Qwen2 1.5B Instruct é um modelo de linguagem texto-para-texto compacto e otimizado para instruções, desenvolvido pela equipe Qwen do Alibaba Group e projetado para oferecer desempenho eficiente em diversas tarefas de processamento de linguagem natural.
Q2: Quais são as principais características que contribuem para a sua eficiência?
A2: Sua eficiência deriva da Atenção de Consulta em Grupo (GQA, na sigla em inglês) para inferência mais rápida e redução de memória, incorporações vinculadas para otimização de parâmetros e um comprimento de contexto estendido, equilibrando desempenho poderoso com uso eficiente de recursos.
Q3: Quantos idiomas o Qwen2 1.5B Instruct suporta?
A3: O modelo oferece suporte multilíngue robusto para 29 idiomas, incluindo uma ampla gama de idiomas globais, como inglês, chinês, francês, espanhol, japonês, coreano e árabe.
Q4: O Qwen2 1.5B Instruct pode ser usado para fins comerciais?
A4: Sim, o Qwen2 1.5B Instruct é distribuído sob a licença Apache 2.0, que permite seu uso tanto para aplicações comerciais quanto não comerciais.
Q5: Qual é a data limite de conhecimento para este modelo?
A5: Os dados de treinamento do modelo garantem que seu conhecimento esteja atualizado até setembro de 2024, fornecendo acesso a informações e tendências recentes.
Playground de IA



Conecte-se