qwen-bg
max-ico04
131 mil
Em
Fora
max-ico02
Bater papo
max-ico03
desativar
Llama 3.2 3B Instruir Turbo
Llama 3.2 3B Instruct Turbo: Modelo de linguagem multilíngue eficiente da Meta para diversas tarefas de PNL, equilibrando desempenho e requisitos computacionais.
Tokens de $1 grátis para novos membros
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'meta-llama/Llama-3.2-3B-Instruct-Turbo',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="meta-llama/Llama-3.2-3B-Instruct-Turbo",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.
qwenmax-bg
imagem
Llama 3.2 3B Instruir Turbo

Detalhes do produto

Apresentando o Llama 3.2 3B Instruir Turbo, um modelo de linguagem de grande porte (LLM) de última geração da MetaLançada em setembro de 2024, esta é a versão 3.2. modelo de linguagem texto-para-texto É projetado com maestria para oferecer desempenho superior no seguimento de instruções, mantendo ao mesmo tempo uma notável eficiência computacional. Destaca-se como uma solução leve e de alta qualidade, particularmente eficiente em tarefas multilíngues.

✨ Principais funcionalidades

  • 💻 3 bilhões de parâmetros: Obtém significativa eficiência computacional e desempenho robusto.
  • 💭 Otimizado para seguir instruções: Possui excelente capacidade de compreender e executar instruções complexas do usuário.
  • 🌍 Suporte multilíngue: Apresenta um desempenho sólido em uma ampla variedade de idiomas.
  • 📱 Arquitetura leve: Perfeitamente adequado para computação de borda e aplicações de IA móvel.
  • 🔧 Altamente personalizável: Oferece flexibilidade para integração às necessidades específicas de cada setor.

🚀 Casos de uso pretendidos

Llama 3.2 3B Instruct Turbo é uma ferramenta versátil para diversas aplicações de Processamento de Linguagem Natural (PLN), incluindo:

  • Geração de Diálogos Avançada
  • Resumo de texto eficiente
  • Serviços de Tradução de Alta Qualidade
  • Extração precisa de entidades
  • Análise de texto em tempo real para ambientes dinâmicos
  • Aplicações de IA em dispositivos móveis e de borda para processamento no próprio dispositivo
  • Agentes de Diálogo Multilíngues Inteligentes

🌐 Amplo suporte linguístico

O excelente desempenho multilíngue do modelo é comprovado por suas pontuações de referência em vários idiomas importantes, incluindo:

  • Inglês
  • Espanhol
  • Francês
  • Alemão
  • italiano
  • Português
  • Tailandês
  • Não

💡 Visão geral técnica

Arquitetura

O Llama 3.2 3B Instruct Turbo utiliza uma arquitetura Transformer otimizada com modelagem de linguagem autorregressiva, incorporando:

  • 3,21 bilhões de parâmetros: Uma configuração precisa de parâmetros para otimizar a eficiência.
  • Atenção de consulta em grupo (GQA): Aumenta a escalabilidade e a velocidade de inferência.
  • Incorporações compartilhadas: Otimizando o tamanho e o desempenho do modelo.
  • Comprimento do contexto: 128k Permite uma compreensão e processamento profundos de entradas mais longas.

Dados e Processo de Treinamento

O Llama 3.2 foi pré-treinado em um conjunto de dados colossal de até 9 trilhões de tokens Os dados foram obtidos de fontes públicas disponíveis online. O sofisticado programa de treinamento incluiu:

  1. Incorporação de logits derivados dos modelos Llama 3.1 8B e 70B.
  2. Destilação do conhecimento implementada após cuidadosa seleção.
  3. Múltiplas rodadas de alinhamento, apresentando:
    • Ajuste fino supervisionado (SFT)
    • Amostragem por Rejeição (AR)
    • Otimização de Preferências Diretas (DPO)

Fonte de dados: Uma nova combinação de dados online de acesso público, utilizando até 9T tokens durante o treinamento.

Nível de conhecimento limite: As informações do modelo estão atualizadas até Dezembro de 2023.

Diversidade e Viés: Seu desempenho consistentemente forte em vários idiomas ressalta um conjunto de dados de treinamento altamente diversificado, minimizando vieses inerentes.

📊 Indicadores de desempenho

O Llama 3.2 3B Instruct Turbo demonstra um desempenho notável em diversos benchmarks. Abaixo, uma representação visual de suas capacidades:

Testes de desempenho do Llama 3.2 3B Instruct Turbo

Desempenho Multilíngue (Benchmark MMLU)

  • Espanhol: 55,1%
  • Francês: 54,6%
  • Alemão: 53,3%

Comparação de modelos

  • Precisão: Consegue um forte 63,4% No teste de benchmark MMLU, apresentou desempenho altamente competitivo para seu tamanho quando comparado a modelos maiores como o Llama 3.1 8B (69,4%).
  • Velocidade: Apresenta uma velocidade de saída impressionante de 131,7 tokens por segundo, significativamente mais rápido que a média.
  • Robustez: Seu desempenho consistentemente forte em diversas linguagens e tarefas destaca suas excelentes capacidades de generalização.

🔨 Integração e Diretrizes

Exemplo de código

Os desenvolvedores podem integrar facilmente o Llama 3.2 3B Instruct Turbo. Aqui está um exemplo de trecho de código que ilustra seu uso em uma estrutura de API semelhante à da OpenAI:

🛡️ Política de Uso Ético

A implementação responsável da IA ​​é fundamental. Os termos de uso do Llama 3.2 3B Instruct Turbo proíbem estritamente:

  • Geração de código malicioso ou qualquer interferência em sistemas informáticos.
  • Contornar restrições de uso ou medidas de segurança predefinidas.
  • Envolvimento em quaisquer atividades ilegais.
  • Atividades que representam risco de dano a indivíduos.

📜 Informações sobre licenciamento

Os modelos Llama 3.2 são distribuídos sob um contrato de licenciamento específico. Desenvolvedores e organizações da União Europeia devem estar cientes de uma importante restrição de uso comercial:

Uso comercial proibido na UE: Com base na Política de Uso Aceitável do Llama 3.2, indivíduos e organizações localizados no Atualmente, a União Europeia não está autorizada a utilizar esses modelos para fins comerciais.

Para obter uma compreensão detalhada do uso aceitável e dos termos completos da licença, consulte o documento oficial. Política de Uso do Llama 3.2.

❓ Perguntas frequentes (FAQ)

Q1: O que é Llama 3.2 3B Instruct Turbo?

Trata-se de um modelo de linguagem amplo, compacto e poderoso, desenvolvido pela Meta, otimizado para executar instruções e lidar com tarefas multilíngues de forma eficiente. Ele foi projetado para diversas aplicações de PNL em diferentes plataformas.

Q2: Quais são as principais vantagens deste modelo?

Entre seus principais benefícios, destacam-se a quantidade modesta de 3 bilhões de parâmetros para maior eficiência, o robusto suporte multilíngue, a alta velocidade de saída e sua adequação para ambientes de IA de borda e móveis, oferecendo um forte potencial de personalização.

Q3: Quais idiomas o Llama 3.2 3B Instruct Turbo suporta efetivamente?

O modelo demonstra um desempenho sólido em inglês, espanhol, francês, alemão, italiano, português, tailandês e hindi, entre outros idiomas, conforme validado por testes de referência.

Q4: O uso comercial do Llama 3.2 3B Instruct Turbo é permitido na União Europeia?

Não. De acordo com a Política de Uso Aceitável do Llama 3.2, organizações e indivíduos na União Europeia estão atualmente proibidos de usar os modelos do Llama 3.2 para fins comerciais.

Q5: Qual é a data limite de conhecimento para o Llama 3.2 3B Instruct Turbo?

Os dados de treinamento do modelo incluem informações até dezembro de 2023. Portanto, sua base de conhecimento não se estende além dessa data.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Experimente grátis
api-right-1
modelo-bg02-1

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos