qwen-bg
max-ico04
8K
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Llama 3 8B Instruct Lite
Llama 3 8B Instruct Lite API: el modelo de generación de texto más avanzado y económico de Meta para diálogos, optimizado para la seguridad y el rendimiento en aplicaciones comerciales y de investigación.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'meta-llama/Meta-Llama-3-8B-Instruct-Lite',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="meta-llama/Meta-Llama-3-8B-Instruct-Lite",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Llama 3 8B Instruct Lite

Detalle del producto

Presentamos Llama 3 8B Instruct Lite

El Llama 3 8B Instruct Lite modelo, desarrollado por Meta y liberado el 18 de abril de 2024, es un potente modelo de generación de texto optimizado para el diálogo interactivo y el seguimiento preciso de instrucciones.

✨ Aspectos destacados clave:

  • Arquitectura optimizada: Utiliza la atención de consultas agrupadas para mejorar la escalabilidad.
  • Instrucciones adaptadas: Beneficios del ajuste fino supervisado (SFT) y del aprendizaje de refuerzo a partir de la retroalimentación humana (RLHF) para una alineación superior.
  • Rendimiento alto: Supera consistentemente a muchos modelos de chat de código abierto líderes en los puntos de referencia de la industria.
  • Seguridad y utilidad: Diseñado para proporcionar respuestas útiles y seguras, adhiriéndose a los principios de IA responsable.

🎯 Uso previsto y compatibilidad con idiomas

Este modelo está diseñado principalmente para aplicaciones comerciales y de investigación, particularmente en el desarrollo de sofisticados chatbots tipo asistente y varias otras tareas de generación de lenguaje natural.

Si bien su soporte de idioma principal es InglésExiste potencial para realizar mejoras en otros idiomas, sujeto a acuerdos de licencia específicos.

⚙️ Especificaciones técnicas

Arquitectura:

Llama 3 es una modelo de lenguaje autorregresivo Construido sobre una robusta arquitectura de transformador. Incorpora Atención de consultas agrupadas (GQA) Para mejorar significativamente la escalabilidad de la inferencia. Las versiones optimizadas para instrucciones se refinan aún más mediante SFT y RLHF para alinear los resultados con las preferencias humanas.

Datos de entrenamiento:

  • Fuente: Compilado a partir de conjuntos de datos en línea disponibles públicamente.
  • Escala: Entrenado en un amplio conjunto de datos de más de 15 billones de tokens.
  • Nivel de conocimiento: El conocimiento del modelo 8B se extiende hasta Marzo de 2023.
  • Diversidad y sesgo: Se realizan grandes esfuerzos para garantizar datos de capacitación diversos, con evaluaciones continuas para minimizar posibles sesgos.

📊 Puntos de referencia de rendimiento

Métricas de precisión:

  • 68.4
    MMLU (5 disparos)
  • 72.6
    CommonSenseQA (7 disparos)
  • 62.2
    Evaluación humana (0 disparos)

Velocidad y robustez:

El modelo está meticulosamente optimizado para aplicaciones en tiempo real, con capacidades de inferencia altamente eficientes.

Demuestra algo excepcional generalización en diversos temas e idiomas, procesando eficazmente una amplia gama de entradas con gran robustez.

📖 Pautas de uso y ética

Despliegue responsable:

Meta ofrece una completa Guía de uso responsable, que describe las mejores prácticas para la implementación ética de modelos. Se recomienda encarecidamente a los desarrolladores que integren medidas de seguridad avanzadas, como Meta Llama Guard 2 y Escudo de código salvaguardias.

Licencia:

Los detalles específicos sobre la licencia comercial personalizada se pueden encontrar haciendo clic here (Meta Llama 3 License).

⚡ Hardware y huella de carbono

La formación involucró el avanzado Meta Supercúmulo de investigación complementado con recursos de computación en la nube de terceros para ajuste y evaluación.

Resumen de la huella de carbono:

  • Llama 3 8B: 1,3 millones de horas de GPU, 700 W, 390 tCO2eq
  • Total (en todos los modelos de Llama 3): 7,7 millones de horas de GPU, 2290 tCO2eq (100 % compensado por el programa de sostenibilidad de Meta)

🛡️ Responsabilidad y seguridad

Meta mantiene un compromiso inquebrantable con el desarrollo responsable de IA, promoviendo un enfoque abierto. La versión de Llama 3 incluye directrices y recursos actualizados para capacitar a los desarrolladores en la implementación de una seguridad de modelos eficaz.

Medidas de seguridad clave implementadas:

  • Amplio equipo rojo: Evaluaciones adversariales rigurosas para identificar y mitigar vulnerabilidades.
  • Mitigación de Negativas: Estrategias para minimizar falsos rechazos y mejorar la experiencia del usuario.
  • Procesos de liberación responsable: Diseñado para abordar posibles usos indebidos y riesgos críticos de forma proactiva.

❓ Preguntas frecuentes (FAQ)

¿Qué es Llama 3 8B Instruct Lite?

Llama 3 8B Instruct Lite es un modelo de texto generativo avanzado de Meta, lanzado el 18 de abril de 2024. Está específicamente optimizado para el diálogo y el seguimiento preciso de instrucciones, aprovechando una arquitectura de transformador refinada con atención de consulta agrupada.

¿Cuáles son las principales aplicaciones de este modelo?

Está destinado tanto a fines comerciales como de investigación, y se destaca en la creación de chatbots similares a asistentes y otras tareas de generación de lenguaje natural donde el seguimiento preciso de instrucciones y el diálogo natural son cruciales.

¿Qué datos de entrenamiento se utilizaron para Llama 3 8B?

El modelo se entrenó con más de 15 billones de tokens a partir de datos en línea disponibles públicamente, y su límite de conocimiento para la versión 8B se estableció en marzo de 2023. Meta enfatiza la diversidad y la evaluación continua de sesgos en sus conjuntos de datos.

¿Cómo garantiza Meta la seguridad de los modelos Llama 3?

Meta emplea amplias medidas de seguridad, como la formación de equipos rojos, evaluaciones adversarias, mitigación de rechazos para evitar falsos rechazos y procesos de liberación responsable. También proporciona una Guía de Uso Responsable y promueve el uso de medidas de seguridad como Meta Llama Guard 2 y Code Shield.

¿Dónde puedo encontrar los detalles de la licencia de Llama 3?

Los detalles de la licencia comercial personalizada están disponibles en el sitio web oficial de Llama de Meta. Puede consultar los términos específicos siguiendo el enlace proporcionado: Meta Llama 3 License.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos