Afuera

Charlar

desactivar

Llama 3 8B Instruct Lite

Llama 3 8B Instruct Lite API: El modelo de generación de texto más avanzado y económico de Meta para diálogos, optimizado para la seguridad y el rendimiento en aplicaciones comerciales y de investigación.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'meta-llama/Meta-Llama-3-8B-Instruct-Lite',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="meta-llama/Meta-Llama-3-8B-Instruct-Lite",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Llama 3 8B Instruct Lite

Detalles del producto

Presentamos Llama 3 8B Instruct Lite

El Llama 3 8B Instruct Lite modelo, desarrollado por Meta y publicado el 18 de abril de 2024Es un potente modelo de generación de texto optimizado para el diálogo interactivo y el seguimiento preciso de instrucciones.

✨ Aspectos destacados:

✓ Arquitectura optimizada: Utiliza la atención a consultas agrupadas para una mayor escalabilidad.
✓ Instrucciones optimizadas: Beneficios del ajuste fino supervisado (SFT) y del aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF) para una alineación superior.
✓ Rendimiento alto: Supera sistemáticamente a muchos de los principales modelos de chat de código abierto en los parámetros de referencia del sector.
✓ Seguridad y disposición para ayudar: Diseñado para proporcionar respuestas útiles y seguras, respetando los principios de la IA responsable.

🎯 Uso previsto y soporte de idiomas

Este modelo está diseñado principalmente para aplicaciones comerciales y de investigación, en particular en el desarrollo de chatbots sofisticados con funciones de asistente y en diversas otras tareas de generación de lenguaje natural.

Si bien su soporte de idioma principal es InglésExiste la posibilidad de realizar ajustes en otros idiomas, sujetos a acuerdos de licencia específicos.

⚙️ Especificaciones técnicas

Arquitectura:

Llama 3 es un modelo de lenguaje autorregresivo construido sobre una sólida arquitectura de transformador. Incorpora Atención a consultas agrupadas (GQA) para mejorar significativamente la escalabilidad de la inferencia. Las versiones optimizadas para instrucciones se perfeccionan aún más utilizando SFT y RLHF para alinear los resultados con las preferencias humanas.

Datos de entrenamiento:

Fuente: Recopilado a partir de conjuntos de datos disponibles públicamente en línea.
Escala: Entrenado con un extenso conjunto de datos de más de 15 billones de tokens.
Punto de corte de conocimiento: El conocimiento del modelo 8B se extiende hasta Marzo de 2023.
Diversidad y prejuicios: Se realizan grandes esfuerzos para garantizar la diversidad de los datos de entrenamiento, con evaluaciones continuas para minimizar los posibles sesgos.

📊 Puntos de referencia de rendimiento

Métricas de precisión:

68.4
MMLU (5 disparos)
72.6
CommonSenseQA (7 preguntas)
62.2
HumanEval (0 disparos)

Velocidad y robustez:

El modelo está meticulosamente optimizado para aplicaciones en tiempo real, que cuenta con capacidades de inferencia altamente eficientes.

Demuestra ser excepcional generalización en diversos temas y lenguas, procesando eficazmente una amplia gama de entradas con gran robustez.

📖 Normas de uso y éticas

Despliegue responsable:

Meta proporciona una solución integral Guía de uso responsable, describiendo las mejores prácticas para la implementación ética de modelos. Se recomienda encarecidamente a los desarrolladores que integren medidas de seguridad avanzadas, incluyendo: Meta Llama Guard 2 y Escudo de código salvaguardias.

Licencias:

Puede encontrar detalles específicos sobre la licencia comercial personalizada haciendo clic aquí. here (Meta Llama 3 License).

⚡ Hardware y huella de carbono

El entrenamiento involucró los avanzados de Meta Supercluster de investigación complementado con recursos de computación en la nube de terceros para el ajuste fino y la evaluación.

Resumen de la huella de carbono:

Llama 3 8B: 1,3 millones de horas de GPU, 700 W, 390 tCO2eq
Total (en todos los modelos Llama 3): 7,7 millones de horas de GPU, 2290 tCO2eq (compensadas al 100% por el programa de sostenibilidad de Meta)

🛡️ Responsabilidad y seguridad

Meta mantiene un compromiso inquebrantable con el desarrollo responsable de la IA, promoviendo un enfoque abierto. El lanzamiento de Llama 3 viene acompañado de directrices y recursos actualizados para capacitar a los desarrolladores en la implementación de una seguridad de modelos eficaz.

Medidas de seguridad clave implementadas:

✓ Pruebas exhaustivas de equipo rojo: Evaluaciones adversarias rigurosas para identificar y mitigar vulnerabilidades.
✓ Medidas para mitigar las negativas: Estrategias para minimizar los rechazos injustificados y mejorar la experiencia del usuario.
✓ Procesos de liberación responsables: Diseñado para abordar de forma proactiva el posible uso indebido y los riesgos críticos.

❓ Preguntas frecuentes (FAQ)

¿Qué es Llama 3 8B Instruct Lite?

Llama 3 8B Instruct Lite es un modelo de texto generativo avanzado de Meta, lanzado el 18 de abril de 2024. Está optimizado específicamente para el diálogo y el seguimiento preciso de instrucciones, aprovechando una arquitectura de transformador refinada con atención de consulta agrupada.

¿Cuáles son las principales aplicaciones de este modelo?

Está diseñado tanto para fines comerciales como de investigación, destacando en la creación de chatbots con funciones de asistente y en diversas tareas de generación de lenguaje natural donde el seguimiento preciso de instrucciones y el diálogo natural son cruciales.

¿Qué datos de entrenamiento se utilizaron para Llama 3 8B?

El modelo se entrenó con más de 15 billones de tokens procedentes de datos públicos disponibles en línea, y su límite de conocimiento para la versión 8B se fijó en marzo de 2023. Meta hace hincapié en la diversidad y la evaluación continua de sesgos en sus conjuntos de datos.

¿Cómo garantiza Meta la seguridad de los modelos Llama 3?

Meta emplea exhaustivas medidas de seguridad, que incluyen pruebas de penetración (red teaming), evaluaciones adversarias, mitigación de rechazos para prevenir rechazos falsos y procesos de lanzamiento responsables. Además, ofrecen una Guía de Uso Responsable y promueven el uso de medidas de seguridad como Meta Llama Guard 2 y Code Shield.

¿Dónde puedo encontrar los detalles de la licencia para Llama 3?

Los detalles sobre la licencia comercial personalizada están disponibles en el sitio web oficial de Meta Llama. Puede consultar los términos específicos siguiendo el enlace proporcionado: Meta Llama 3 License.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros