



const { OpenAI } = require('openai');
const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });
const main = async () => {
const prompt = `
All of the states in the USA:
- Alabama, Mongomery;
- Arkansas, Little Rock;
`;
const response = await api.completions.create({
prompt,
model: 'meta-llama/Llama-3-8b-hf',
});
const text = response.choices[0].text;
console.log('Completion:', text);
};
main();
from openai import OpenAI
client = OpenAI(
api_key="",
base_url="https://api.ai.cc/v1",
)
def main():
response = client.completions.create(
model="meta-llama/Llama-3-8b-hf",
prompt="""
All of the states in the USA:
- Alabama, Mongomery;
- Arkansas, Little Rock;
""",
)
completion = response.choices[0].text
print(f"Completion: {completion}")
main()

Detalle del producto
✨ Presentamos Llama-3 (8B): el potente LLM de código abierto de Meta
Llama-3 (8B) es un modelo de lenguaje grande (LLM) de vanguardia desarrollado por Meta, lanzado el 18 de abril de 2024. Como miembro clave de la familia Llama, este modelo de 8 mil millones de parámetros está meticulosamente diseñado para tareas de texto generativo, destacando especialmente en aplicaciones de diálogo. Destaca en el panorama del código abierto por su rendimiento superior en los benchmarks del sector, priorizando la utilidad y la seguridad del usuario.
Detalles del modelo
- 🏷️ Nombre: Llama-3 (8B)
- 🏢 Desarrollador: Meta
- 🗓️ Fecha de lanzamiento: 18 de abril de 2024
- Versión del modelo: 1.0
- 🧠 Tipo: Modelo de lenguaje grande (LLM)
Ventajas clave
- ✅ Supera a muchos modelos de chat de código abierto
- ✅ Optimizado para casos de uso de diálogo
- ✅ Fuerte enfoque en la utilidad
- ✅ Funciones de seguridad mejoradas
💡 Llama-3 (8B) Características y capacidades clave
- Razonamiento mejorado y generación de código: Llama-3 (8B) muestra avances significativos en sus habilidades de razonamiento y su capacidad para generar fragmentos de código funcionales de alta calidad.
- Mayor diversidad en las respuestas: El modelo está diseñado para producir una gama más amplia de respuestas atractivas y variadas, lo que da lugar a conversaciones más naturales y dinámicas.
- Alineación mejorada con las preferencias humanas: Mediante un sofisticado ajuste, Llama-3 (8B) comprende y se alinea mejor con los valores y preferencias humanos, lo que lo hace ideal para aplicaciones interactivas.
- Optimizado para tareas de chat y PNL: Este modelo está específicamente optimizado para destacarse en escenarios de chat tipo asistente y en un amplio espectro de tareas de generación de lenguaje natural.
🎯 Uso previsto y compatibilidad con idiomas
Llama-3 (8B) está diseñado para ambos aplicaciones comerciales y de investigación, principalmente en contextos angloparlantes. Las versiones optimizadas para instrucciones son ideales para desarrollar asistentes de IA conversacionales, mientras que los modelos preentrenados ofrecen versatilidad para adaptarse a diversas tareas de generación de lenguaje natural.
Si bien su soporte principal es para el idioma en InglésSu naturaleza de código abierto significa que los desarrolladores tienen la flexibilidad de ajustar o adaptar el modelo para su uso con otros lenguajes, ampliando su alcance potencial.
⚙️ Especificaciones técnicas
Arquitectura
El modelo Llama-3 (8B) aprovecha un avanzado arquitectura de transformador optimizadaUna innovación clave es la incorporación de Atención de Consulta Agrupada (GQA), que mejora significativamente la escalabilidad de la inferencia. Con 8 mil millones de parámetrosEl modelo está diseñado tanto para eficiencia como para alto rendimiento, lo que lo hace robusto para aplicaciones de IA exigentes.
Datos de entrenamiento
Llama-3 (8B) se entrenó en un conjunto de datos vasto y diverso que comprende 15 billones de tokens de datos en línea disponibles públicamente. Este extenso corpus de entrenamiento abarca una amplia gama de temas y dominios, lo que garantiza que el modelo posea conocimientos completos y actualizados. El límite de conocimiento para sus datos de entrenamiento es Marzo de 2023.
🚀 Rendimiento y puntos de referencia
Llama-3 (8B) entrega constantemente resultados de última generación en varios puntos de referencia de la industria, lo que demuestra sus capacidades superiores.
.webp)
Más allá de su precisión, el modelo exhibe una velocidad operativa impresionante, ostentando una velocidad de salida de 119,6 tokens por segundo y una latencia notablemente menor en comparación con los modelos promedio. También cuenta con una generosa ventana de contexto de 8.000 tokens, lo que permite interacciones más largas y complejas.
🛡️ IA responsable y licencias
Directrices éticas
Meta ha establecido una sólida directrices éticas Para el despliegue responsable y seguro de Llama-3 (8B). Estas directrices abordan exhaustivamente áreas críticas como la privacidad de datos, la mitigación del sesgo algorítmico y la moderación eficaz de contenido, estableciendo un alto estándar para el desarrollo responsable de IA.
Tipo de licencia
Llama-3 (8B) se libera bajo un licencia comercial personalizadaEsta licencia permite a los desarrolladores utilizar el modelo con fines comerciales y de investigación, con términos y condiciones específicos detallados en el acuerdo. La dedicación de Meta a los principios de código abierto y a la innovación responsable en IA contribuye significativamente al avance de los estándares de la industria.
Nota: Un fragmento específico para completar la API (`
❓ Preguntas frecuentes (FAQ) sobre Llama-3 (8B)
A1: Llama-3 (8B) es un modelo de lenguaje grande (LLM) de código abierto de 8 mil millones de parámetros desarrollado por Meta, optimizado para texto generativo, especialmente aplicaciones de diálogo.
A2: Sus puntos fuertes incluyen un razonamiento y una generación de código mejorados, una generación de respuestas diversas, una fuerte alineación con las preferencias humanas y un alto rendimiento en los puntos de referencia de la industria.
A3: Sí, se publica bajo una licencia comercial personalizada, que permite fines comerciales y de investigación, con términos específicos delineados en el acuerdo de licencia.
A4: Llama-3 (8B) admite principalmente el idioma inglés, aunque su naturaleza de código abierto permite posibles ajustes o adaptaciones para otros idiomas.
A5: El modelo cuenta con una ventana de contexto de 8.000 tokens, lo que le permite procesar y generar secuencias textuales más largas y coherentes.
Patio de juegos de IA



Acceso