qwen-bg
max-ico04
32 mil
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Instrucción DBRX
API de instrucciones DBRX: el modelo de lenguaje grande y abierto de última generación de Databricks con funciones avanzadas y un rendimiento superior en los puntos de referencia de la industria.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'databricks/dbrx-instruct',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="databricks/dbrx-instruct",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Instrucción DBRX

Detalle del producto

Presentamos DBRX Instruct: una nueva era de LLM abiertos

DBRX Instruct, desarrollado por Bloques de datosEs un innovador modelo de lenguaje grande (LLM) diseñado para establecer nuevos estándares de rendimiento y eficiencia. Lanzado en 2023, este modelo Instruct, versión 1.0, aprovecha una arquitectura sofisticada para ofrecer capacidades superiores en una amplia gama de tareas de procesamiento del lenguaje natural.

  • ● Nombre del modelo: DBRX
  • ● Desarrollador/Creador: Bloques de datos
  • ● Fecha de lanzamiento: 2023
  • ● Versión: 1.0 Instruir
  • ● Tipo de modelo: Modelo de lenguaje grande (LLM)

🔥 Aspectos arquitectónicos y de rendimiento clave

En esencia, DBRX Instruct utiliza un Arquitectura de mezcla de expertos (MoE) de grano finoEste diseño innovador incorpora 132 mil millones de parámetros totales, con una activación dinámica de 36 mil millones de parámetros para cualquier entrada dada, lo que garantiza una eficiencia y un rendimiento óptimos.

✨ Características principales:

  • ✓ Sistema MoE avanzado: Cuenta con 16 expertos capaces de seleccionar 4, lo que ofrece 65 veces más combinaciones de expertos posibles que otros modelos MoE abiertos destacados.
  • ✓ Amplios datos de entrenamiento: Preentrenado con unos impresionantes 12 billones de tokens de datos de texto y código meticulosamente seleccionados.
  • ✓ Dominio del benchmark: Demuestra un desempeño excepcional en parámetros críticos que incluyen conocimiento general, razonamiento de sentido común, programación y razonamiento matemático.
  • ✓ Supera a sus pares: Supera consistentemente a los principales modelos abiertos como Mixtral Instruct y Code Llama (70B) en varias evaluaciones.

📜 Casos de uso previstos y soporte multilingüe

DBRX Instruct está diseñado como un LLM de propósito general, lo que lo hace increíblemente versátil para una multitud de aplicaciones de procesamiento del lenguaje natural (PLN).

💬 Ideal para:

  • ✍ Generación de texto: Elaboración de textos coherentes y contextualmente relevantes.
  • ❓ Respuesta a preguntas: Proporcionar respuestas precisas y perspicaces a las consultas.
  • 💻 Generación de código: Generar fragmentos de código de alta calidad y resolver desafíos de programación.
  • 🔢 Razonamiento matemático: Sobresalir en tareas que requieran una comprensión matemática compleja.

Además, DBRX Instruct se destaca como un modelo multilingüe, capaz de procesar y generar contenidos en un amplio espectro de idiomas, mejorando su aplicabilidad global.

Análisis en profundidad: Especificaciones técnicas y rendimiento

Arquitectura

DBRX Instruct se basa en un Arquitectura LLM basada en transformador y solo decodificadorEntrenado con el objetivo de predicción del siguiente token. Su configuración MoE de grano fino incluye 16 expertos distintos, seleccionando dinámicamente 4 para cada consulta de entrada para optimizar el procesamiento.

Calidad de los datos de entrenamiento

Las robustas capacidades del modelo se derivan de su entrenamiento previo en 12 billones de tokens de datos de texto y código meticulosamente seleccionadosCon una longitud máxima de contexto de 32 000 tokens, se estima que este conjunto de datos tiene al menos el doble de calidad que los datos utilizados para la familia de modelos MPT, lo que garantiza una gran capacidad de comprensión y generación.

Métricas de rendimiento vs. modelos líderes:

DBRX Instruct demuestra consistentemente un rendimiento superior en comparación con otros modelos abiertos líderes en puntos de referencia estándar:

  • MMLU: 73,7% (Instrucción DBRX) frente al 71,4 % (Mixtral Instruct)
  • HellaSwag 10 disparos: 89,0% (Instrucción DBRX) frente al 87,6 % (Mixtral Instruct)
  • WinoGrande: 81,8% (Instrucción DBRX) frente al 81,1 % (Mixtral Instruct)
  • Guantelete de Databricks: 66,8% (Instrucción DBRX) frente al 60,7 % (Mixtral Instruct)
  • Evaluación humana: 70,1% (Instrucción DBRX) frente al 54,8 % (Mixtral Instruct)
  • GSM8k: 66,9% (Instrucción DBRX) frente al 61,1 % (Mixtral Instruct)

💡 Introducción a DBRX Instruct

Acceso a la API

DBRX Instruct está diseñado para una fácil integración mediante API. Un fragmento de API de ejemplo (p. ej., `open-ai.chat-completion` con `databricks/dbrx-instruct`) demuestra su fácil uso para los desarrolladores.

Información sobre licencias

DBRX Instruct está disponible para su uso bajo la Licencia de modelo abierto de Databricks, promoviendo el amplio acceso y la innovación.

💬 Preguntas frecuentes (FAQ)

  • P: ¿Qué es el modelo DBRX Instruct?

    R: DBRX Instruct es un modelo de lenguaje grande (LLM) potente y de código abierto desarrollado por Databricks, conocido por su arquitectura de mezcla de expertos (MoE) de grano fino y su sólido desempeño en varias tareas de PNL.

  • P: ¿En qué se diferencia DBRX Instruct de otros LLM?

    R: Utiliza una arquitectura MoE única con 16 expertos (seleccionando 4 por entrada), que ofrece significativamente más combinaciones de expertos y supera a los modelos abiertos líderes como Mixtral Instruct y Code Llama (70B) en puntos de referencia clave.

  • P: ¿Cuáles son las principales aplicaciones de DBRX Instruct?

    R: Es un LLM de propósito general ideal para generación de texto, respuesta a preguntas, generación de código y tareas que requieren sólidas capacidades de programación y razonamiento matemático.

  • P: ¿DBRX Instruct es multilingüe?

    R: Sí, DBRX Instruct admite una amplia gama de idiomas, lo que lo hace adecuado para aplicaciones globales.

  • P: ¿Bajo qué licencia está disponible DBRX Instruct?

    R: DBRX Instruct se publica bajo la licencia de modelo abierto de Databricks.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos