Afuera

Charlar

desactivar

Guanaco (33B)

Guanaco-33B es un modelo de chatbot de código abierto y alta calidad, desarrollado mediante el ajuste fino de LLaMA en OASST1 utilizando QLoRA de 4 bits. Está destinado a fines de investigación.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'togethercomputer/guanaco-33b',
    messages: [
      {
        role: 'system',
        content: 'You are an AI assistant who knows everything.',
      },
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();

                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="togethercomputer/guanaco-33b",
    messages=[
        {
            "role": "system",
            "content": "You are an AI assistant who knows everything.",
        },
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Guanaco (33B)

Detalles del producto

✨ Guanaco-33B: Un potente modelo de lenguaje natural de código abierto para IA conversacional

El Guanaco-33B Este modelo destaca como un modelo de lenguaje grande (LLM) de código abierto y de alta calidad, diseñado para aplicaciones avanzadas de chatbot. Desarrollado por Tim Dettmers y lanzado en Abril de 2023Este modelo de 33 mil millones de parámetros es una versión ajustada de la arquitectura LLaMA. Logra un rendimiento altamente competitivo con chatbots comerciales como ChatGPT, gracias a su uso innovador de QLoRA de 4 bits.

Detalles clave del modelo:

• Nombre del modelo: Guanaco
• Desarrollador/Creador: Tim Dettmers
• Fecha de lanzamiento: Abril de 2023
• Versión: 33B Parámetros
• Tipo de modelo: Modelo de lenguaje extenso basado en texto (LLM)

🚀 Características principales e innovaciones técnicas

Guanaco-33B incorpora varias características avanzadas que contribuyen a su eficiencia y alto rendimiento:

• Competencia multilingüe: Capacitado en el plan integral Conjunto de datos OASST1Destaca en lenguas con gran cantidad de recursos, al tiempo que admite una amplia variedad de entradas lingüísticas.
• Uso eficiente del adaptador: Emplea adaptadores LoRA con un r=64 configuración, integrada a la perfección en todas las capas del modelo base LLaMA.
• Ajuste fino de QLoRA de 4 bits: Utiliza QLoRA de 4 bits con el tipo de datos NormalFloat4, optimizando el modelo base y los adaptadores para reducir el consumo de memoria y acelerar la experimentación.
• Puntos de control ligeros: Ofrece puntos de control exclusivos para adaptadores, lo que reduce significativamente las dificultades para la experimentación y el desarrollo local.

🧠 Arquitectura, formación y análisis de datos

El modelo Guanaco-33B está construido sobre una base robusta. Arquitectura LLaMA, un modelo de lenguaje basado en Transformer ampliamente reconocido. Su proceso de ajuste fino se basa en un conjunto de datos clave:

Datos de entrenamiento:

• Fuente del conjunto de datos: Ajustado exclusivamente en el Conjunto de datos OASST1una colección colaborativa y multilingüe de conversaciones de asistentes de código abierto.
• Escala y alcance: Comprende más de 100.000 conversaciones en varios idiomas, lo que permite un diálogo diverso y abierto.
• Diversidad y prejuicios: La naturaleza multilingüe de OASST1 ayuda a mitigar los sesgos inherentes y mejora su capacidad para procesar entradas variadas, aunque los detalles completos del conjunto de datos no son públicos.
• Punto de corte de conocimiento: La fecha límite exacta para la obtención de información sobre Guanaco-33B no se divulga públicamente, en consonancia con su desarrollo continuo como proyecto de código abierto.

💡 Uso previsto, directrices éticas y licencias

Guanaco-33B se desarrolla principalmente para fines de investigaciónEs fundamental que los usuarios tengan en cuenta que, al igual que muchos modelos de IA experimentales, ocasionalmente puede producir resultados que podrían considerarse problemáticos.

Información importante:

• Soporte de idiomas: El rendimiento óptimo se observa en lenguajes con gran cantidad de recursos, lo que refleja la composición de sus datos de entrenamiento.
• Marco ético: Anthropic ha publicado directrices éticas para su desarrollo y uso, haciendo hincapié en la transparencia, la rendición de cuentas y la protección contra posibles usos indebidos.
• Detalles de la licencia: El modelo Guanaco-33B funciona bajo el Licencia Apache 2, lo que permite una amplia gama de aplicaciones comerciales y no comerciales. Sin embargo, el acceso a los pesos del modelo LLaMA subyacente requiere acuerdos de licencia independientes.

📊 Métricas de rendimiento y evaluación comparativa

Guanaco-33B ha sido evaluado rigurosamente en varios puntos de referencia, incluido el prestigioso Anthropic Chatbot Leaderboard. En estas plataformas, demuestra consistentemente sólido desempeño competitivo En comparación con los principales modelos de IA comerciales como ChatGPT y BARD de Google, cabe destacar que su rendimiento puede variar según el contexto lingüístico y las tareas específicas no contempladas en los parámetros de evaluación actuales.

🖥️ Ejemplo de integración de API

Para los desarrolladores que buscan integrar Guanaco-33B en sus aplicaciones, aquí tienen un ejemplo de uso estándar de la API:

nombre-de-datos = "open-ai.chat-completion" modelo-de-datos = "togethercomputer/guanaco-33b" >

❓ Preguntas frecuentes (FAQ)

P1: ¿Qué es el Guanaco-33B y qué lo hace único?

Guanaco-33B es un modelo LLM de código abierto, basado en texto y con 33 mil millones de parámetros, desarrollado por Tim Dettmers. Su singularidad reside en haber sido optimizado a partir del modelo LLaMA mediante QLoRA de 4 bits, lo que le permite ofrecer un rendimiento comparable al de los chatbots comerciales para fines de investigación.

P2: ¿Con qué tipo de datos se entrenó a Guanaco-33B?

Se perfeccionó con el conjunto de datos OASST1, una colección multilingüe de más de 100.000 conversaciones de asistentes de código abierto, lo que permitió sus amplias capacidades conversacionales.

P3: ¿Puede utilizarse Guanaco-33B en proyectos comerciales?

El modelo Guanaco-33B está disponible bajo la licencia Apache 2, que permite su uso tanto comercial como no comercial. Sin embargo, el uso de los pesos del modelo LLaMA subyacente requiere el cumplimiento de requisitos de licencia adicionales.

P4: ¿Cómo se compara su rendimiento con el de otros chatbots?

Guanaco-33B ha demostrado un rendimiento competitivo frente a chatbots comerciales como ChatGPT y BARD en varios puntos de referencia, incluida la clasificación de chatbots de Anthropic.

P5: ¿Existen consideraciones éticas en el uso de Guanaco-33B?

Sí, su uso principal es para investigación, y los usuarios deben ser conscientes de los posibles problemas que puedan surgir. Anthropic ha publicado directrices éticas centradas en la transparencia, la rendición de cuentas y la prevención del mal uso, las cuales deben cumplirse.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros