



const { OpenAI } = require('openai');
const api = new OpenAI({
baseURL: 'https://api.ai.cc/v1',
apiKey: '',
});
const main = async () => {
const result = await api.chat.completions.create({
model: 'tiiuae/falcon-40b-instruct',
messages: [
{
role: 'system',
content: 'You are an AI assistant who knows everything.',
},
{
role: 'user',
content: 'Tell me, why is the sky blue?'
}
],
});
const message = result.choices[0].message.content;
console.log(`Assistant: ${message}`);
};
main();
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
response = client.chat.completions.create(
model="tiiuae/falcon-40b-instruct",
messages=[
{
"role": "system",
"content": "You are an AI assistant who knows everything.",
},
{
"role": "user",
"content": "Tell me, why is the sky blue?"
},
],
)
message = response.choices[0].message.content
print(f"Assistant: {message}")

Detalle del producto
Presentamos Falcon Instruct (40B): un salto en la IA de código abierto
El Instrucción de halcón (40B) Este modelo, diseñado meticulosamente por el Instituto de Innovación Tecnológica (TII), representa un avance significativo en los modelos de lenguajes de gran tamaño. Basado en la robusta Arquitectura del Falcon-40BEste modelo de 40 mil millones de parámetros se ha perfeccionado utilizando una combinación diversa del conjunto de datos de Baize. Publicado bajo la licencia de acceso público. Licencia Apache 2.0Marca el comienzo de una nueva era de modelado de lenguaje de código abierto accesible y de alto rendimiento para desarrolladores e investigadores de todo el mundo.
🚀 Por qué Falcon Instruct (40B) se destaca
Falcon Instruct (40B) está diseñado por expertos para Aplicaciones basadas en chat e instrucciones, aprovechando el potente marco Falcon-40B para lograr confiabilidad y eficiencia.
Los diferenciadores clave incluyen:
- Rendimiento líder en código abierto: Se clasifica constantemente como el mejor modelo de código abierto, superando a competidores como LLaMA y StableLM en el Tabla de clasificación de OpenLLM.
- Arquitectura optimizada: Incorpora innovaciones como Atención rápida y mecanismos de atención de múltiples consultas, mejorando significativamente el rendimiento de la inferencia y la eficiencia general.
⚠️ Consideración importante: Si bien es excepcional para seguir instrucciones, Falcon Instruct (40B) es No es la opción óptima para proyectos de ajuste adicionales.Para el desarrollo de modelos personalizados, se recomienda comenzar directamente desde el Modelo base del Falcon-40B. Para una más alternativa respetuosa con los recursos en tareas basadas en instrucciones, Falcon-7B-Instruct Sirve como una excelente opción.
💡 Características técnicas destacadas del modelo
- Arquitectura: Basado en un marco de trabajo basado únicamente en decodificadores causales, centrándose principalmente en Inglés y francés idiomas, derivados de un modelo Falcon-40B perfeccionado.
- Formación estratégica: Ajustado mediante una mezcla de 150 millones de tokens del conjunto de datos Baize y un 5% de datos de RefinedWeb, empleando el tokenizador Falcon-7B/40B para una comprensión óptima.
- Presupuesto: Definido por 60 capas y un d_modelo de 8192, con una arquitectura que incorpora elementos innovadores como incrustaciones posicionales rotatorias y mecanismos de atención paralelos para un mejor rendimiento.
✅ Orientación para usuarios e implementación responsable
Dadas sus capacidades avanzadas, Falcon Instruct (40B) se recomienda principalmente para interacciones directas basadas en chat.Para una aplicación responsable en entornos de producción, se recomienda encarecidamente a los usuarios que implementen medidas de salvaguardia y conducta evaluaciones de riesgos exhaustivas.
⚠️ Conciencia del sesgo lingüístico: Es crucial reconocer el modelo Formación centrada en el inglésEsto puede generar sesgos y estereotipos inherentes, lo que podría limitar su eficacia e idoneidad para aplicaciones en otros idiomas.
📚 Licencia y recursos adicionales
Falcon Instruct (40B) está disponible gratuitamente bajo la Licencia Apache 2.0, fomentando su uso y desarrollo generalizados. Próximos artículos y recursos adicionales proporcionarán información más detallada sobre su desarrollo y diversas aplicaciones. Tanto si desarrolla chatbots sofisticados como si busca mejorar las funciones de procesamiento del lenguaje de su aplicación, Falcon Instruct (40B) ofrece una base sólida para la innovación y la excelencia en el campo de los modelos de lenguaje de IA.
Ejemplo de API
Para integrar Falcon Instruct (40B) en sus aplicaciones, normalmente utilizará una estructura de llamada API similar a la siguiente (los detalles de implementación reales pueden variar según su entorno y el proveedor de API específico):
{ "model": "tiiuae/falcon-40b-instruct", "messages": [ {"role": "user", "content": "Explique Falcon Instruct (40B) en términos simples."} ], "max_tokens": 150, "temperature": 0.7 } ❓ Preguntas frecuentes (FAQ)
P1: ¿Para qué está diseñado principalmente Falcon Instruct (40B)?
A1: Falcon Instruct (40B) está específicamente optimizado para interacciones basadas en chat y seguimiento de instrucciones, lo que lo hace muy eficaz para tareas de ejecución de comandos e IA conversacional.
P2: ¿Falcon Instruct (40B) es adecuado para realizar ajustes adicionales?
A2: Si bien es excelente como modelo de instrucción, no se recomienda para ajustes posteriores. Para el desarrollo de modelos personalizados, se recomienda comenzar con el modelo base del Falcon-40B.
P3: ¿Cuáles son los principales idiomas que admite Falcon Instruct (40B)?
A3: El modelo se centra principalmente en los idiomas inglés y francés y funciona mejor con ellos, lo que refleja la composición de sus datos de entrenamiento.
P4: ¿Cuál es el modelo de licencia para Falcon Instruct (40B)?
A4: Falcon Instruct (40B) se publica bajo la licencia Apache 2.0, que permite un amplio uso, distribución, modificación y uso de patentes para fines comerciales y no comerciales.
Q5: ¿Cómo se diferencia Falcon Instruct (40B) de otros modelos de código abierto?
A5: Se distingue por su excelente desempeño en el tablero de clasificación OpenLLM, una arquitectura altamente optimizada con FlashAttention y atención multiconsulta, y su robusta capacidad para seguir instrucciones, lo que lo convierte en una opción líder en el espacio LLM de código abierto.
Patio de juegos de IA



Acceso