



const { OpenAI } = require('openai');
const main = async () => {
const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });
const text = 'Your text string goes here';
const response = await api.embeddings.create({
input: text,
model: 'textembedding-gecko@001',
});
const embedding = response.data[0].embedding;
console.log(embedding);
};
main();
import json
from openai import OpenAI
def main():
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
text = "Your text string goes here"
response = client.embeddings.create(input=text, model="textembedding-gecko@001")
embedding = response.data[0].embedding
print(json.dumps(embedding, indent=2))
main()

Detalle del producto
Desbloquea la comprensión semántica con textembedding-gecko@001
El gecko de inserción de texto@001 modelo, desarrollado por Google Cloud y liberado en Febrero de 2024Es una potente solución de incrustación de texto. Transforma las entradas textuales en representaciones vectoriales de alta dimensión, capturando eficazmente el significado semántico y el contexto. Esto la convierte en una herramienta indispensable para una amplia gama de... Procesamiento del lenguaje natural (PLN) aplicaciones.
Información clave del modelo:
- ✅ Nombre del modelo: gecko de inserción de texto@001
- ✅ Desarrollador: Google Cloud
- ✅ Fecha de lanzamiento: Febrero de 2024
- ✅ Versión: 001
- ✅ Tipo de modelo: Incrustación de texto
Capacidades principales y funciones avanzadas
Aprovechando una arquitectura de transformador robusta, el modelo textembedding-gecko@001 ofrece un conjunto de características diseñadas para mejorar sus flujos de trabajo de PNL:
- 🔢 Dimensionalidad: Genera información altamente descriptiva. 768 dimensiones incrustaciones.
- 📝 Longitud de entrada: Admite textos de entrada extensos de hasta 3072 fichas.
- 🧠 Arquitectura: Construido sobre tecnología avanzada arquitectura del transformador con mecanismos de autoatención para una comprensión contextual profunda.
- Búsqueda semántica: Poderes superiores búsqueda semántica capacidades, mejorando significativamente la precisión de recuperación.
- 🎯 Aprendizaje multitarea: Beneficios de entrenamiento multitarea, lo que conduce a una mejor generalización en diversas tareas de PNL.
Casos de uso ideales
La versatilidad de textembedding-gecko@001 lo hace adecuado para numerosas aplicaciones:
- 🔍 Búsqueda y recuperación semántica: Mejorar el descubrimiento y la relevancia del contenido.
- 📈 Clasificación y agrupamiento de textos: Organizar y categorizar grandes conjuntos de datos de texto de manera eficiente.
- 💡Recomendación de contenido: Ofrecer sugerencias de contenido personalizadas y precisas.
- 💭 Comprensión del lenguaje natural (NLU) y sistemas de diálogo: Construyendo una IA conversacional más inteligente.
Soporte de idiomas: Optimizado principalmente para Inglés, con capacidades adaptables a otros idiomas según el contexto.
Especificaciones técnicas y rendimiento
Puntos de referencia de rendimiento
El modelo demuestra un sólido desempeño en todas las métricas clave:
- 📊 Precisión: Logra aproximadamente 90% de precisión sobre puntos de referencia de similitud semántica estándar.
- Puntuación F1: Reporta un impresionante Puntuación F1 de 0,88 sobre tareas típicas de clasificación de PNL.
- ⏱ Velocidad de inferencia: Cuenta con una latencia media de tan solo 100 milisegundos por solicitud en condiciones óptimas.
Arquitectura y formación subyacentes
En esencia, textembedding-gecko@001 emplea un sofisticado arquitectura del transformadorEste diseño, que comprende múltiples capas de redes neuronales de autoatención y de retroalimentación, es crucial por su capacidad de comprender profundamente el contexto y las relaciones intrincadas dentro del texto.
Amplios datos de entrenamiento:
- 📚 Tamaño del conjunto de datos: Entrenado en un vasto conjunto de datos de más de 1 mil millones de tokens.
- 🌍Fuentes de datos: Compilado a partir de una combinación diversa de datos con licencia, textos disponibles públicamente y conjuntos de datos propietarios de Google, lo que garantiza una comprensión integral de los matices del lenguaje.
- 🕜 Nivel de conocimiento: Los datos de entrenamiento incluyen información hasta Enero de 2024, aportando conocimientos relativamente actuales.
Consideraciones sobre diversidad y sesgo: Si bien el conjunto de datos de entrenamiento está diseñado para abarcar una amplia gama de temas y perspectivas, se recomienda estar atento, ya que aún pueden existir sesgos. Se recomienda la evaluación y actualización continuas para perfeccionar la imparcialidad del modelo.
Análisis comparativo: textembedding-gecko@001 frente a otros modelos
Para comprender mejor su posición, aquí se compara textembedding-gecko@001 con otros modelos de incrustación líderes:
| Característica | gecko de inserción de texto@001 | gecko de inserción de texto@003 | Ada-002 (AI abierta) |
|---|---|---|---|
| Dimensionalidad | 768 | 768 | 1536 |
| Exactitud | 90% | 92% | 89% |
| Puntuación de F1 | 0,88 | 0.90 | 0,86 |
| Velocidad (ms) | 100 | 90 | 120 |
| Robustez | Alto | Muy alto | Moderado |
| Casos de uso | Búsqueda semántica, clasificación de texto | Similar a Gecko@001 pero más robusto | Búsqueda semántica, clasificación de texto |
Nota: Las métricas de rendimiento pueden variar según los casos de uso y las configuraciones específicas.
Introducción a la incrustación de texto - gecko@001
Integración y ejemplos de código
El gecko de inserción de texto@001 El modelo está disponible en el Plataforma API de IA/MLPuedes integrarlo en tus aplicaciones usando el identificador "gecko de incrustación de texto@001".
A continuación se muestra un ejemplo de código conceptual para incrustar texto:
importar plataforma ai
project_id = "id-de-su-proyecto"
región = "us-central1"
aiplatform .init(proyecto= id_proyecto , ubicación= región )
nombre_modelo = "textembedding-gecko@001"
modelo = aiplatform.Endpoint.create_model (nombre_del_modelo)
text_to_embed = "Este es un texto de ejemplo para incrustar."
incrustaciones = modelo .predict([ texto_a_incrustar ])
print ( "Incrustación generada:" , incrustaciones [ 0 ][:10], "..." ) # Mostrar las primeras 10 dimensiones Documentación de la API
Para obtener guías de integración completas, información detallada sobre puntos finales y mejores prácticas, consulte el sitio web oficial Documentación de la API de IA/ML.
IA ética y licencias
Directrices éticas
El desarrollo de textembedding-gecko@001 se adhiere estrictamente a principios éticos de la IA, haciendo hincapié en la transparencia, la rendición de cuentas y la mitigación proactiva de sesgos. Se recomienda encarecidamente a los usuarios que supervisen continuamente la imparcialidad de los resultados del modelo e implementen medidas de seguridad sólidas para evitar posibles usos indebidos.
Información de licencia
Este modelo se proporciona bajo Condiciones de licencia de Google CloudAdmite aplicaciones comerciales y no comerciales, sujetas a requisitos de cumplimiento específicos detallados en la documentación de licencia oficial.
Preguntas frecuentes (FAQ)
P1: ¿Qué es textembedding-gecko@001?
A1: Es un modelo de incrustación de texto de vanguardia de Google Cloud (lanzado en febrero de 2024) que convierte el texto en representaciones vectoriales de 768 dimensiones y captura el significado semántico para diversas tareas de PNL.
P2: ¿Cuáles son los principales casos de uso de este modelo?
A2: Las aplicaciones clave incluyen la búsqueda semántica, la clasificación de texto, la recomendación de contenido y la mejora de la comprensión del lenguaje natural en los sistemas de diálogo.
P3: ¿Cómo funciona textembedding-gecko@001 en comparación con otros modelos?
A3: Ofrece un rendimiento competitivo con una precisión del 90 % y una puntuación F1 de 0,88, además de una velocidad de inferencia eficiente de 100 ms. Si bien su dimensionalidad es de 768, suele alcanzar una precisión comparable o superior a la de modelos como Ada-002 en pruebas de referencia específicas.
P4: ¿El modelo es principalmente para inglés o admite otros idiomas?
A4: Aunque está optimizado principalmente para inglés, posee capacidades para otros idiomas, dependiendo del contexto y sus diversos datos de entrenamiento.
Q5: ¿Cuál es la fecha límite de conocimiento para sus datos de entrenamiento?
A5: Los datos de entrenamiento del modelo incluyen información disponible hasta enero de 2024, lo que garantiza que su base de conocimientos esté relativamente actualizada para la mayoría de las aplicaciones.
Patio de juegos de IA



Acceso