



const { OpenAI } = require('openai');
const main = async () => {
const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });
const text = 'Your text string goes here';
const response = await api.embeddings.create({
input: text,
model: 'text-multilingual-embedding-002',
});
const embedding = response.data[0].embedding;
console.log(embedding);
};
main();
import json
from openai import OpenAI
def main():
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
text = "Your text string goes here"
response = client.embeddings.create(input=text, model="text-multilingual-embedding-002")
embedding = response.data[0].embedding
print(json.dumps(embedding, indent=2))
main()

Подробная информация о товаре
Представляем Text-multilingual-embedding-002
Он Text-multilingual-embedding-002 Модель от Google Cloud представляет собой значительный шаг вперед в области обработки естественного языка (NLP). Выпущена в Март 2023 г.Эта передовая модель встраивания текста разработана для преобразования текстовых данных в высококачественные числовые векторные представления, точно передающие семантическое значение и контекстные нюансы на множестве языков.
Его главное преимущество заключается в беспрецедентной многоязычной поддержке, что делает его незаменимым инструментом для глобальных приложений, требующих глубокого понимания языка.
⭐ Основные характеристики модели
- Название модели: Text-multilingual-embedding-002
- Разработчик: Google Облако
- Дата выпуска: Март 2023 г.
- Версия: 002
- Тип модели: Встраивание текста
🚀 Основные возможности
- Поддерживает более 100 языков, что обеспечивает поистине глобальный охват.
- Генерирует высококачественные семантические вложения которые точно отражают смысл текста.
- Тщательно оптимизировано для решения различных задач обработки естественного языка., обеспечивая универсальность и производительность.
- Предложения высокая скорость выводаимеет решающее значение для приложений, работающих в режиме реального времени.
- Демонстрирует устойчивость к разнообразным лингвистическим структурам.
🎯 Предполагаемые области применения
Эта мощная модель идеально подходит для широкого спектра многоязычных и кросс-язычных приложений, включая:
- Кроссъязыковые поисковые системы для точного поиска глобальной информации.
- Многоязычные чат-боты способный эффективно общаться, преодолевая языковые барьеры.
- Анализ настроений понять общественное мнение на разных языках.
- Улучшенный услуги языкового перевода с лучшим пониманием контекста.
- Сложный системы рекомендаций контента Разработано для разнообразной аудитории.
Примечательно, что Text-multilingual-embedding-002 превосходно подходит для межъязыковых приложений в клинической документации и исследованиях. Более подробную информацию об этой и других моделях ИИ в здравоохранении можно найти здесь. здесь (Ссылка на раздел «Клиническая документация и исследования» оригинальной статьи «Искусственный интеллект в здравоохранении: примеры и применение генеративного ИИ»).
⚙️ Технические характеристики
Архитектура
В основе модели лежит высокоэффективная Архитектура трансформатораДанная разработка использует механизмы самовнимания для эффективной обработки и генерации векторных представлений, которые умело улавливают сложные контекстные связи между словами в разных языках.
Данные об обучении и разнообразие
Text-multilingual-embedding-002 был обучен на обширный и разнообразный набор данныхвключающие приблизительно 1 миллиард приговоров Этот обширный учебный корпус, собранный из книг, веб-сайтов и различных других многоязычных источников, обеспечивает всестороннее понимание лингвистических нюансов и способствует надежному обобщению знаний на разных языках и в разных контекстах.
Данные модели актуальны на данный момент. Март 2023 г.Несмотря на предпринятые усилия по минимизации предвзятости за счет использования разнообразных источников данных, важно признать, что, как и во всех больших языковых моделях, некоторые присущие обучающим данным искажения все же могут отражаться.
📊 Показатели производительности
Massive Text Embedding Benchmark (MTEB)
Результаты, полученные на бенчмарке MTEB, подчеркивают высокую точность модели, особенно в следующих аспектах: сценарии поиска и классификацииКлючевые показатели включают в себя:
- ✅ nDCG@10: 60.8
- ✅ Запоминание по 100 пунктов: 92.4
Эти результаты подтверждают способность модели ранжировать релевантные документы и эффективно извлекать информацию из больших, сложных наборов данных. Модель также продемонстрировала исключительную устойчивость, стабильно показывая хорошие результаты даже при работе с разнообразным пользовательским контентом (UGC) на разных языках и с различными структурами.
Сравнительный анализ
Модель Text-multilingual-embedding-002 демонстрирует весьма конкурентоспособные результаты по сравнению с другими ведущими моделями многоязычного встраивания. В оценках MTEB она показала средний результат. Точность 64,0 в различных задачах, что подчеркивает его сильные стороны в обработке многоязычных запросов.
Данная модель заметно превзошла несколько признанных моделей в своей категории:
- Text-multilingual-embedding-002: 64.0 (Средняя точность)
- LaBSE (языково-независимое встраивание предложений BERT): 45.2
- Cohere: 64.0
- BGE (Best Generative Embedding): 64.2
💡 Использование и интеграция
Доступ к API и примеры кода
Он Text-multilingual-embedding-002 Модель легко доступна на Платформа API для ИИ/машинного обучения, идентифицируемый как "text-multilingual-embedding-002"В рамках платформы предоставляются практические примеры кода для облегчения быстрой интеграции.
(Ссылка: Платформа API для ИИ/машинного обученияраздел "Примеры кода"
Документация по API
Для получения исчерпывающих рекомендаций по интеграции и подробных инструкций по использованию обратитесь к [ссылка на документацию]. Документация по API Доступно на веб-сайте AI/ML API.
⚖️ Этичный ИИ и лицензирование
Разработка Text-multilingual-embedding-002 осуществляется в соответствии со строгими стандартами. этичные методы использования ИИс акцентом на прозрачность, справедливость и подотчетность в своей разработке и применении.
Модель доступна по адресу: коммерческое лицензирование, разрешая как коммерческое, так и некоммерческое использование, в соответствии с установленными условиями обслуживания Google Cloud.
Часто задаваемые вопросы (ЧЗВ)
В1: Что такое Text-multilingual-embedding-002?
А: Это передовая модель встраивания текста от Google Cloud, выпущенная в марте 2023 года, предназначенная для преобразования текста в числовые векторные представления, которые отражают семантическое значение и контекст более чем на 100 языках.
В2: Сколько языков он поддерживает?
А: Данная модель поддерживает более 100 языков, включая широко используемые, такие как английский, испанский, французский, китайский и арабский, что делает её очень универсальной для применения по всему миру.
В3: Каковы основные варианты использования этой модели?
А: Он идеально подходит для кроссъязыковых поисковых систем, многоязычных чат-ботов, анализа настроений, сервисов языкового перевода и систем рекомендаций контента. Он также находит специфическое применение в клинической документации и исследованиях.
В4: Как её характеристики соотносятся с другими моделями?
А: Модель Text-multilingual-embedding-002 демонстрирует конкурентоспособные результаты, достигая средней точности 64,0% на бенчмарке MTEB, что соответствует или превосходит показатели таких моделей, как LaBSE и Cohere, в различных задачах.
В5: Доступно ли оно для коммерческого использования?
А: Да, Text-multilingual-embedding-002 доступен по коммерческой лицензии, разрешающей как коммерческое, так и некоммерческое использование, в соответствии с условиями обслуживания Google Cloud.
Игровая площадка для ИИ



Авторизоваться