qwen-bg
max-ico04
8K
В
Вне
max-ico02
Чат
max-ico03
запрещать
Text-embedding-3-small
API text-embedding-3-small улучшает представление текста, обеспечивая более высокую точность и экономичность по сравнению со своим предшественником, text-embedding-ada-002.
Новые участники получат бесплатные токены номиналом 1 доллар.
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-embedding-3-large',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-embedding-3-large")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

Один API, более 300 моделей ИИ.

Сэкономьте 20% на расходах и получите бесплатные токены на 1 доллар.
qwenmax-bg
изображение
Text-embedding-3-small

Подробная информация о товаре

Представляем text-embedding-3-smallНовейшая разработка OpenAI в области встраивания текста.

Выпущено компанией OpenAI 25 января 2024 года, text-embedding-3-small Это передовая модель встраивания текста, разработанная для обеспечения превосходной производительности и эффективности. Эта модель представляет собой значительный шаг вперед, предназначенный для преобразования разнообразных текстовых входных данных в компактные числовые представления (встраивания), которые высокоэффективны для различных приложений машинного обучения. Она является мощным преемником текст-встраивание-ада-002Предлагая расширенные возможности во всех областях.

🌟 Основные характеристики и преимущества

  • Повышенная производительность: Достигает значительных улучшений в задачах поиска информации на нескольких языках (MIRACL) и задачах, специфичных для английского языка (MTEB), что делает его более надежным и точным.
  • 💰 Экономическая эффективность: Получите существенный опыт 5-кратное снижение затрат по сравнению со своим предшественником, текст-встраивание-ада-002Предлагая значительную экономию для разработчиков и предприятий.
  • 📏 Компактный размер: При размере встраивания 512 размеровЭта модель идеально подходит для сред с ограничениями по памяти и хранению данных, обеспечивая эффективную работу без ущерба для качества.

🚀 Универсальные приложения

Он text-embedding-3-small Модель разработана для широкого спектра применений, обеспечивая интеллектуальный анализ текста и интеграцию:

  • Интеллектуальный поиск: Повысьте эффективность поисковых алгоритмов, точно ранжируя результаты на основе семантической релевантности.
  • Кластеризация текста: Для углубленного анализа и организации данных группируйте похожие текстовые документы или строки.
  • Рекомендательные системы: Задействуйте сложные системы рекомендаций, предлагая похожие товары на основе текстового сходства.
  • Обнаружение аномалий: Выявляйте необычные закономерности или выбросы в больших массивах данных с высокой точностью.
  • Измерение разнообразия: Проанализируйте широкий спектр и разнообразие текстовых данных для получения более глубоких выводов.
  • Классификация контента: Классифицируйте текстовые строки, сопоставляя их с наиболее семантически схожими метками.

🌐 Широкая языковая поддержка

Предназначен для глобальной аудитории. text-embedding-3-small обеспечивает надежную поддержку для многоязычныечто значительно повышает его доступность и полезность в различных лингвистических наборах данных и международных приложениях.

⚙️ Технические характеристики

  • Архитектура: Данная модель использует самые современные технологии. архитектура на основе трансформатораТщательно оптимизирован как для повышения вычислительной эффективности, так и для высокопроизводительного создания встраиваний.
  • Тренировочные данные: Прошел обучение на обширная и разнообразная коллекция текстовых источниковЭто гарантирует охват широкого спектра лингвистических моделей и семантических нюансов. Комплексное обучение сводит к минимуму предвзятость и обеспечивает надежную работу в различных демографических группах и сценариях использования.
  • Источник и размер данных: Модель охватывает миллионы текстовых документов, что обеспечивает ей глубокое понимание языковых сложностей и контекста.

📊 Показатели производительности

Он text-embedding-3-small Эта модель устанавливает новые стандарты производительности встраивания:

  • Значительные улучшения по сравнению с текст-встраивание-ада-002:
    • Оценка MIRACL: Увеличение с 31,4% до 44,0%. (значительное улучшение на 12,6%).
    • Оценка MTEB: Улучшение с 61,0% до 62,3%..
  • 🎯 Повышенная точность: Демонстрирует превосходную точность как в многоязычных, так и в англоязычных тестовых наборах данных, обеспечивая более точные и надежные эмбеддинги.
  • Повышенная скорость: По сравнению с предыдущими моделями работает с большей эффективностью, что приводит к уменьшению задержки и снижению требований к вычислительным ресурсам.
  • 🛡️ Устойчивость: Способен эффективно обрабатывать различные типы входных данных, обеспечивая стабильную и надежную работу в широком диапазоне приложений и при различной сложности данных.

Часто задаваемые вопросы (FAQ)

В1: Что такое text-embedding-3-small?

A1: Это новейшая модель встраивания текста от OpenAI, выпущенная 25 января 2024 года, предназначенная для преобразования текста в эффективные числовые представления (встраивания) для задач машинного обучения, обеспечивающая повышенную производительность и экономичность по сравнению с предшественниками.

В2: Чем он отличается от text-embedding-ada-002?

А2: text-embedding-3-small обеспечивает значительно улучшенные характеристики (например, более высокие показатели MIRACL и MTEB) и в 5 раз экономичнее, чем текст-встраивание-ада-002при сохранении компактного размера встраивания.

В3: Каковы основные варианты использования этой модели?

A3: Он идеально подходит для широкого спектра применений, включая интеллектуальный поиск, кластеризацию текста, рекомендательные системы, обнаружение аномалий, измерение разнообразия и классификацию текста на разных языках.

Вопрос 4: Подходит ли text-embedding-3-small для многоязычных приложений?

A4: Да, он обладает широкой поддержкой нескольких языков и демонстрирует значительное улучшение производительности в тестах поиска по нескольким языкам (MIRACL), что делает его очень подходящим для работы с разнообразными лингвистическими наборами данных.

В5: Каков размер встраивания text-embedding-3-small?

A5: Модель генерирует эмбеддинги компактного размера. 512 размеровчто делает его эффективным в условиях ограниченного объема памяти и хранилища.

Игровая площадка для ИИ

Перед интеграцией протестируйте все модели API в тестовой среде. Мы предоставляем более 300 моделей для интеграции в ваше приложение.
Попробуйте бесплатно
api-right-1
модель-bg02-1

Один API
Более 300 моделей ИИ

Сэкономьте 20% на расходах