qwen-bg
max-ico04
8K
В
Вне
max-ico02
Чат
max-ico03
запрещать
Джемма 3н 4Б
Модель Gemma 3n эффективно работает на устройствах с ограниченными ресурсами, таких как телефоны, используя выборочную активацию параметров для снижения требований к ресурсам и работая с эффективным размером параметров в 2 или 4 миллиарда.
Новые участники получат бесплатные токены номиналом 1 доллар.
Text to Speech
                                        const { OpenAI } = require('openai');

const api = new OpenAI({
  baseURL: 'https://api.ai.cc/v1',
  apiKey: '',
});

const main = async () => {
  const result = await api.chat.completions.create({
    model: 'google/gemma-3n-e4b-it',
    messages: [
      {
        role: 'user',
        content: 'Tell me, why is the sky blue?'
      }
    ],
  });

  const message = result.choices[0].message.content;
  console.log(`Assistant: ${message}`);
};

main();
                                
                                        import os
from openai import OpenAI

client = OpenAI(
    base_url="https://api.ai.cc/v1",
    api_key="",    
)

response = client.chat.completions.create(
    model="google/gemma-3n-e4b-it",
    messages=[
        {
            "role": "user",
            "content": "Tell me, why is the sky blue?"
        },
    ],
)

message = response.choices[0].message.content

print(f"Assistant: {message}")
Docs

Один API, более 300 моделей ИИ.

Сэкономьте 20% на расходах и получите бесплатные токены на 1 доллар.
qwenmax-bg
изображение
Джемма 3н 4Б

Подробная информация о товаре

Джемма 3н 4Б Google — это инновационная, ориентированная на мобильные устройства и многомодальная модель искусственного интеллекта. Специально разработанная для эффективного развертывания на устройствах, она предоставляет возможности ИИ корпоративного уровня непосредственно на смартфонах и планшетах. Используя свои передовые технологии, она обеспечивает доступ к ИИ корпоративного уровня. Архитектура MatFormer и кэширование PLEGemma 3n 4B обеспечивает высокую производительность при удивительно низком потреблении ресурсов.

⚙️ Технические характеристики

Показатели производительности

Gemma 3n 4B тщательно оптимизирована для мобильных устройств и обладает расширенными возможностями многомодальной обработки:

  • Контекстное окно: 8K токенов
  • Выходная мощность: До 2000 токенов за ответ
  • Отпечаток памяти: Поддерживает динамический режим работы 2–3 ГБ, что впечатляет, учитывая количество параметров от 5 до 8 байт.
  • Скорость обработки: В 1,5 раза быстрее чем ее предшественница, Gemma 3 4B, на мобильных устройствах.

Цены на API

БЕСПЛАТНО

🚀 Показатели эффективности

Судя по результатам сравнительного теста Chatbot Arena Elo, Gemma 3n демонстрирует исключительную производительность, получив оценку... 1283Это ставит его на замечательное второе место, совсем немного уступая Claude 3.7 Sonnet (1287). Это достижение особенно примечательно, учитывая, что Gemma 3n достигает такой высокой производительности, имея в памяти всего 4 миллиарда параметров.

Gemma 3n Chatbot Arena Elo Score
Gemma 3n Chatbot Arena Elo Score

💡 Ключевые возможности

Gemma 3n 4B разработана для обеспечения высокоэффективной многомодальной обработки данных с использованием ИИ, особенно в условиях ограниченных ресурсов:

  • Архитектура MatFormer: Используется выборочная активация параметров, что значительно снижает вычислительные затраты и улучшает время отклика.
  • Кэширование PLE (встраивание на уровне слоя): Оптимизирует использование памяти за счет стратегической переноски параметров на быстрое хранилище.
  • Условная загрузка параметров: Динамически загружает только необходимые параметры (текст, изображение или звук), что дополнительно повышает эффективность использования памяти.
  • Многоязычная поддержка: Прошли обучение более чем на... 140 языков, что обеспечивает универсальное глобальное развертывание.
  • Дизайн, ориентированный на конфиденциальность: Работает полностью в автономном режиме, обеспечивая повышенную конфиденциальность и безопасность данных без необходимости подключения к интернету.

🎯 Оптимальные варианты использования

  • Мобильные приложения: Обеспечивает работу передовых функций искусственного интеллекта на смартфонах и планшетах, даже при ограниченном объеме оперативной памяти.
  • Периферийные вычисления: Обеспечивает обработку данных с помощью ИИ в режиме реального времени непосредственно на устройствах IoT и встроенных системах.
  • Автономные решения на основе искусственного интеллекта: Идеально подходит для приложений, ориентированных на защиту конфиденциальности и требующих надежной локальной обработки.

💻 Примеры кода

Ознакомьтесь с практическими примерами кода для интеграции Gemma 3n 4B в ваши проекты разработки:

⚖️ Сравнение с другими моделями

  • Против Джеммы 3 4B: Доставляет Ускорение обработки на 50%в сочетании с превосходным качеством выходных данных и уменьшенным объемом используемой памяти.
  • В сравнении со стандартными моделями 5B-8B: Работает с эффективным объемом памяти 2–4 ГБ (2–3 ГБ ОЗУ), что значительно меньше, чем типичные требования аналогичных моделей, составляющие 6–16 ГБ.
  • Против Квен 3 4B: Демонстрирует превосходные результаты в задачах классификации и извлечения структурированного JSON, хотя результаты могут различаться в приложениях для программирования и RAG.

🚫 Ограничения

Несмотря на свою мощность, Gemma 3n 4B имеет определенные ограничения:

  • Отсутствуют возможности интегрированного машинного зрения.
  • Отсутствует поддержка тонкой настройки.
  • В основном ограничивается текстовыми заданиями.

🔗 Интеграция API

Gemma 3n 4B полностью доступна через API для искусственного интеллекта/машинного обучения. Для получения подробной документации и руководств по интеграции, пожалуйста, нажмите здесь: Доступно здесь.

❓ Часто задаваемые вопросы (FAQ)

1. Какова основная цель Gemma 3n 4B?

Gemma 3n 4B разработана как многомодальная модель искусственного интеллекта, ориентированная на мобильные устройства и оптимизированная для обеспечения высокоэффективной работы смартфонов и планшетов с минимальным потреблением ресурсов, а также для внедрения возможностей ИИ корпоративного уровня.

2. Каким образом Gemma 3n 4B достигает высокой эффективности и низкого потребления памяти?

В нем используется инновационная архитектура MatFormer для выборочной активации параметров, кэширование Per-Layer Embedding (PLE) для разгрузки параметров и условная загрузка параметров для динамической загрузки только необходимых компонентов, что в совокупности обеспечивает его превосходную эффективность.

3. Может ли Gemma 3n 4B работать без подключения к интернету?

Да, Gemma 3n 4B имеет конструкцию, ориентированную на конфиденциальность, что позволяет ей работать полностью в автономном режиме. Это делает её идеальной для приложений, требующих защиты конфиденциальности, и сценариев периферийных вычислений, где доступ к интернету может быть ограничен.

4. Каковы основные ограничения Gemma 3n 4B?

К основным недостаткам относятся отсутствие возможностей компьютерного зрения, отсутствие поддержки тонкой настройки пользователем, а также то, что его работа в основном ограничена задачами, связанными с текстом.

5. Чем Gemma 3n 4B отличается от своей предшественницы, Gemma 3 4B?

Gemma 3n 4B значительно превосходит своего предшественника, Gemma 3 4B, предлагая на 50% более высокую скорость обработки при одновременном сохранении превосходного качества выходных данных и меньшем объеме памяти.

Игровая площадка для ИИ

Перед интеграцией протестируйте все модели API в тестовой среде. Мы предоставляем более 300 моделей для интеграции в ваше приложение.
Попробуйте бесплатно
api-right-1
модель-bg02-1

Один API
Более 300 моделей ИИ

Сэкономьте 20% на расходах