Главные новости

Объяснение физических проблем управления искусственным интеллектом и автономными системами.

2026-05-06 от AICC
Управление физическим ИИ

Управление вокруг Физический ИИ Задача становится все более сложной по мере интеграции автономных систем искусственного интеллекта в роботов, датчики и промышленное оборудование. Критически важный вопрос выходит за рамки простого определения того, могут ли агенты ИИ выполнять задачи, — он включает в себя то, как их действия проверяются, контролируются и останавливаются при взаимодействии с реальными системами.

📊 Рост промышленной робототехники

Промышленная робототехника закладывает прочную основу для данного обсуждения. Международная федерация робототехники сообщили, что 542 000 промышленных роботов В 2024 году по всему миру было установлено более чем вдвое больше оборудования, чем за аналогичный период десятилетней давности. Прогнозы показывают, что количество установок достигнет 575 000 единиц в 2025 году и превзойти 700 000 единиц к 2028 году.

Исследователи рынка применяют термин «физический ИИ» к всё более широкому спектру систем, включая робототехнику, периферийные вычисления и автономные машины. Grand View Research По оценкам, мировой рынок физического искусственного интеллекта составляет... 81,64 млрд долларов США в 2025 годупрогнозируемый рост 960,38 млрд долларов США к 2033 годуХотя категоризация зависит от того, как поставщики определяют интеллект в физических системах.

🔄 От результатов моделирования к физическому действию

Задача управления принципиально отличается от автоматизации, осуществляемой исключительно с помощью программного обеспечения, поскольку физические системы работают в окружении рабочих мест, инфраструктуры и пользователей. Они подключаются к оборудованию, требующему четких ограничений безопасности. Результаты моделирования могут быть преобразованы в движение робота, машинные инструкции или принятие решений на основе данных с датчиков. Пределы безопасности и пути эскалации неотъемлемая часть проектирования системы.

🤖 Инновации Google DeepMind в области робототехники

Работа Google DeepMind в области робототехники демонстрирует, как модели искусственного интеллекта адаптируются к этой среде. Компания представила Gemini Robotics и Gemini Robotics-ER В марте 2025 года они были описаны как модели, созданные на основе Gemini 2.0 для робототехники и воплощенного ИИ. Gemini Robotics функционирует как модель «зрение-язык-действие», предназначенная для непосредственного управления роботами, в то время как Gemini Robotics-ER фокусируется на воплощенном мышлении, включая пространственное понимание и планирование задач.

Робот, использующий этот тип модели, должен идентифицировать объекты, понимать инструкции и планировать последовательность движений. Он также должен оценивать точность выполнения задачи, что создает задачу управления, охватывающую оба аспекта. модель поведения и ограничения механической системы.

Основные требования к полезным роботам:

  • Обобщение – Работа с незнакомыми объектами и окружающей средой
  • Интерактивность – Реагирование на человеческий фактор и меняющиеся условия
  • Ловкость – Выполнение физических задач, требующих точных движений.

В рекламных материалах Google DeepMind заявила, что робототехника Gemini Robotics способна выполнять инструкции на естественном языке и многоэтапные манипуляционные задачи. В качестве примеров приводились следующие: складывание бумаги, упаковка предметов в пакеты и работа с предметами, не встречавшимися во время обучения..

⚙️ Технические требования, выходящие за рамки понимания языка

Технические требования к физическому искусственному интеллекту выходят за рамки понимания языка и включают в себя визуальное восприятие, пространственное мышление, планирование задач и определение успешного выполнения. В робототехнике... обнаружение успеха Это крайне важно, поскольку системам необходимо определять, завершены ли задачи, требуется ли повторная попытка или следует ли их остановить.

Google DeepMind Gemini Robotics-ER 1.6Представленная в апреле 2026 года модель демонстрирует, как эти функции внедряются в более новые модели. Компания описывает эту модель как поддерживающую пространственную логику, планирование задач и обнаружение успеха, с возможностью анализа промежуточных шагов и принятия решения о продолжении или повторной попытке.

В документации для разработчиков Google указано, что Gemini Robotics-ER 1.6 доступен в режиме предварительного просмотра через API Gemini. Он описывается как модель «зрение-язык», которая переносит возможности Gemini в области робототехники, включая визуальную интерпретацию, пространственное мышление и планирование на основе команд, передаваемых на естественном языке.

🛡️ Меры безопасности при проектировании систем

Сложность управления возрастает, когда системы могут вызывать инструменты, генерировать код или запускать действия. Механизмы контроля должны определять:

  • К каким данным система имеет доступ
  • Какие инструменты оно может использовать
  • Какие действия требуют одобрения человека?
  • Как регистрируется активность для последующего анализа

Исследование McKinsey о доверии к ИИ к 2026 году освещает эту проблему в контексте корпоративного ИИ в более широком смысле, обнаруживая, что лишь приблизительно одна треть организаций Сообщается об уровнях зрелости три и выше в области стратегии, управления и управления агентным ИИ, даже несмотря на то, что системы ИИ берут на себя все более автономные функции.

В робототехнике безопасность охватывает физическое поведение машин. Компания Google DeepMind описывает безопасность роботов как многоуровневую проблему, включающую в себя:

🔹 Элементы управления нижнего уровня: Предотвращение столкновений, ограничения по силе, устойчивость

🔹 Рассуждения более высокого уровня: Контекстная оценка безопасности запрашиваемых действий

Компания представила ASIMOV, набор данных для оценки семантической безопасности в робототехнике и воплощенном искусственном интеллекте, предназначенный для проверки того, могут ли системы понимать инструкции, связанные с безопасностью, и избегать небезопасного поведения в физических условиях.

📋 Рамки и стандарты управления

Управление программными агентами становится более сложной задачей, когда системы подключаются к роботам, датчикам или промышленному оборудованию. К таким системам относятся: права доступа, журналы аудита, поведение при отказе, пути эскалации и тестирование.

Системы управления, такие как Рамочная программа управления рисками в области искусственного интеллекта NIST и ISO/IEC 42001 Обеспечить структуры для управления рисками и обязанностями в области ИИ на протяжении всего жизненного цикла системы. В физическом ИИ эти средства контроля должны учитывать поведение модели, подключенные машины и операционную среду.

🤝 Партнерства и сотрудничество в отрасли

В рамках разработки решений в области воплощенного искусственного интеллекта Google DeepMind заключила партнерские соглашения с компаниями, занимающимися робототехникой. В марте 2025 года компания объявила о партнерстве с... Аптроник на человекоподобных роботах, использующих Gemini 2.0, список Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools В числе проверенных тестировщиков Gemini Robotics-ER.

В обновлении 2026 года упоминалась работа с Бостон Динамик Включая задачи робототехники, такие как считывание показаний приборов, — варианты использования, зависящие от визуального восприятия, планирования задач и надежной оценки физических условий.

🏭 Применение в реальном мире

Физический ИИ применяется к промышленная инспекция, производство, логистика, производственные объекты и складыЭти условия требуют от систем интерпретации реальных условий и действий в рамках установленных ограничений. Вопрос управления сосредоточен на том, как эти ограничения устанавливаются до того, как автономным системам будет разрешено принимать или выполнять решения.

📅 Предстоящее событие: Google DeepMind и Google AI Studio указаны в качестве технологических партнеров хакатона для Выставка AI & Big Data Expo North America 2026, происходящее в 18–19 мая в конференц-центре МакЭнери в Сан-Хосе.

(Фото предоставлено) Митчелл Луо)

См. также: В центре внимания оказывается управление агентами ИИ, поскольку регулирующие органы указывают на пробелы в контроле.

Хотите узнать больше об искусственном интеллекте и больших данных от лидеров отрасли? Посмотрите! Выставка искусственного интеллекта и больших данных Мероприятие пройдет в Амстердаме, Калифорнии и Лондоне. Это масштабное событие является частью TechEx и проводится одновременно с другими ведущими технологическими мероприятиями, нажмите здесь. здесь для получения дополнительной информации.

AI News работает на базе TechForge MediaОзнакомьтесь с другими предстоящими мероприятиями и вебинарами, посвященными корпоративным технологиям. здесь.

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах