Три новых возможности ИИ и роботов, о которых вы еще не знаете: мультимодальность, умение объяснять и обучаться через подражание

11 ноября 2024

По прогнозу Минпромторга, к 2030 году на российских предприятиях должно появиться более 94 000 роботов, а эффект от внедрения в России искусственного интеллекта, ИИ, к 2028 году может достичь 4,2-6,9 трлн рублей, что эквивалентно влиянию на ВВП до 4%. Роботизация и ИИ помогут ускорить производственные циклы, повысить точность, безопасность и эффективность работы. Объединение ИИ с роботизацией может привести к тому, что роботы станут осваивать все более сложные специальности. Не только работать на складе и водить автомобили! Задумайтесь, если подключить роботов с ИИ к компьютерам офисных сотрудников, робот проанализирует действия миллионов работников и поймет, как выполнять повторяющиеся задачи.

Читайте в нашем дайджесте сохранения энергии, как ИИ и роботы постепенно становятся все более умными, учатся объяснять свои действия и копировать действия людей.

Мультимодальность

Новые мультимодальные модели с использованием искусственного интеллекта, ИИ, способны обрабатывать и анализировать данные из различных модальностей: текст, изображения, видео, аудио. Например, они могут понимать обычную речь и одновременно воспринимать визуальную информацию. Это позволяет управлять роботами, используя обычные слова. Можно спросить робота, что он видит, или попросить его поднять желтый фрукт. Ученые отмечают, что эти модели в какой-то мере уже наделены зачатками здравого смысла — в примере с фруктом робот поймет, что банан, который лежит рядом с ним, — это разновидность желтого фрукта.

мультимодальный робот_Kandinsky 3.1.jpg

Интересно, что будет, если положить сэндвич-панель внутри здания из сэндвич-панелей или в холодильной камере и попросить взять сэндвич-панель.

В 2024 году российские ученые разработали первую в стране мультимодальную модель ИИ под названием OmniFusion, которая поддерживает диалог и отвечает на вопросы по картинкам. Робот подскажет рецепт блюда по фотографии ингредиентов – возможно, обратная последовательность тоже может быть востребованной – объяснит, как собрать устройство по фотографиям его отдельных частей, и даже поможет решить математический пример, написанный на доске. Также ИИ может проанализировать медицинский снимок и указать на проблему.

Умение объяснять

Новые модели ИИ позволяют роботам объяснять логику своих действий. Эту разновидность железного интеллекта назвали Explainable AI или «объяснимый ИИ» – системы и модели, которые могут объяснять свои действия и принимать решения понятным для людей образом. Такие модели быстрее и легче обучаются, а также реже выдумывают информацию. Особенно они востребованы там, где требуется высокий уровень объяснимости решений: медицина, финансы.

Ученые из Калифорнийского университета научили робота перенимать у людей навык открывания банок, а также объяснять планируемые действия несколькими способами. Робот Baxter с двумя руками, торсом и монитором вместо головы наблюдал за людьми, которые откручивали крышку от банки. Затем робот создал с помощью ИИ аналог действий человека с учетом различий в строении человеческой руки и манипулятора.

Отмечается, что из 4 способов объяснения действий робота:

видеозапись робота, откручивающего крышку
последовательность базовых действий
схематичную анимацию с визуализацией усилия
текстовое объяснение, изложенное простым языком

люди больше доверяют схематичной анимации.

Обучение через подражание

Роботы стали быстрее и лучше обучаться через подражание, а также научились переносить полученные навыки из одной области в другую. При этом новым роботам можно поручить не только повышать производительность труда в промышленности или в распределительных центрах, но и дать им приготовить обед, убраться в доме, попросить помочь пожилым людям.

К примеру, специалисты из Австрии с помощью подражания научили робота чистить раковину. Робот некоторое время наблюдал через камеры, как человек чистит губкой раковину на кухне. Полученную информацию обрабатывала модель искусственного интеллекта и использовала ее для обучения нейросети.

В результате эксперимента робот научился качественно подражать человеку. Чтобы закрепить результат, инженеры вручили роботу специальную губку с датчиками, отслеживающими силу нажатия. Так роботу удалось быстрее понять, как правильно держать губку и с какой силой надавливать на различные детали раковины.

В истории человечества новые технологии не только отнимали работу у людей, но и создавали новые сферы приложения людского труда. Увидим ли мы, как роботы будут легко обходить любого специалиста в решении задач, на навыки которых он или она потратили всю жизнь? Сколько понадобится людей для обслуживания роботов? Или роботы и с этим справятся сами, а людям останется только разбираться со старыми запутанными нестандартными ситуациями, алгоритм для выхода из которых слишком сложен? А может, условный учитель-человек все равно будет учить детей лучше за счет эмоциональной связи с учениками, и тогда люди-специалисты в итоге будут цениться больше, чем роботы?

У нас еще есть немного времени, пока этические спецификации для искусственного интеллекта начинаются с предпосылки, согласно которой технологии всегда должны находиться под контролем людей. Так или иначе, очевидно, нас ожидает увлекательное будущее.