Вызов принят: высокоскоростной беспилотник с искусственным интеллектом обгоняет чемпионов мира по гонкам на беспилотниках

Помните, когда Deep Blue из IBM выиграл у Гэри Каспарова в шахматы в 1996 году, или AlphaGo из Google разгромил лучшего чемпиона Ли Седола в Go, гораздо более сложной игре, в 2016 году? Эти соревнования, в которых машины одерживали верх над людьми-чемпионами, являются ключевыми вехами в истории искусственного интеллекта. Теперь группа исследователей из Цюрихского университета и Intel установила новую веху, создав первую автономную систему, способную победить людей-чемпионов в физическом виде спорта: гонках на дронах.

Система искусственного интеллекта под названием Swift выиграла несколько гонок у трех чемпионов мирового класса в гонках на дронах с видом от первого лица (FPV), где пилоты управляют квадрокоптерами со скоростью более 100 км/ч, управляя ими удаленно, надевая гарнитуру, подключенную к бортовой камере.
Обучение путем взаимодействия с физическим миром

“Физические виды спорта являются более сложными для искусственного интеллекта, потому что они менее предсказуемы, чем настольные или видеоигры. У нас нет совершенных знаний о моделях беспилотников и окружающей среды, поэтому ИИ должен изучать их, взаимодействуя с физическим миром”, — говорит Давид Скарамуцца, руководитель группы робототехники и восприятия в Цюрихском университете и новоиспеченный капитан команды по гонкам на беспилотниках.

До недавнего времени автономным беспилотным летательным аппаратам требовалось в два раза больше времени, чем тем, которые пилотировались людьми, чтобы пролететь по гоночной трассе, если только они не полагались на внешнюю систему отслеживания местоположения для точного контроля своих траекторий. Swift, однако, реагирует в режиме реального времени на данные, собранные бортовой камерой, подобной той, что используется гонщиками-людьми. Его встроенный инерциальный измерительный блок измеряет ускорение и скорость, в то время как искусственная нейронная сеть использует данные с камеры для определения местоположения дрона в пространстве и обнаружения ворот вдоль гоночной трассы. Эта информация поступает в блок управления, также основанный на глубокой нейронной сети, которая выбирает наилучшее действие для завершения цикла как можно быстрее.
Swift проходил обучение в имитируемой среде, в которой система сама училась летать по принципу проб и ошибок.

Обучение в оптимизированной среде моделирования

Swift обучался в имитируемой среде, где он сам учился летать методом проб и ошибок, используя тип машинного обучения, называемый обучением с подкреплением. Использование моделирования помогло избежать уничтожения нескольких беспилотных летательных аппаратов на ранних стадиях обучения, когда система часто выходит из строя. “Чтобы убедиться, что последствия действий в симуляторе были максимально приближены к последствиям в реальном мире, мы разработали метод оптимизации симулятора с использованием реальных данных”, – говорит Элия Кауфманн, первый автор статьи.

На этом этапе беспилотник летел автономно благодаря очень точным позициям, обеспечиваемым внешней системой отслеживания местоположения, а также записывал данные со своей камеры. Таким образом, он научился автоматически исправлять ошибки, допущенные при интерпретации данных с бортовых датчиков.

Пилоты-люди по-прежнему лучше адаптируются к меняющимся условиям

После месяца моделирования времени полета, что соответствует менее чем часу на настольном ПК, Swift был готов бросить вызов своим конкурентам-людям: чемпиону Лиги по гонкам на дронах 2019 года Алексу Вановеру, чемпиону по гонкам на беспилотных летательных аппаратах 2019 года Томасу Битматте и трехкратному чемпиону Швейцарии Марвину Шапперу. Гонки проходили с 5 по 13 июня 2022 года на специально построенной трассе в ангаре аэропорта Дюбендорф, недалеко от Цюриха.

Трасса занимала площадь 25 на 25 метров, с семью квадратными воротами, которые нужно было пройти в правильном порядке, чтобы завершить круг, включая сложные маневры, в том числе Split-S, акробатический трюк, который включает в себя полуперекатывание дрона и выполнение полупетли на полной скорости.

В целом, Свифт проехал самый быстрый круг, на полсекунды опередив лучшего пилота-человека. С другой стороны, пилоты-люди оказались более приспособленными, чем автономный беспилотник, который выходил из строя, когда условия отличались от тех, для которых он был подготовлен, например, если в помещении было слишком много света.

Скарамуцца отмечает, что выход за рамки автономного полета важен не только для гонок на беспилотниках. “Дроны имеют ограниченную емкость аккумулятора; им требуется большая часть энергии только для того, чтобы оставаться в воздухе. Таким образом, летая быстрее, мы увеличиваем их полезность”.

Например, в таких областях применения, как мониторинг лесов или освоение космоса, быстрый полет важен для покрытия больших пространств за ограниченное время. В киноиндустрии быстрые автономные дроны можно было бы использовать для съемки экшн-сцен. А способность летать на высоких скоростях может иметь огромное значение для спасательных беспилотников, отправляемых внутрь горящего здания.