Международная группа исследователей создала новый подход к имитации движений человека, объединив центральные генераторы шаблонов (CPG) и глубокое обучение с подкреплением (DRL). Метод не только имитирует движения ходьбы и бега, но также генерирует движения на частотах, где данные о движении отсутствуют, обеспечивает плавный переход движений от ходьбы к бегу и позволяет адаптироваться к средам с нестабильными поверхностями.
Подробности их прорыва были опубликованы в журнале IEEE Robotics and Automation Letters 15 апреля 2024 года.
Возможно, мы не особо задумываемся об этом, но ходьба и бег включают в себя врожденные биологические резервы, которые позволяют нам приспосабливаться к окружающей среде или изменять скорость ходьбы/бега.
Учитывая сложность и сложность этого процесса, воспроизведение подобных человеческим движений в роботах, как известно, является чрезвычайно сложной задачей.
Современные модели часто с трудом приспосабливаются к неизвестным или сложным условиям, что делает их менее эффективными и результативными.
Это связано с тем, что ИИ подходит для генерации одного или небольшого количества правильных решений. В отношении живых организмов и их движения не существует одной правильной модели, которой нужно следовать.
Существует целый ряд возможных движений, и не всегда ясно, какой из них лучший или наиболее эффективный. DRL — один из способов, с помощью которого исследователи пытались преодолеть эту проблему.
DRL расширяет традиционное обучение с подкреплением, используя глубокие нейронные сети для решения более сложных задач и обучения непосредственно на основе необработанных сенсорных данных, обеспечивая более гибкие и мощные возможности обучения.
Его недостатком являются огромные вычислительные затраты на исследование огромного входного пространства, особенно когда система имеет высокую степень свободы.
Другой подход — имитационное обучение, при котором робот учится, имитируя данные измерения движения человека, выполняющего ту же задачу движения.
Хотя имитационное обучение хорошо подходит для обучения в стабильной среде, оно затрудняется, когда сталкивается с новыми ситуациями или средами, с которыми оно не сталкивалось во время обучения.
Его способность эффективно изменяться и ориентироваться становится ограниченной из-за узких границ усвоенного им поведения. «Мы преодолели многие ограничения этих двух подходов, объединив их», — объясняет Мицухиро Хаясибе, профессор Высшей инженерной школы Университета Тохоку.
«Имитационное обучение использовалось для обучения CPG-подобного контроллера, и вместо того, чтобы применять глубокое обучение к самим CPG, мы применили его к форме рефлекторной нейронной сети, которая поддерживала CPG».
CPG — это нейронные цепи , расположенные в спинном мозге , которые, подобно биологическому проводнику, генерируют ритмические паттерны мышечной активности.
У животных рефлекторная цепь работает в тандеме с CPG, обеспечивая адекватную обратную связь, которая позволяет им регулировать скорость и движения при ходьбе/беге в соответствии с местностью.
Приняв структуру CPG и ее рефлексивный аналог, метод адаптивной имитации CPG (AI-CPG) достигает замечательной адаптивности и стабильности при генерации движения, имитируя при этом движение человека.
«Этот прорыв устанавливает новый стандарт в создании человеческих движений в робототехнике с беспрецедентной способностью адаптации к окружающей среде», — добавляет Хаясибе.
«Наш метод представляет собой значительный шаг вперед в разработке технологий генеративного искусственного интеллекта для управления роботами с потенциальным применением в различных отраслях.
» В состав исследовательской группы вошли представители Высшей инженерной школы Университета Тохоку и Федеральной политехнической школы Лозанны или Швейцарского федерального технологического института в Лозанне.
Рубрика: Игры. Читать весь текст на android-robot.com.