Китайские разработчики представили инновационный фреймворк OmniXtreme, позволяющий гуманоидным роботам выполнять широкий спектр сложных динамических движений. Благодаря двухэтапной схеме обучения робот Unitree G1 успешно освоил сальто, боевые искусства и элементы брейк-данса с поразительной точностью.
Классические методы обучения для антропоморфных машин имеют ограничения. Основная сложность заключается в совмещении множества динамичных трюков в одном контроллере. Чем больше движений пытаются уместить в один контроллер, тем хуже он выполняет каждое из них, что приводит к снижению качества выполнения.
Фреймворк OmniXtreme использует двухэтапную схему обучения. На первом этапе для каждого движения из обширной библиотеки, созданной с помощью технологии захвата движений, тренируются отдельные экспертные политики. Затем знания всех экспертов объединяются в единую генеративную модель с помощью метода flow matching. Это позволяет создать универсальную библиотеку движений для андроида.
Вторая стадия решает проблему переноса движений на реальное «железо». Базовая модель, выучившая все движения, замораживается. Поверх неё обучается небольшая корректирующая нейросеть (residual policy) с помощью метода обучения с подкреплением. Эта остаточная политика вырабатывает небольшие поправки к базовым действиям, учитывая реалистичную модель электроприводов. В итоге на роботе Unitree G1 провели 157 испытаний на выполнение 24 различных движений. Общий показатель успеха составил около 91 процента.



