Разработчики решили задачу по сокращению собственных усилий, направленных на обучение роботизированных систем передвижению. Разработан алгоритм, который обеспечит искусственному интеллекту возможность научить ботов ходить. Система применяет методику обучения с подкреплением, применяя поощрение в случае достижения нужного результата.

Для испытаний был взят робот Minitaur, который двигался более 2-х часов, получая от алгоритма похвалу за правильные действия, наказание за отклонение от траектории или остановку. В ходе занятий удалось научить бота подбирать лучшую траекторию, быстро решать поставленные задачи.