Июнь в Воронежском госуниверситете – время не только сессии, но и защиты выпускных работ бакалавров и магистрантов. Среди представленных на суд комиссии разработок есть исследования, имеющие колоссальный научный и производственный потенциал. Об одной такой работе на факультете ПММ рассказывают магистрантка Ксения Харина и ее научный руководитель – доцент кафедры вычислительной математики и прикладных информационных технологий Сергей Медведев.
– Моя магистерская диссертация была посвящена исследованию подходов для построения траекторий движения робота-манипулятора. Идея принадлежала научному руководителю. Сергей Николаевич предложил мне исследовать методы построения траекторий, то есть перевода из одного положения в другое робота-манипулятора, а я придумала, какие математические методы можно использовать для решения этой задачи. Представьте: есть некая роборука, имеющая N суставов и способная принимать M положений. Есть точка в пространстве B, которую эта роборука должна достигнуть, или захватить (назовем эту точку целевой). Нужно придумать математический аппарат, который позволял бы рассчитывать траектории для максимально быстрого и точного перевода робоманипулятора из стартового положения в целевое положение. Для решения поставленной задачи были выбраны три метода: машинное обучение с учителем, эвристические алгоритмы (в моем случае — муравьиный алгоритм), обучение с подкреплением. Машинное обучение с учителем позволяет быстро получать приближенные значения для поставленной задачи. Точность полученных значений зависит от качества обучения модели машинного обучения, от выбранного алгоритма машинного обучения и от качества подготовленного обучающего набора данных Муравьиные алгоритмы относятся к категории эвристических алгоритмов. Они используют "память колонии" и гарантируют сходимость при решении задачи, но сложно определить количество требуемых итераций. Q-learning — метод, применяемый в искусственном интеллекте при агентном подходе. Относится к экспериментам категории «обучение с подкреплением». На основе получаемого от среды вознаграждения агент формирует функцию полезности Q, что впоследствии дает ему возможность уже не случайно выбирать стратегию поведения, а учитывать опыт предыдущего взаимодействия со средой. Одно из преимуществ Q-обучения — то, что оно в состоянии сравнить ожидаемую полезность доступных действий, не формируя модели окружающей среды. Аналогичные задачи решают все исследователи, разрабатывающие роботов для производства, медицины, научно-исследовательских и спасательных работ и многих других. Однако все существующие исследования решают задачи инженерного толка, а наше – сугубо алгоритмическое. Мы провели сравнительный анализ описанных выше методов, отметив, для каких условий и задач они подходят, и какой подход лучше применить в каждом конкретном случае. В будущем было бы интересно побольше поэкспериментировать с различными алгоритмами машинного обучения, а еще поработать над комбинированием эвристических алгоритмов и Q-learning, – по предварительным расчетам, результаты могут быть впечатляющими, – рассказала Ксения.
Сергей Николаевич подчеркнул: проведенное студенткой исследование связало воедино несколько научных направлений факультета. В будущем в лаборатории робототехники и мехатроники ПММ оно станет большим подспорьем в научном и учебном процессе.
– Работа Ксении является продолжением исследований по определению оптимального положения и траектории робота-манипулятора. На данный момент в лаборатории робототехники и мехатроники факультета ПММ собрана определенная база алгоритмов, способных решить поставленную задачу при разных условиях. Ценность работы Ксении состоит в том, что, во-первых, она смогла расширить алгоритмическую базу, а во-вторых, сформулировала некоторые предпочтения по выбору того или иного алгоритма. Проведенное исследование также помогло соединить разработки факультета с разных научных направлений. В будущем эта магистерская диссертация послужит стимулом к дальнейшему межкафедральному сотрудничеству и новым разработкам.