Роботы за партой

Машинам тоже надо учиться

С каждым годом роботы становятся умнее. Они уже не только выполняют команды, работают по заданным алгоритмам, но и способны обучаться. Более того, машины могут даже учить друг друга, а также спасать в сложных ситуациях, что, впрочем, неудивительно, ведь для их развития используют продвинутые технологии, которые постоянно совершенствуются. Над одной из них работает кандидат технических наук, доцент Илона КУЛИКОВСКИХ из Самарского национального исследовательского университета им. академика С.П.Королёва. Она разрабатывает методы индивидуального и группового обучения машин на основе эффекта забывания, вызванного извлечением информации. Тема поддержана грантом Президента РФ.
— Я работаю в Самарском университете, на кафедре информационных систем и технологий, и временно, для проведения исследований по президентскому гранту, нахожусь в Хорватии — на позиции постдока в Загребском университете и Институте Руджера Бошковича. Принимаю участие в проекте DATACROSS в Центре превосходства Data Science and Advanced Cooperative Systems, — рассказывает И.Куликовских. — Занимаюсь со студентами, помогаю им получать новые навыки и умения, необходимые при создании алгоритмов для интеллектуального анализа данных.
Аналогичным образом я обучаю машины, чтобы они могли выйти на новый уровень, — стать машинами-экспертами. Это обычные компьютеры, нейронные сети или роботы. Цель обучения состоит в том, чтобы сделать их более интеллектуальными и полезными для человека в самых разных областях.
— Как получилось, что вы увлеклись этой темой? В чем суть индивидуального и группового обучения машин?
— Мне повезло встретить хорошего учителя. Будучи студенткой факультета информатики Самарского государственного аэрокосмического университета, я слушала лекции профессора Сергея Антоновича Прохорова по прикладному анализу случайных процессов. Мне показалось интересным попытаться создать собственный алгоритм обработки информации, который позволил бы находить «неслучайное в случайном».
Тогда я решила заняться необычной темой — предотвращением несанкционированного проникновения нарушителя на территорию объекта на основе анализа коммуникации насекомых-сверчков. В обычном состоянии сверчки стрекочут асинхронно. Но при возникновении опасности они начинают издавать звуки синхронно, с заданной частотой. Эта задача — пример построения методов обработки информации с использованием принципов организации живых организмов. Такие методы называют алгоритмами, построенными на основе биотехнологий. Интерес именно к этой задаче послужил толчком для моих нынешних исследований.
Я приведу воображаемую сцену, которая описана в статье The robots that teach each other в журнале Discovery. Представьте себе двух роботов, пересекающих минное поле. Первый, его имя «Оптимус», захватывает шар необычной формы, но не может точно определить, что это такое, и решить, как действовать. «Атлас», второй, более опытный робот, быстро приближается, осматривает предмет, понимает, что внутри находится взрывчатый коктейль, и помогает коллеге его обезвредить. «Оптимус», наблюдая за коллегой, обучается, перенимая его опыт.
Описанная сцена показывает то, как машины могли бы взаимодействовать, обмениваясь знаниями, обучаться индивидуально или в группе, собирать новую информацию.
— В чем суть метода обучения машин на основе эффекта забывания, вызванного извлечением информации?
— Эффектом забывания, вызванным извлечением информации (Retrieval-Induced Forgetting, RIF), называют феномен памяти, когда запоминание одной информации приводит к забыванию другой. Термин RIF был введен американским психологом Робертом Алленом Бьорком в 1994 году для описания процессов подавления информации в памяти, которая не требуется для принятия решения в текущий момент. Этот эффект был положен в основу разработанного нами метода индивидуального и группового обучения машин. Мы с моей научной группой на кафедре использовали его для моделирования их памяти.
Реализация эффекта RIF для создания модели памяти имеет два основных достоинства. Во-первых, аналогия между обучением человека и машины позволяет перейти от классического представления информации в виде набора данных для обучения и тестирования к формированию заданий различной сложности. Последние требуют меньше информации, что способствует повышению скорости принятия решения.
Во-вторых, реализация эффекта RIF дает возможность сформировать модель памяти машины, параметры которой подстраиваются под вновь поступающую информацию. Такая модель использует только ту информацию, которая необходима для принятия решения в текущий момент, что позволяет принимать решение на лету.
— Как вы разрабатываете метод?
— Это происходит в два этапа. На первом создаем математическую модель формирования или «выращивания» памяти машины с параметрами, которые позволяют учитывать вновь поступающую информацию. Мы выбрали модель оценивания уровня знаний испытуемого при ответе на тестовые задания. В 1977 году Джордж Макреди и Митчелл Дэйтон интерпретировали такую модель как бинарную, которая описывает два возможных состояния: тестируемый не имеет достаточно знаний для ответа хотя бы на одно тестовое задание и тестируемый имеет знания для ответа на все тестовые задания.
Позже она была доработана с учетом двух важных допущений. Первое: тестируемый, не имея требуемого уровня знаний для ответа хотя бы на один вопрос, может случайно угадать правильный ответ. Второе допущение: тестируемый, имея требуемый уровень знаний для ответа на все вопросы, может забыть правильный ответ.
Адаптивные параметры модели, описывающие уровни забывания и угадывания, оптимизируются в соответствии с заданным критерием, формируя RIF-эффект. Проводя аналогию между тестированием человека и машины, мы адаптировали эту модель для формирования памяти робота при индивидуальном обучении.
На следующем этапе расширим модель с учетом особенностей группового обучения. Для этого мы провели тестирование студентов и аспирантов Самарского университета, которых попросили ответить на вопросы различной сложности. На основе полученных результатов собираемся сформировать модель совместной памяти при групповом обучении.
Эффективная модель памяти позволит повысить скорость обработки информации в режиме реального времени и сократить ресурсные затраты на хранение входной информации. В частности, с использованием современных технологий распараллеливания алгоритмов можно оптимизировать распределение потоков входной информации.
— Что будет представлять собой конечный продукт? Кто больше всего заинтересован в результатах ваших исследований?
— В первую очередь мы нацелены на разработку адекватной математической модели памяти машины, в основу которой положен эффект RIF. Затем расширим эту модель, включим факторы «социального» взаимодействия машин. Наконец, введем такую модель в алгоритмы их обучения на уровне программной и аппаратной реализации.
На мой взгляд, результаты наших исследований представляют интерес для быстро развивающейся индустрии интеллектуальных машин. В частности, там, где требуется не только замещение роли человека, например, на опасной для его жизни территории, но и оптимизация группового «социального» взаимодействия.
Как я сказала в начале нашей беседы, студентов и машины мы обучаем одинаково. Это может показаться забавным. Я стимулирую ребят ошибаться в процессе обучения — это развивает их способность рефлексировать по поводу собственных знаний, то есть выделять и анализировать собственные ошибки, что приводит к качественному изменению навыков мышления. Эта способность помогает им получать более высокие оценки на экзамене.
Машины же — мои худшие и в то же время лучшие студенты. Они постоянно ошибаются и забывают информацию, пока я обучаю их, но никогда не забывают, чему я их учила, на контрольном тестировании.

Беседу вел Василий ЯНЧИЛИН

Нет комментариев