Другая реальность. Искусственный интеллект перевернет нашу жизнь.

Престижная международная премия Scopus Awards компании Elsevier недавно была присуждена высокоцитируемому российскому исследователю Виктору ЛЕМПИЦКОМУ, работающему в области Computer Sciences. Виктор — выпускник мехмата МГУ, там же получил степень кандидата физико-математических наук, затем несколько лет работал  в Великобритании, в лабораториях Кембриджа и Оксфорда, после чего вернулся в Россию и сегодня, специализируясь в области компьютерного зрения, является руководителем одного из подразделений Центра искусственного интеллекта Samsung в Москве и доцентом Сколковского института науки и технологий. Корреспондент “Поиска” расспросила ученого о том, что нового происходит в его области знаний и какие технологии уже за втра могут войти в нашу жизнь.
— Я работаю в области компьютерного зрения с начала 2000-х, и за это время в ней произошло очень много интересного, — начал рассказ Виктор Лемпицкий. — Если говорить коротко, мы учим компьютер понимать, как устроен мир вокруг него, какие объекты его окружают, почему они там находятся, как они выглядят с другой, не видимой компьютеру стороны, что представляют собой их 3D-модели. Это могут быть как неодушевленные объекты, так и люди, и чаще всего — именно они. В этой области много интересной математики, почти все здесь связано с машинным обучением, которое строится на тех или иных данных. Еще пятнадцать лет назад в области искусственного интеллекта практически не существовало подходов с использованием машинного обучения. Наши знания “перевернулись” за последние шесть лет — с тех пор как появились первые результаты, связанные с глубокими нейросетями.
— Что же произошло шесть лет назад?
— В 2012 году вышла публикация ученых из группы Джеффри Хинтона Университета Торонто, которые показали, что глубокие нейросети могут решать задачи компьютерного зрения лучше, чем все архитектуры, которые были придуманы в предыдущие десятилетия. 
— Попрошу вас пояснить, что такое “глубокие нейросети”?
— Это система распознавания образов, которая устроена по довольно простому принципу: берется некий набор функций, описывающих простые изображения, затем их наслаивают друг на друга, и в каждом слое есть какое-то количество так называемых обучаемых параметров, которые мы подстраиваем под данные. Наслоив сотни таких функций и “обучив” на большом количестве данных, мы получаем очень умную нейросеть, которая понимает, что изображено на картине.
— Что уже умеет компьютер, который использует описанные системы распознавания? 
— Отличать один объект или одного человека от другого, причем иногда даже лучше, чем это умеем мы с вами. Впрочем, область, которой занимаюсь я и мои коллеги, — это не распознавание, а создание новых изображений. То есть после того как компьютер посмотрел на множество фотографий с изображениями людей, он начинает рисовать новых людей. 
— Зачем?
— Этому есть много применений. Например, в задачах расширенной и дополненной реальности, чтобы синтезировать изображения виртуальных людей или изображения реальных людей воссоздавать в новых условиях. Так, камера может снимать меня с одной стороны, а компьютер, который на вход получает только это изображение, должен показать, как я выгляжу с другой. 
Когда подобные системы разовьются, станет возможным общение в виртуальных и расширенных мирах. В принципе, какие-то прототипы появляются уже сегодня. Представьте,  одного человека снимают много камер, а другой, находящийся совершенно в ином месте, надевает очки дополненной реальности (вроде Microsoft HoloLens) и видит удаленного от него первого человека в виде совершенно реальной 3D-модели. Можно ходить по комнате, рассматривать этого “виртуального” человека с разных сторон, то есть возникает ощущение, что первый перенесся в комнату второго. Только подумайте, сколько усилий человечество тратит на путешествия, сколько денег уходит на бизнес-перелеты с одного континента на другой для того, чтобы люди оказались рядом и могли поговорить, а тут появляются совершенно новые возможности для общения.
— Сегодня для визуального общения успешно используют Skype, режим видеоконференции.
— Верно. И мы привыкли думать, что статичное видео — это максимум из возможного. Но это не так: мы можем получить более полную иллюзию того, что собеседник находится рядом с нами. Я думаю, что мы стоим на пороге больших перемен. Возможно, это будет переворот, сравнимый с тем, который совершила в нашей жизни телефонная связь. И, если честно, сейчас то, чем мы занимаемся, — это все меньше математика и все больше алгоритмика. То есть, скорее, не наука, а инженерия, которая безумно интересна.
— Как российские исследования в области искусственного интеллекта вписываются в то, что происходит в мире?
— В последние годы — хорошо, хотя пока этими проблемами у нас занимаются не так много групп. Исследования, как я уже говорил, ведутся на границе академической науки и индустрии. С индустриальной стороной в России все хорошо: у нас традиционно сильные программисты, математическая подготовка. Что касается академической стороны — статьи, конференции — этого пока не так много. Но несколько сильных групп в последние годы появились и вполне успешно работают в “Сколтехе”,  НИУ ВШЭ, МГУ, исследовательском подразделении “Яндекса”, а теперь еще и в Samsung. Я бы сказал, что в России все в порядке с людьми, которые разрабатывают софтверный продукт, а вот писать статьи у нас как-то не принято. Хотя в последние годы к этому тоже наблюдается интерес, потому что расстояние от статьи до реально работающих вещей становится минимальным. 
— Чем занимается Центр искусственного интеллекта Samsung?
— В последние годы крупные компании заинтересовались тем, что до недавнего времени было только в университетах и НИИ. Они стали открывать свои исследовательские лаборатории, которые очень приближены к академическим, поскольку один из основных продуктов, который в них производится, — это публикации. Многие в этом очень преуспели, и сейчас, если мы посмотрим на количество статей на конференциях, на публикации, которые получают главные награды, в большинстве случаев это будут статьи, сделанные не в университете, а в той или иной компании. В Samsung тоже решили не оставаться в стороне. Компания открыла сеть центров по всему миру — с установкой на академическую компоненту, публикации, на взаимодействие с университетами, исследования, которые не завтра, а может быть, через несколько лет появятся в вашем смартфоне. В ряду мест, которые очень авторитетны с точки зрения искусственного интеллекта (Торонто, Кембридж, Монреаль, Сеул, Нью-Йорк), недавно появилась и Москва, где Samsung  создал очень сильный центр, в котором одно из подразделений возглавляю я, а остальные — ведущие специалисты в нашей области из НИУ ВШЭ, МГУ, ПОМИ РАН, “Сколтеха”. 
— Как будет устроена работа центра? 
— Почти все результаты исследований мы будем публиковать. Уже выходят первые статьи, у нас есть осознанная установка на это. Плюс существует определенная академическая свобода: мы, конечно, согласовываем темы работ, но нам их, в принципе, никто не диктует. То есть все, кто пришел в эту тему, продолжают заниматься практически теми же направлениями, что и раньше. 
— А в чем же разница по сравнению с работой в том же “Сколтехе”?
— Между работой в университете и компании есть разница прежде всего в механизмах, которые позволяют разработанным технологиям дойти до реальной жизни. 
— Появления каких открытий, технологий можно ожидать в вашей области в ближайшие пять  лет? 
— Я думаю, есть несколько перспективных направлений и приложений искусственного интеллекта. Это, например, автономные автомобили. Там множество интересных задач. Плюс домашние роботы, робототехника. Автомобиль — это, по сути, тоже робот, причем довольно простой. Его цель — проехать и ничего не задеть. Хотя это очень ответственная задача, поскольку должна быть соблюдена полная безопасность. А у домашнего робота ответственность меньше, но задачи сложнее. Он должен не просто ездить, а что-то брать, куда-то ставить. Эту задачу мы умеем решать хуже. В приложении, о котором я говорил (виртуальная реальность, дополненная реальность), очень много интересных задач, связанных с компьютерным зрением. И там ожидается большой прогресс — это совершенно точно. Системы видеонаблюдения, различная биометрия, технологии верификации  — например, при выдаче кредитов в банке — все то уже работает, но будет использоваться еще шире. В целом пять лет назад было очень непонятно, что будет сегодня. Я думаю, что и сейчас не так просто предсказать ближайшее будущее. Вместе с тем в последние годы все специалисты отмечают такой прогресс в нашей области, которого не было никогда. Поэтому времена нам предстоят очень интересные. 
— Несет ли опасности развитие искусственного интеллекта?
— Я не верю в страшилки про искусственный интеллект, который всех нас поработит, вряд ли такой вообще возможно построить. Несмотря на все эволюционные изменения, за последнюю тысячу лет люди не стали радикально умнее, поэтому создать систему, которая будет существенно превосходить человека, мне не представляется возможным. Все, что сейчас умеет компьютер, — это использовать заложенные в него алгоритмы, а выйти за эти рамки и “придумать” что-то радикально новое для машины очень сложно. Человек по-прежнему это делает лучше, и не факт, что компьютеры когда-то смогут с ним соперничать.
Беседовала Светлана БЕЛЯЕВА

Нет комментариев