Искусственный интеллект резко поумнел. Алгоритм сделал научные открытия в химии

5.07.19

Искусственный интеллект, в который не было заложено никаких знаний по химии, подсказал учёным новые перспективные материалы. Он обучался читая аннотации статей в научных журналах. Об исследовании пишет Eurec Alert.

Команда во главе с Анубхавом Джайном, исследователем из Национальной лаборатории имени Лоуренса в Беркли, собрала 3,3 млн. аннотаций из статей, опубликованных в более чем 1000 журналах в период между 1922 и 2018 годами и загрузила их в алгоритм под названием Word2vec. Анализируя взаимосвязи между словами, он смог предсказать открытия новых термоэлектрических материалов на годы вперед.

Word2vec взял каждое из примерно 500 000 различных слов в этих аннотациях и превратил каждое в 200-мерный вектор или массив из 200 чисел. При этом ключевую роль в обучении играет не количество, а взаимосвязи между словами. Например, если тренировать алгоритм на ненаучных текстах вектор, который получается из сочетания «король минус королева», будет иметь тот же смысл, что и  «мужчина минус женщина».

Аналогично, при обучении текстовому материаловедению алгоритм смог понять значение научных терминов и понятий, таких как кристаллическая структура металлов, основываясь просто на положениях слов в рефератах и ​​их совпадении с другими словами. Например, точно так же, как он мог бы решить уравнение «король — королева + человек», он мог бы выяснить, что для уравнения «ферромагнитный — NiFe + IrMn» ответом будет «антиферромагнитный».

Как группировал названия химических элементов алгоритм, в сравнении с таблицей Менделеева Источник: Nature

Если компьютерный разум так хорошо освоил материаловедение, может ли он выделить среди многочисленных материалов эффективные термоэлектрики? Авторы проверили это, задав поиск названий веществ, по своим координатам максимально близких к слову «термоэлектрик».

Программа сформировала топ-10 материалов. Для каждого из них исследователи рассчитали фактор мощности (power factor), определяющий его эффективность как термоэлектрика.

Оказалось, что у всех отобранных веществ эта величина была выше, чем в средняя по всем известным термоэлектрическим соединениям. У материалов из топ-3 она была больше, чем у 95% известных термоэлектриков.

Алгоритм также указал на термоэлктрики, которые ранее упоминались в публикациях, но научное сообщество не обратило на них внимания. Если бы у исследователей была бы эта информация некоторые материалы из этой группы можно было бы получить на несколько лет раньше.

Авторы публикуют названия 50 лучших термоэлектриков, на которые исследователям стоит обратить пристальное внимание прямо сейчас. Также они создали инструкцию для тех, кто хочет воспользоваться теми же алгоритмами при поиске перспективных веществ для других материалов.

Александр Ильин

Нет комментариев