ИИ помог ученым точнее предсказывать свойства молекул
Специалисты Центра искусственного интеллекта МГУ имени М.В. Ломоносова предложили метод машинного обучения, который позволяет точнее прогнозировать свойства молекул по их строению. Подход основан на новой архитектуре нейросети gSelformer-MV, а результаты исследования опубликованы в журнале Journal of Chemical Information and Modeling.
Прогнозирование свойств молекул по их структуре относится к важным задачам вычислительной химии. Такие технологии используют при создании лекарственных препаратов, поиске новых материалов и изучении соединений с заданными характеристиками.
Для решения подобных задач применяют алгоритмы машинного обучения. Они анализируют строение молекул и выявляют связь между структурой вещества и его физико-химическими свойствами.
Сейчас распространены два основных подхода. Первый рассматривает молекулу как сеть атомов и химических связей и использует графовые нейронные сети. Второй представляет молекулу в виде последовательности символов, которую можно обрабатывать моделями анализа последовательностей.
Однако такие методы чаще всего работают на уровне отдельных атомов и не всегда напрямую учитывают более крупные части молекулы, например функциональные группы.
Авторы исследования предложили объединить несколько вариантов представления молекулярной структуры. В основе метода лежит формат Group SELFIES, где учитываются не только отдельные атомы, но и функциональные группы.
В новой архитектуре молекула описывается не одной последовательностью символов, а несколькими вариантами, которые получают при разбиении структуры на подграфы. Нейросеть одновременно анализирует эти представления и за счет этого учитывает разные уровни организации молекулы.
Руководитель научной группы «Мультимодальное обучение в материаловедении» Института ИИ МГУ, старший научный сотрудник Центра ИИ МГУ Вадим Королёв пояснил, что исследователи стремились совместить преимущества языковых моделей с данными о функциональных группах молекул. По его словам, использование нескольких представлений структуры помогает модели учитывать разные уровни строения молекулы и повышать точность прогнозов.
Метод проверили на стандартных задачах предсказания свойств молекул. В вычислительных экспериментах модель показала более высокую точность по сравнению с алгоритмами, которые используют только обычные строковые представления молекул.
Кроме того, учет информации о подструктурах делает работу модели более понятной. Как отметил Вадим Королёв, для химии важна не только точность, но и понимание того, какие элементы строения влияют на свойства вещества. Новый подход позволяет учитывать функциональные группы и делает результаты более объяснимыми.
По словам авторов, разработка может ускорить поиск новых химических соединений с нужными характеристиками. Такие методы особенно востребованы при создании лекарств и материалов, где требуется быстро анализировать большое количество возможных молекулярных структур.
Рекомендуем также:
- Соль решает всё в шашлыке: золотое правило, после которого свинина и курица исходят соком
- Один раз приготовите и поймёте, почему о плове можно забыть: «Женатая» каша получается проще, быстрее и намного интереснее
- Цветёт долго и выглядит сказочно: белоснежный многолетник станет находкой для любого региона России
- Перед покупкой лучше узнать правду: какие средства из Светофора оправдали цену, а какие разочаровали
- Льготы есть, но расслабляться рано: какой налог на имущество может ударить по пенсионерам в 2026 году
Есть жалобы? Канал для добрых казанцев, которых вывели из себя. Делитеcь тем, что вас разозлило: Злой Казанец


