Ученые ВШЭ оптимизировали обучение генеративных потоковых нейросетей
Исследователи факультета компьютерных наук НИУ ВШЭ улучшили метод обучения генеративных потоковых нейросетей для работы с неструктурированными задачами. Это поможет искать новые лекарства эффективнее. Результаты работы были представлены на одной из ведущих конференций по машинному обучению — ICLR 2025. Текст работы доступен в репозитории Arxiv.org.
Генеративные потоковые сети (GFlowNets) — особый тип алгоритмов машинного обучения, который строит сложные объекты шаг за шагом. Ученые применяют их для поиска белков, лекарств и оптимизации транспортных систем.
Чтобы GFlowNets находили такие сложные структуры, исследователи объясняют им свойства объекта, который они хотели бы получить. Чем ближе решение нейросети по свойствам к заданным, тем более высокую награду она получит. Сеть стремится решить задачу так, чтобы получить максимальный приз. На данные она не обращает внимание, только на вознаграждение. Оно вычисляется через уравнение, которое называют функцией вознаграждения.
Процесс поиска сложного объекта можно сравнить со сборкой модели из блоков Lego. Вы последовательно добавляете детали, пока не получится что-то цельное, при этом у каждого объекта есть своя заданная ценность. Собранная модель растения, например, может оцениваться дороже модели животного. В отличие от других методов машинного обучения, которые будут стремиться любой ценой получить растение, GFlowNets будут собирать много разных объектов, но растения чаще, чем животных: так выгоднее.
При таком типе поиска GFlowNets используют две вероятностные модели, которые работают в паре: прямую и обратную. Прямая модель — прораб-строитель, который решает, куда идти дальше, и предсказывает вероятность последующего состояния, а обратная модель — эксперт-разборщик, который определяет, каким был предыдущий шаг. Важно, чтобы эти потоки были сбалансированы, но сделать это очень сложно. Во-первых, требуются большие вычислительные мощности, во-вторых, обратная модель не обладает достаточной гибкостью: обычно исследователи запрещают ей меняться в процессе поиска и подсматривать за действиями прямой.
Ученые НИУ ВШЭ нашли способ оптимизировать обратную модель с помощью метода Trajectory Likelihood Maximization (TLM). Они доработали алгоритмы обратной модели таким образом, чтобы она могла постоянно сверяться с действиями прямой модели.
Тимофей Грицаев
«Мы сделали так, что поиск оптимального решения стал похож на переговоры, в которых обе стороны готовы менять свою позицию. В задачах с большой степенью неизвестности обратная модель — лишь вспомогательный инструмент, улучшающий результаты прямой модели. Мы искали способ сделать работу обратной модели гибкой и наконец смогли его получить», — поясняет один из авторов работы, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев.
После внедрения TLM функция вознаграждения, описывающая успешность решения задачи для обратной модели, стала сложнее. Однако, несмотря на увеличение сложности, вся система поиска стала быстрее и эффективнее.
Никита Морозов
«Наш метод заметно быстрее просматривает пространство возможных решений и находит больше качественных вариантов. Этот подход в целом сближает генеративные модели с методами обучения с подкреплением», — говорит Никита Морозов, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.
Авторы исследования уверены, что их работа поможет специалистам, применяющим GFlowNets в различных областях, таких как поиск новых лекарственных соединений, разработка материалов с заданными свойствами, а также тонкая настройка крупных языковых моделей. Благодаря способности таких сетей эффективно исследовать огромное пространство решений и быстро находить наиболее оптимальные варианты можно заметно сократить нагрузку на вычислительные мощности.
Грицаев Тимофей Григорьевич
Вам также может быть интересно:
«Наш результат признан не только в рамках защиты проекта, но и на международном уровне»
В этом году на Европейскую конференцию по ИИ (ECAI 2025) была принята статья Multi-Agent Path Finding For Large Agents Is Intractable второкурсника бакалавриата «Прикладная математика и информатика» (ПМИ) факультета компьютерных наук ВШЭ Артема Агафонова. Работа написана в соавторстве с Константином Яковлевым, заведующим базовой кафедрой «Интеллектуальные технологии системного анализа и управления» ФИЦ ИУ РАН, доцентом ФКН. Как возникла идея написать статью и как удалось попасть на конференцию уровня А, Артем Агафонов рассказал в интервью.
Ученые смоделировали работу суперконденсатора на уровне отдельных молекул и ионов
Ученые НИУ ВШЭ с помощью моделирования на суперкомпьютере изучили, что происходит с ионами и молекулами растворителя с водой внутри нанопор суперконденсатора. Результаты показали, что даже очень малое количество воды меняет распределение заряда внутри нанопор и влияет на то, сколько энергии может накопить устройство. Такой подход позволяет предсказывать поведение суперконденсаторов при разных составах электролита и условиях влажности. Исследование опубликовано в журнале Electrochimica Acta. Работа выполнена в рамках гранта РНФ.
Студенты и аспиранты НИУ ВШЭ приняли участие в Международной летней школе Пекинского университета
В июле в Пекинском университете проходила ежегодная летняя школа по квантовой молекулярной динамике, которая в этом года перешла на международный уровень. Ее первыми иностранными гостями стали студенты и аспиранты МИЭМ НИУ ВШЭ. У них была обширная образовательная программа, им также удалось посетить лабораторию оптоэлектронных материалов и энергетических приборов.
В НИУ ВШЭ стартовал СТП «Национальный центр социально-экономического и научно-технологического прогнозирования»
Стратегический технологический проект нацелен на создание и внедрение технологий системного анализа и прогнозирования в интересах государства, бизнеса и общества для обеспечения технологического лидерства, суверенитета и безопасности России.
Вузы разделились на шесть лагерей в отношении к искусственному интеллекту
Каким должно быть образование в эпоху ИИ? Чтобы разобраться, какие есть точки зрения и какие решения уже формируются, команда Института образования ВШЭ весной 2025 года провела серию интервью с проректорами российских университетов. Об итогах этого исследования рассказывает директор института Евгений Терентьев.
Новые модели изучения заболеваний: от чашки Петри до органов-на-чипе
Биологи из НИУ ВШЭ совместно с исследователями из НМИЦ АГП им. В.И. Кулакова используют новейшие микрофлюидные технологии для изучения преэклампсии — одного из самых опасных осложнений беременности, которое угрожает жизни и здоровью матери и ребенка. В статье, опубликованной в BioChip Journal, они рассмотрели современные клеточные модели, включая передовые технологии «плацента-на-чипе», позволяющие глубже понять механизмы заболевания и разработать эффективные лекарства.
В НИУ ВШЭ запущены стратегические технологические проекты
Стратегические технологические проекты Высшей школы экономики реализуются в интересах достижения целевой модели развития университета и предусматривают формирование пула инновационных продуктов и услуг. Они сформированы по трем направлениям: социально-экономическое и научно-технологическое прогнозирование, технологии связи 6G и искусственный интеллект.
Как разработать честный тест: зачем нужны параллельные тексты для диагностики дислексии
Исследователи из Центра языка и мозга ВШЭ разработали тест для точной оценки навыков чтения у взрослых — например, до и после занятий с логопедом. Он включает два разных по содержанию, но одинаковых по сложности текста: участники читали их с равной скоростью, делали равное количество ошибок и одинаково понимали смысл. Подобные параллельные тексты позволят точнее диагностировать дислексию и отслеживать прогресс коррекции. Исследование опубликовано в журнале «Вопросы образования».
Ростех и Вышка стали партнерами в сфере инженерной подготовки и научных исследований
Госкорпорация Ростех и Высшая школа экономики заключили соглашение о стратегическом партнерстве в сфере науки и образования. Документ направлен на проведение совместных исследований, подготовку высококвалифицированных кадров и формирование научно-технического задела в интересах высокотехнологичных отраслей России. Кроме того, совместно с московской школой № 58 будет вестись профориентация школьников по направлениям инженерии, ИТ и кибербезопасности.
В Вышке пройдет Международная школа БРИКС: Новое поколение
Открыта регистрация на Международную школу БРИКС: Новое поколение — один из ведущих международных образовательных проектов, ориентированных на молодых лидеров, интересующихся повесткой глобального развития и сотрудничества в рамках БРИКС.