В синтетической и структурной биологии достижения в области искусственного интеллекта привели к стремительному развитию технологий создания новых белков с определёнными функциями — от антител до факторов свёртывания крови — с помощью компьютеров, способных точно предсказывать трёхмерную структуру любой заданной аминокислотной последовательности.
Но структуру почти 30% всех белков, экспрессируемых человеческим геномом, сложно предсказать даже с помощью самых мощных инструментов искусственного интеллекта, включая удостоенную Нобелевской премии AlphaFold. Эти так называемые внутренне неупорядоченные белки, которые никогда не принимают фиксированную форму, а постоянно меняют её, играют ключевую роль в бесчисленных биологических функциях, таких как сшивание молекул, восприятие или передача сигналов, но из-за присущей им нестабильности их сложно создать с нуля.
Команда из Гарвардской школы инженерных и прикладных наук имени Джона А. Полсона (SEAS) и Северо-Западного университета продемонстрировала новый метод машинного обучения, который позволяет создавать внутренне неупорядоченные белки с заданными свойствами. Эта работа открывает новые возможности для изучения этих загадочных биомолекул и, возможно, для получения новых данных о причинах возникновения заболеваний и методах их лечения.
Работа опубликована в журнале Nature Computational Science. Соавторами выступили аспирант SEAS Райан Крюгер и бывший стипендиат NSF-Simons QuantBio Кришна Шринивас, ныне доцент Северо-Западного университета, а также Майкл Бреннер, профессор прикладной математики и физики в SEAS.

Шринивас рассказал, что заинтересовался изучением внутренне неупорядоченных белков, потому что они недоступны для современных методов на основе искусственного интеллекта, таких как AlphaFold от Google DeepMind, для прогнозирования и создания белков с определёнными конформациями. Тем не менее такие неупорядоченные белки важны для многих фундаментальных аспектов биологии, и известно, что мутации в этих белках связаны с такими заболеваниями, как рак и нейродегенерация. Одним из примеров неупорядоченного белка является альфа-синуклеин, который давно связывают с болезнью Паркинсона и другими заболеваниями. По словам Шриниваса, чтобы разработать интеллектуальные датчики для синтеза или терапевтического применения, «нам нужно было либо создать более совершенные модели искусственного интеллекта, либо найти способ использовать эти физические модели, чтобы не только получать точные прогнозы, но и бесплатно пользоваться физическими данными».
Алгоритмы автоматического дифференцирования
В статье описывается вычислительный метод, основанный на алгоритмах, которые могут выполнять «автоматическое дифференцирование», или автоматическое вычисление производных — мгновенных скоростей изменения — для рационального выбора белковых последовательностей с желаемыми характеристиками или свойствами. Этот метод широко используется для глубокого обучения и тренировки нейронных сетей, но Бреннер и его лаборатория одними из первых выявили другие потенциальные области применения, такие как оптимизация моделирования молекулярной динамики на основе физических законов.
С помощью автоматического дифференцирования исследователи смогли обучить компьютер распознавать, как небольшие изменения в белковых последовательностях — даже замена одной аминокислоты — влияют на конечные желаемые свойства белков. Они сравнили свой метод с очень мощной поисковой системой, которая находит аминокислотные последовательности, соответствующие критериям, необходимым для выполнения определённой функции — например, создания петель или соединений или распознавания различных элементов окружающей среды.
Мы не хотели брать кучу данных и обучать модель машинного обучения для проектирования белков. Мы хотели использовать существующие, достаточно точные модели для проектирования белков на уровне этих моделей.
Райан Крюгер, аспирант Гарвардской школы инженерных и прикладных наук имени Джона А. Полсона
Этот метод использует традиционную систему обучения нейронных сетей под названием «оптимизация на основе градиента» для эффективного и точного определения новых белковых последовательностей. В результате созданные исследователями белки являются «дифференцируемыми», то есть они не являются наилучшими прогнозами, сделанными искусственным интеллектом, а основаны на моделировании молекулярной динамики с использованием законов физики, которые учитывают реальное динамическое поведение белков в природе.
Исследование проводилось при федеральной поддержке Национального научного фонда, Института динамических систем искусственного интеллекта, Управления военно-морских исследований, Гарвардского научно-исследовательского центра материаловедения и Гарвардского центра математического и статистического анализа биологии NSF-Simons.
Источник:
Инженерная школа и прикладные науки имени Джона А. Полсона при Гарвардском университете
Ссылка на журнал:
Крюгер Р. К., и др. (2025) Обобщенный анализ взаимосвязей между последовательностью, ансамблем и функцией для внутренне неупорядоченных белков. Nature Computational Science. doi.org/10.1038/s43588-025-00881-y.




Чтобы написать отзыв нужно авторизоватся