Ученые месяцами ждали доступа к высокоточному предсказанию структуры белка с тех пор, как DeepMind представила замечательный прогресс в этой области на конференции 2020 Critical Assessment of Structure Prediction, или CASP14. Ожидание подошло к концу.

Исследователи из Института дизайна белков Медицинской школы Вашингтонского университета в Сиэтле в значительной степени воссоздали результаты, достигнутые DeepMind в этой важной задаче. Эти результаты будут опубликованы в журнале Science в четверг, 15 июля.

В отличие от DeepMind, метод команды UW Medicine, который они назвали RoseTTAFold, находится в свободном доступе. Ученые со всего мира сейчас используют его для создания моделей белка, чтобы ускорить свои собственные исследования. С июля программу загрузили с GitHub более 140 независимых исследовательских групп.

Белки состоят из цепочек аминокислот, которые складываются в замысловатые микроскопические формы. Эти уникальные формы, в свою очередь, вызывают почти все химические процессы внутри живых организмов. Лучше понимая формы белков, ученые могут ускорить разработку новых методов лечения рака, COVID-19 и тысяч других заболеваний.

«Это был напряженный год для Института дизайна белков, разработка терапевтических препаратов и вакцин против COVID-19 и запуск их в клинические испытания, а также разработка RoseTTAFold для высокоточного прогнозирования структуры белка. Я рад, что научное сообщество уже использует этот метод. Сервер RoseTTAFold для решения важнейших биологических проблем», — сказал старший автор Дэвид Бейкер, профессор биохимии Медицинской школы Вашингтонского университета, исследователь Медицинского института Говарда Хьюза и директор Института дизайна белков.

В новом исследовании группа компьютерных биологов под руководством Бейкера разработала программный инструмент RoseTTAFold. Он использует глубокое обучение для быстрого и точного прогнозирования белковых структур на основе ограниченной информации. Без помощи такого программного обеспечения могут потребоваться годы лабораторных работ, чтобы определить структуру всего лишь одного белка.

RoseTTAFold, с другой стороны, может надежно вычислить структуру белка всего за десять минут на одном игровом компьютере.

Команда использовала RoseTTAFold для вычисления сотен новых белковых структур, включая многие плохо изученные белки генома человека. Они также создали структуры, имеющие непосредственное отношение к здоровью человека, в том числе структуры для белков, связанных с проблемным метаболизмом липидов, воспалительными расстройствами и ростом раковых клеток. И они показывают, что RoseTTAFold можно использовать для построения моделей сложных биологических сборок за гораздо меньшее время, чем требовалось ранее.

RoseTTAFold — это «трехдорожечная» нейронная сеть, что означает, что она одновременно учитывает закономерности в последовательностях белка, то, как аминокислоты белка взаимодействуют друг с другом, и возможную трехмерную структуру белка. В этой архитектуре одно-, двух- и трехмерная информация перемещается вперед и назад, тем самым позволяя сети совместно рассуждать о взаимосвязи между химическими частями белка и его складчатой структурой.

«Мы надеемся, что этот новый инструмент будет и дальше приносить пользу всему исследовательскому сообществу», — сказала Минкьюнг Бэк, научный сотрудник, руководивший проектом в лаборатории Бейкера в UW Medicine.