Академия / Статьи / AI и машинное обучение / D-I-TASSER: ИИ и физика предсказывают структуру белков на 13% точнее

D-I-TASSER: ИИ и физика предсказывают структуру белков на 13% точнее

Исследовательская группа из Национального университета Сингапура разработала D-I-TASSER — революционный метод предсказания трёхмерных структур белков, который комбинирует глубокое обучение (ИИ) с физико-химическими симуляциями. Результаты показывают на 13% выше точность для сложных многодоменных белков по сравнению с предыдущими подходами.

D-I-TASSER: ИИ и физика предсказывают структуру белков на 13% точнее

Команда и учреждение

Исследование возглавил профессор Zhang Yang из Национального университета Сингапура (NUS). Лаборатория находится в составе:

  • Института рака (Cancer Science Institute) — специализирующийся на раковых заболеваниях и молекулярной биологии
  • Школы вычислительной техники (School of Computing) — лидирующего центра компьютерных наук в Азии
Выбор учреждения неслучаен

NUS — одна из ведущих академических организаций в Азии. Сочетание Института рака и Школы компьютерных наук позволило создать идеальную среду для междисциплинарных исследований на пересечении биологии и ИИ.

Что такое структура белков и почему это важно?

Белки — это молекулярные машины нашего организма. Они складываются в сложные трёхмерные структуры, которые определяют их функцию. Понимание структуры белка критично для:

Применение Почему структура важна
Открытие лекарств Молекулы лекарств должны "стыковаться" к правильному месту на белке
Исследование болезней Мутации часто искажают структуру, вызывая болезни
Биотехнология Инженерия белков требует понимания их структуры
Вакцины Дизайн вакцин требует знания структур вирусных белков

Традиционные методы определения структуры белков (рентгеновская кристаллография, криоэлектронная микроскопия) требуют месяцы работы, стоят десятки тысяч долларов и работают не для всех белков. Предсказание структуры с помощью ИИ может произвести революцию в этой области.

История AlphaFold и революция в 2020-м году

В 2020 году компания DeepMind представила AlphaFold — нейросетевую модель, которая предсказывала структуры белков с невиданной ранее точностью. Это было признано одним из величайших научных достижений за последнее десятилетие.

AlphaFold решил проблему, над которой учёные работали 50 лет. Но даже AlphaFold имеет ограничения, особенно для сложных многодоменных белков.

Однако AlphaFold, несмотря на его мощь, основан исключительно на машинном обучении (распознавание паттернов в известных структурах белков). Он не использует физику — законы природы, которые определяют, как белки действительно складываются.

Подход D-I-TASSER: синергия ИИ и физики

D-I-TASSER (Deep-learning Integrated Threading Assembly Refinement) — это гибридный подход, который комбинирует:

1. Глубокое обучение (Deep Learning)
Нейросети для предсказания первичной структуры и контактов между аминокислотами

2. Физико-химические симуляции
Молекулярная динамика для проверки того, что предсказанная структура энергетически стабильна

3. Рафинирование (Refinement)
Итеративное улучшение структуры, комбинируя предсказания ИИ с физическими ограничениями

Почему это лучше, чем подходы на основе только ИИ

Проблема с методами на основе только машинного обучения — это то, что они могут предсказать структуру, которая выглядит правильно по метрикам машинного обучения, но физически невозможна. Например:

  • Две аминокислоты не могут находиться на одном и том же месте (нарушение закона исключения Паули)
  • Молекула должна минимизировать свою свободную энергию (законы термодинамики)
  • Некоторые аминокислоты гидрофобны, другие гидрофильны (законы химии)

D-I-TASSER решает эту проблему, пропуская предсказания ИИ через физические проверки. Это как использовать ИИ для быстрого "черновика" структуры, а затем уточнять её с помощью физики.

Симбиоз ИИ и науки

D-I-TASSER демонстрирует мощь комбинирования ИИ с научным знанием. ИИ хорош в поиске сложных паттернов, но физика обеспечивает "здравый смысл" — гарантию того, что ответ физически возможен.

Ключевые улучшения

Главное преимущество D-I-TASSER:

13%
Выше точность для многодоменных белков

Но это не единственное улучшение:

Метрика D-I-TASSER AlphaFold (базовый)
Многодоменные белки ↑13% Базовая точность
Динамика молекул Включена Не включена
Стабильность структуры Физически проверена Только ИИ-предсказание
Время вычисления Умеренное Низкое

Применение в открытии лекарств

Более точное предсказание структур белков напрямую ускоряет разработку новых лекарств:

  1. Выявление целей (Target Identification) — идентификация белков, на которые должно действовать лекарство
  2. Дизайн молекул (Molecular Design) — использование предсказанной структуры для дизайна молекул, которые "подходят" к белку
  3. Предиктивное тестирование — компьютерное моделирование взаимодействия потенциального лекарства с белком
  4. Снижение экспериментальных затрат — с лучшими компьютерными предсказаниями нужно меньше дорогостоящих лабораторных тестов
Экономический эффект

Разработка одного нового лекарства стоит в среднем $1-3 миллиарда и занимает 10-15 лет. Если D-I-TASSER может ускорить этот процесс хотя бы на 10%, это сэкономит сотни миллионов долларов на разработку каждого лекарства. На глобальном фармацевтическом рынке в $2+ триллиона, это огромный экономический эффект.

Применение в исследовании заболеваний

Многие болезни вызваны мутациями (изменениями) в генах, которые кодируют белки. Эти мутации часто искажают структуру белка, вызывая дисфункцию. Примеры:

  • Муковисцидоз — мутация в белке CFTR искажает его структуру
  • Серповидноклеточная анемия — мутация в гемоглобине изменяет его форму
  • Различные раки — мутации в опухолевых супрессорах (например, p53) нарушают их структуру

D-I-TASSER может помочь понять, как конкретная мутация влияет на структуру белка, и, таким образом, на болезнь. Это открывает новые способы лечения генетических заболеваний.

РНК и белок-белковые взаимодействия: будущее

Исследовательская группа уже расширяет подход D-I-TASSER:

Расширение на РНК: РНК также имеют сложные 3D структуры, важные для их функции. Применение D-I-TASSER к РНК может помочь в изучении регуляции генов.

Белок-белковые комплексы: В клетке белки часто работают в больших комплексах. Предсказание структур этих комплексов — следующий уровень сложности.

Сравнение с другими методами

На ландшафте методов предсказания структур белков:

Метод Тип Точность Скорость
AlphaFold Чистый ИИ Очень высокая Быстро
D-I-TASSER ИИ + Физика Выше для сложных Медленнее
Молекулярная динамика Чистая физика Высокая Очень медленно
Экспериментальные методы Лаборатория Наиболее высокая Месяцы-годы

Публикация и научное сообщество

Исследование было опубликовано в феврале 2026 года на портале phys.org с широким освещением в научных кругах. Результаты были хорошо приняты, так как они решают реальную проблему, с которой сталкиваются учёные — предсказание структур сложных, многодоменных белков.

В науке 2026 года становится ясно, что будущее — это не ИИ против науки, а ИИ плюс наука. Гибридные подходы, комбинирующие мощь машинного обучения с законами физики, дают лучшие результаты.

Практическое применение: от лаборатории к клинике

Путь от теории до практического применения длинный, но уже ясен:

  1. 1-2 года: Интеграция D-I-TASSER в фармацевтические R&D pipeline-ы крупных компаний
  2. 2-5 лет: Несколько кандидатов лекарств, дизайн которых ускорен благодаря D-I-TASSER
  3. 5-10 лет: Первые одобренные FDA лекарства, разработанные с помощью D-I-TASSER, выходят на рынок
  4. 10+ лет: Стандартный инструмент в разработке лекарств и биотехнологии

Заключение: синтез знаний

D-I-TASSER представляет поворотный момент в том, как мы подходим к научным проблемам. Вместо выбора между "старой наукой" (физика, эксперименты) и "новой наукой" (ИИ, машинное обучение), лучший подход — это их комбинация.

На 13% повышение точности может звучать скромно, но в контексте разработки лекарств, где каждый процент улучшения может означать сотни миллионов долларов сэкономленных, и тысячи жизней спасённых благодаря лекарствам, доставленным на рынок быстрее — это трансформационное достижение.

Поймите будущее биотехнологии и ИИ

Курс "AI-грамотность" объясняет, как искусственный интеллект революционизирует биоинформатику, открытие лекарств и медицину. Изучите технологии, которые спасают жизни.

Начать курс сейчас →

Теги статьи:

D-I-TASSER Белки Структура белка Машинное обучение Физика Открытие лекарств Биоинформатика NUS

Источник: phys.org, National University of Singapore (февраль 2026)