Большие языковые модели уже заявили о себе как о ценном инструменте исследования генома животных. Актуальной остается проблема эффективного переноса этих БЯМ в область исследования растений, в основе которой лежат существенные различия между естественным языком и биологическим языком генов. Команда ученых из Хайнаньского университета взялась за изучение перспектив применения БЯМ в геномных исследованиях растений.
Изучив потенциал БЯМ и проанализировав существующие архитектуры БЯМ для анализа геномных последовательностей, исследователи предложили собственную методологию. Она состоит в предварительном обучении БЯМ на обширных наборах данных геномных последовательностей растений, за которым следует тонкая настройка с использованием определенных аннотированных данных.
Обрабатывая последовательности ДНК подобно лингвистическим предложениям, новые модели научились распознавать закономерности и корреляции в генетическом коде. Они хорошо зарекомендовали себя в таких задачах, как выявление промоторов, идентификация энхансеров и анализ экспрессии гена, https://www.eurekalert.org/news-releases/1085767 EurekAlert.
В частности, модели AgroNT и FloraBERT показывают улучшенную производительность в аннотировании геномов растений и прогнозировании экспрессии тканеспецифичных генов.
Авторы исследования подчеркивают огромный потенциал интеграции искусственного интеллекта, особенно больших языковых моделей, в исследования геномики растений. Преодолевая разрыв между вычислительной лингвистикой и генетическим анализом, БЯМ могут изменить наше понимание биологии растений, открыть путь для инноваций в сельском хозяйстве, охране природы и биотехнологии.
Недавно ученые из США https://hightech.plus/2025/05/19/novaya-tehnologiya-vstavlya... более безопасную и универсальную стратегию редактирования генома с сохранением целостности генетического ландшафта. Теперь ученые могут вставлять полноразмерные гены в целевые участки без необходимости разрезания ДНК.
Свежие комментарии