
Об этом сообщает KURAZH
Ведущие ученые из Arc Institute, Nvidia, Стэнфордского и Калифорнийского университетов представили Evo 2 — новую нейросеть, которая радикально повышает эффективность анализа и проектирования ДНК. В отличие от привычных инструментов искусственного интеллекта, Evo 2 является масштабной фундаментальной моделью, обученной на генетических данных более 128 тысяч видов живых организмов. Благодаря этому Evo 2 способна распознавать закономерности в ДНК намного точнее и глубже, чем это доступно традиционным методам исследования.
Инновации в работе с длинными генетическими последовательностями
Одним из главных препятствий для предыдущих моделей искусственного интеллекта была ограниченная «память», из-за чего анализ генетических последовательностей большого размера становился фрагментарным. Evo 2 основана на архитектуре StripedHyena 2 и может обрабатывать до миллиона нуклеотидов одновременно, что позволяет видеть полную картину генома. Для обучения был использован массив данных в 9,3 триллиона нуклеотидов — это в 30 раз больше, чем у предыдущей версии Evo 1. В обучающий набор вошли геномы бактерий, архей, вирусов, растений и человека, что позволяет анализировать и даже создавать новые генетические последовательности для различных доменов жизни.
Новые возможности для медицины и биотехнологий
Практическая польза Evo 2 уже подтверждена тестированиями. Модель показала более 90% точности при анализе мутаций гена BRCA1, связанного с риском онкологических заболеваний, четко отделяя патогенные варианты от безопасных. Это может стать прорывом для диагностики и лечения рака, а также для анализа рисков развития болезни Альцгеймера и исследования генетики домашних животных. Отдельного внимания заслуживает способность Evo 2 проектировать синтетические бактериофаги — вирусы, уничтожающие бактерии. Они могут стать эффективным оружием против бактерий, устойчивых к антибиотикам. Важно, что Evo 2 интегрирована в платформу Nvidia BioNeMo, а весь код, веса и обучающие данные находятся в открытом доступе для научного сообщества, что делает этот проект крупнейшим открытым вкладом в современную биоинформатику.
«Модель просто не обучена работать с «биологическим оружием» и не выдает ответов на запросы, касающиеся создания опасных вирусов».
Разработчики особенно тщательно подошли к этическим аспектам: из обучающей выборки были исключены патогены, опасные для человека и других сложных организмов. Такой ответственный подход гарантирует, что потенциал технологии направлен на благо человечества, а не на создание новых угроз.
Пока Evo 2 открывает новые горизонты в генетике, в сфере потребительских технологий также происходят инновации: например, интеграция Shazam в ChatGPT расширила возможности распознавания музыки в чат-ботах.