Как машинное обучение может уберечь опасную ДНК от рук террористов

Last Updated on

Сложные алгоритмы могут помочь компаниям по синтезу ДНК избежать создания опасных организмов по требованию

Биологи во всем мире регулярно платят компаниям за синтез фрагментов ДНК для использования в лаборатории или клинике. Но эксперты по разведке и ученые в течение многих лет беспокоились о том, что биотеррористы могут похитить такие службы для создания опасных вирусов и токсинов — возможно, путем внесения небольших изменений в генетическую последовательность, чтобы избежать проверки безопасности без изменения функции ДНК.

Теперь правительство США поддерживает усилия, которые используют машинное обучение, чтобы определить, кодирует ли последовательность ДНК часть опасного патогена. Исследователи начинают добиваться прогресса в разработке инструментов скрининга на основе искусственного интеллекта, и несколько групп представляют первые результаты на встрече по биообработкам Американского общества микробиологии (ASM) в Арлингтоне, штат Вирджиния, 31 января. Их результаты могут привести к лучшему пониманию того, как патогены вредят организму, а также к новым способам ученых связывать последовательности ДНК с конкретными биологическими функциями.

«В прошлом вы брали патоген, запирали его и ставили перед ним армию, и с вами все было в порядке», — говорит Омар Таббаа, директор по вычислительной биотехнологии в Battelle, компании по разработке технологий в Колумбусе, Огайо.

Но Таббаа говорит, что снижение стоимости и сложности инженерии ДНК изменило природу угроз биобезопасности. Любой, кто хочет конкретный кусок ДНК, может иметь цепочку букв, называемых основами, синтезированную за копейки за основу. В 2006 году журналисты британской газеты  The  Guardian заплатили компании по синтезу ДНК за то, что она стала частью вируса оспы, что вызвало  призывы правительств и ученых к более строгим мерам скрининга.

БУКВА ЗА БУКВОЙ

В 2009 году несколько крупнейших фирм по синтезу ДНК создали консорциум для создания стандартизированных процедур проверки последовательностей, представленных их клиентами, по базам данных известных патогенов. Если автоматический скрининг отображает последовательность, компания может проверить, является ли клиент законным исследователем, прежде чем синтезировать ДНК.

Но эти существующие программы выбирают только те части последовательностей, которые точно соответствуют частям известных патогенов. Умный террорист может обмануть систему, заменив несколько оснований ДНК вирусом или геном, производящим токсин, или даже создав совершенно новый патоген, которого нет в природе. Усугубляя проблему, сами базы данных часто пронизаны ошибками из-за различий в последовательности ДНК.

Учитывая это, в 2016 году Агентство перспективных исследований разведки США (IARPA) выступило с инициативой разработки более совершенных алгоритмов для выявления потенциально опасных последовательностей. Пять команд из промышленности и научных кругов соревнуются в программе, говорит ее менеджер Джон Юлиас. Агентство отказалось раскрывать бюджет программы.

Ожидается, что к 2020 году команды разработают способ определить, менее чем за две недели, представляет ли неизвестная последовательность угрозу. Это будет трудная задача, говорит Эндрю Уоррен, инженер-программист из Университета Вирджинии в Шарлоттсвилле. «Мы должны быть в состоянии распознать любой организм на планете, а также его молекулярную функцию».

ОБЩИЕ ТЕМЫ

Команда Уоррена разрабатывает программу, которая сравнивает 40 миллионов записей последовательностей из 90 000 видов микробов. Алгоритм учится распознавать последовательности ДНК известных токсинов и патогенов, выявляет их общие характеристики и затем ищет похожие последовательности в других организмах. Работа, которую его команда представляет на собрании ASM, находится на ранних стадиях, хотя Уоррен говорит, что алгоритм уже может надежно предсказать, из какого типа организма происходит последовательность.

Таббаа, чья команда в Battelle разрабатывает аналогичный алгоритм, используя последовательности как из открытых, так и из частных баз данных, говорит, что компьютерные алгоритмы могут распознавать общие черты среди патогенных микроорганизмов, которые люди пропустят. Это поможет программам различать важные части последовательности ДНК и те, которые могут быть изменены без ущерба для функции патогена. Цель состоит в том, чтобы точно определить разделы, которые могут представлять угрозу безопасности в неизвестной последовательности.

Команда Battelle надеется, что программа также сможет раскрыть новую информацию об основной биологии организмов, такую ​​как универсальная последовательность ДНК, которая позволяет токсинам или вирусам прилипать к клеткам. Таббаа говорит, что такие открытия могут помочь исследователям разработать новые способы быстрой диагностики инфекций или улучшения биопроизводства. «Мы думаем, что из этого выйдет целый ряд вещей», — говорит он.

Но Роб Карлсон, управляющий директор Bioeconomy Capital, фирмы венчурного капитала в Сиэтле, штат Вашингтон, скептически относится к тому, что прекращение эксплуатации компаний по синтезу ДНК предотвратит атаки биотеррора. «Если вы посмотрите на то, какие биологические угрозы возникли до настоящего времени, это не одна из них», — говорит он. Большинство атак связано с выделением существующих патогенов, выращенных в лабораториях; в 2001 году, например,  пять человек в Соединенных Штатах умерли, а 17 получили тошноту  после получения писем с сибирской язвой.

По словам Карлсона, террористы, скорее всего, будут следовать плану опубликованных исследований, а не приступать к исследовательскому проекту по разработке новых организмов. Он опасается, что любые правительственные усилия по регулированию синтеза ДНК будут толкать потенциальных биотеррористов в подполье.

IARPA отказалась комментировать, разделяло ли агентство такие опасения.

Эта статья воспроизводится с разрешения автора и была  впервые опубликована  31 января 2019 года.

ОБ АВТОРЕ (S)

Сара Рирдон

Сара Рирдон, старший репортер журнала Nature в Вашингтоне, освещает биомедицинские исследования и политику. Ранее она писала для New Scientist and Science и получила степень магистра по молекулярной биологии в Университете Вашингтона.

Читайте также: