Биология обработки данных: российская биоинформатика сильна анализом, а не исследованиями

 

Мало какой прорыв в медицине в последние годы обошелся без большого вклада биоинформатики. В 2012 году ученым из Японии и Великобритании вручили Нобелевскую премию за превращение обычных клеток в стволовые, которые могут потом развиваться в любую ткань. Что это дало? Над полученными клетками можно проводить исследования — например, прочитать их РНК–код,чтобы понять причины шизофрении или болезни Альцгеймера.
Чтение ДНК и РНК — это сегодня уже рутинная задача. Основная сложность — понять, что означает каждая последовательность нуклеотидов, и эти процессы не обходятся без биоинформатики. Это наука на стыке биологии и информатики, изучающая применение компьютерных методов для анализа биологических данных. Еще 100 лет назад биология была в основном наукой наблюдения и описания живой природы. В наши дни ученые наблюдают уже с помощью больших приборов, которые генерируют терабайты информации. Обработкой полученных данных как раз и занимается биоинформатика. Постановка задач вытекает из биологии, а информатики находят алгоритмы для их решения. Биологи, которые не владеют программированием, сегодня уже не способны делать исследования, значимые в российских масштабах. В эту сферу идут информатики, которые хотят применить свои навыки в жизненно важном деле.
В биоинформатике и биологии есть такие понятия, как dry lab (работа за компьютером) и wet lab (работа в лаборатории). У нас с dry lab все хорошо, хуже обстоят дела с wet lab — российских ученых–биологов можно назвать героями. Например, чтобы прочитать геном, нужен специальный аппарат — секвенатор. Но для каждого эксперимента закупаются специальные реагенты. В силу особенностей грантового финансирования и таможенного законодательства от момента заказа реагентов до их поступления в лабораторию идея эксперимента может потерять актуальность. Поэтому обычно биоинформатические исследования в России проводят совместно с зарубежными группами, а самый эффективный способ просеквенировать геном — отправить его в Китай, где это будет стоить $1000 — в 5–10 раз дешевле, чем у нас. Впрочем, благодаря открытым базам данных о геномах в получении новых объемов информации зачастую нет острой необходимости: можно скачать из Интернета терабайты уже опубликованных данных и анализировать их.
Одним словом, данных сейчас больше, чем существующих возможностей их обработать, поэтому задача биоинформатиков — создавать эффективный инструментарий и грамотно его применить. Для этого нужно немного: стол, стул, компьютер и кофе.