Теория естественного отбора, утверждающая, что выживает самый приспособленный, работает, как оказывается, не только в эволюции биологических систем, но и в компьютерных технологиях. Исследование, проведенное Сергеем Масловым, специалистом по вычислительной биологии из Брукхейвенской национальной лаборатории, и его коллегой Тин Яю Паном, аспирантом из Университета в Стоуни-Брук, выявило удивительное сходство между тем, как геномы бактерий обмениваются своими генами, и тем, как структурируются большие компьютерные проекты. Сообщение об этом было опубликовано в последнем номере журнала PNAS .
Ученые воспользовались открытыми базами данных и сравнили между собой геномы пяти сотен видов бактерий и 200 000 пакетов программ, установленных на более чем двух миллионах компьютеров с операционной системой Linux.
Как известно, ядро операционных систем Linux не имеет собственного автора. Созданное финским программистом Торвальдсом Линусом, оно впоследствии развивалось другими разработчиками в рамках модели свободного и открытого программного обеспечения. Программы Linux распространяются, как правило, в виде готовых дистрибутивов со своим набором прикладных программ. Все эти программные пакеты создавались различными людьми, и, по оценкам, в системе Linux воплощен труд, эквивалентный 73 тысячам человеколет. Маслова и Пэнга интересовало, с какой частотой в программах на основе системы Linux встречаются определенные куски кода и как выглядит частотное распределение этих участков; в отношении же бактерий их интересовало частотное распределение генов в молекулах ДНК.
Кроме того, ученые пытались выяснить количество «незаменимых» генов и кусков программного кода, без которых бактерии или программы просто не могут обойтись. Собственно, изучение распределения генов в геномах бактерий было для Сергея Маслова повторением пройденного. Еще 10 лет назад он установил частотный закон распределения генов, доказав, в общем-то, очевидную закономерность: чем чаще конкретный участок генома необходим для функционирования других генов, тем чаще он встречается в ДНК.
Тогда же он вывел закон, определяющий количество «ключевых» генов, то есть тех, без которых бактерия не способна выжить: оно оказалось пропорционально квадратному корню из общего количества генов.
Теперь же он обратил внимание на то, что бактерии в определенном смысле представляют собой, как он выразился, «биологические бит-торренты», поскольку свободно обмениваются своими генами с другими бактериями, точно так же, как обмениваются файлами через интернет пользователи сетевого протокола BitTorrent. В ходе этого хаотического обмена какие-то гены приживаются в чужом геноме, какие-то оказываются ненужными. Казалось логичным, что и в геномах бактерий, и в операционных системах Linux, где частотой появления тех или иных компонентов управляют одни и те же законы, их частотное распределение должно быть похожим. Так оно и вышло. «Мы почти ожидали этого, — говорит Маслов. — Но удивительным для нас оказалось то, что и количество «ключевых» компонентов, будь то программы или гены, без которых система не выживает, определялось одним и тем же законом, то есть было пропорционально квадратному корню от общего числа компонентов.
Сергей Маслов — наш соотечественник, весьма успешно делающий научную карьеру в США. С 1992-го по 1995 год он был младшим научным сотрудником в Институте теоретической физики им. Ландау, затем перебрался в Брукхейвен, где постепенно сменил физику на биоинформатику. В 2004 году был удостоен Президентской премии для молодых ученых и инженеров. Сейчас в Брукхейвене он возглавляет свою лабораторию .