Книга Геном человека: Энциклопедия, написанная четырьмя буквами - Вячеслав Тарантул
Шрифт:
Интервал:
Закладка:
Обычно, чтобы экспериментально установить функцию того или иного вновь обнаруженного гена или белка, требуются значительные усилия экспериментаторов и весьма большие финансовые затраты. Использование компьютеров позволяет решать многие вопросы без проведения специальных дорогостоящих и занимающих много времени экспериментов. Ярким примером может служить обнаружение гена, мутация в котором обуславливает преждевременное старение, происходящее при синдроме Вернера (напомним, что пациенты с этим заболеванием уже в молодые годы выглядят как дряхлые старики). С помощью Интернета и других современных средства информатизации всего за восемь месяцев удалось «вычислить» соответствующий ген. Для его обнаружения исследователям пришлось перебрать в базах данных свыше миллиона пар нуклеотидов. Очевидно, что без помощи геноинформатики этого события пришлось бы ждать еще несколько лет.
Другой пример — создание каталога всех имеющихся в геноме человека ферментов, называемых протеинкиназами («кином»). В результате этого поиска было выявлено 518 генов, кодирующих протеинкиназы, и, кроме того, 106 псевдогенов. При этом 70 из обнаруженных генов ранее были совсем неизвестны. Выяснилось также, что почти половина генов «кинома» располагается в участках генома, связанных с различными заболеваниями человека.
Дешифровка последовательности белка с помощью компьютера напоминает работу криптографов — из последовательности отдельных букв читается весь биологический текст, и на основании этого выясняется, что это за белок, какова его функция в организме. Впечатляющие результаты были получены, например, австрийцем Айзенбергом. Используя дешифровальные методы анализа нескольких тысяч белков, не проведя при этом ни одного эксперимента, он сразу предсказал функции почти половины из них. Вспомним, что еще не так давно ученые иногда тратили всю жизнь, чтобы определить структуру одного белка и познать его функцию. С помощью новых подходов можно одновременно предсказать функцию большого числа белков.
Для написания книги «Функционирующий геном» потребуется объединить вместе огромную информацию о картине работы десятков тысяч генов в различных типах клеток на разных стадиях развития и в разных физиологических состояниях, данные о структуре и функции отдельных белков, кинетические параметры, концентрации молекул, сведения о взаимодействии генов и генных продуктов, реакции генома на экстремальные стимулы и различного рода патологические процессы. Связь между генотипом и фенотипом, то есть между генами и их проявлением в совокупности признаков и свойств организма, зачастую обусловлена сложным взаимодействием множества различных генов, а также факторов окружающей среды. По этой причине во многих случаях ее экспериментально пока не удается однозначно установить. Слишком сложна задача и слишком много исходных данных. Такую ситуацию часто называют проблемой нелинейного картирования. Чтобы решить эту проблему, био- и гено-информатике понадобятся новые значительно более совершенные программы, еще более мощные компьютеры. В частности, для этой цели в настоящее время предложено использовать так называемое генетическое программирование. Гены в генетическом программировании рассматривают как аналоги компьютерных программ. Из огромного объема имеющейся информации, связанной с тем или иным фенотипом, строят многочисленные метаболические «деревья», соответствующие разным известным молекулярным взаимодействиям внутри клетки. Затем для поиска наилучшей модели, описывающей определенный фенотип, с «деревьями» осуществляют на компьютере различные операции, подобные мутациям и рекомбинациям в геноме. Следующий этап — отбор тех из них, которые в наибольшей мере соответствуют реальным данным. В конечном итоге все это позволяет осуществлять прогностическое нелинейное картирование, то есть указать на взаимосвязь между работой определенного набора генов и конкретного фенотипа. А далее уже наступает очередь экспериментаторов, которые должны подтвердить или опровергнуть данные, полученные с помощью генетического программирования. Таким образом, генетическое программирование служит для исследователей некой путеводной звездой. Несмотря на сложность задачи, ожидается, что она будет решена не более чем через несколько десятков лет.
Однако нельзя переоценивать возможности современной биоинформатики, она еще далеко не все может решить. Тем не менее, она выступает в качестве мощного инструмента для первоначальной переработки огромной по объему информации, содержащейся в ДНК. Биоинформатика дает для исследователей ценные данные и делает их поиск целенаправленным. Такой поиск может быть продолжен в дальнейшем с использованием других подходов, в частности, экспериментов на культурах клеток или даже на целых животных. Например, как уже говорилось выше, функции тех или других генов человека можно эффективно изучать на модели трансгенных животных.
Кроме перечисленных выше, биоинформатика решает и множество других не менее важных и сложных задач. Таковым являются разработка методов анализа экспериментальной информации; компьютерное моделирование структурно-функциональной организации (вторичной, третичной структуры) генетических макромолекул (ДНК, РНК и белков), молекулярно-генетических процессов (репликации, транскрипции, сплайсинга, трансляции) и молекулярных взаимодействий между генетическими макромолекулами в генных сетях; исследование закономерностей молекулярной эволюции генетических макромолекул, а также молекулярно-генетических систем. Так, используемый в науке геногеографии картографический подход (о нем мы еще поговорим ниже), позволяющий исследовать пространственное распространение по нашей плавнете различных генетических признаков человека, долгие годы был чрезвычайно трудоемким и отнимал у ученых очень много времени. Использование компьютерных технологий принципиально изменило ситуацию, позволило существенно облегчить эти рутинные процедуры, давая исследователю возможность сосредоточиться непосредственно на вопросах творческого анализа географической изменчивости популяционно-генетических характеристик.
Сравнительный анализ геномов с помощью компьютеров стал одним из наиболее распространенных и эффективных методов изучения их структурно-функциональной организации и эволюции. Об этом уже шла речь выше, когда рассказывалось о функциональной геномике, коснемся мы его и в следующих разделах. Наиболее важные участки генома относительно мало изменяются в процессе эволюции, и их функции, установленные в экспериментах на мышах или мухах, зачастую оказываются такими же и у человека. Экспериментальный поиск генов, которые сходны у человека и животных, занимает недели и месяцы работы целой лаборатории. С помощью созданных геноинформатикой эффективных алгоритмов поиска компьютеры позволяют сделать это за считанные минуты. При наличии сходства последовательностей ДНК геноинформатика, с определенной степенью точности, может предсказать эволюцию геномов, функцию отдельных генов и др.
Биоинформатика способна также предсказать пространственную структуру белка на основании данных по последовательности нуклеотидов в ДНК. Это чрезвычайно важное обстоятельство, так как число известных первичных белковых структур (последовательностей аминокислот), установленных по известным нуклеотидным последовательностям ДНК, намного превосходит число экспериментально подтвержденных пространственных белковых структур. И в этом направлении также разработано большое число подходов. Один из наиболее эффективных — использование информации о пространственной структуре белков, имеющих сходную первичную структуру.