Книга Мусорная ДНК. Путешествие в темную материю генома - Несса Кэри
Шрифт:
Интервал:
Закладка:
Эти данные позволили нам приписать биохимические функции 80% генома. Особенно это касается зон, лежащих за пределами хорошо изученных участков, то есть за пределами областей, которые кодируют белки5.
Иными словами, участники проекта ENCODE как бы заявляли: перед нами не темное небо, лишь менее чем на 2% занятое звездами. Они утверждали: небосвод нашего генома на четыре пятых заполнен всевозможными объектами. Причем большинство объектов — отнюдь не звезды (если считать, что звезды в этом сравнении — гены, кодирующие белки). Вероятно, это астероиды, планеты, естественные спутники планет, метеоры, кометы и прочие межзвездные тела, какие только можно себе представить.
Как мы видели, многие исследовательские группы уже и до этого приписали определенные функции каким-то из этих темных областей: вспомним промоторы, энхансеры, теломеры, центромеры, длинные некодирующие РНК (это лишь несколько примеров). Так что большинство ученых вполне устраивала идея, согласно которой в нашем геноме содержится не только эта небольшая доля генетического материала, кодирующая белки. Но 80% генома, обладающие функциями? Это казалось чересчур смелым заявлением.
Данные ENCODE многих поразили. Тем не менее их предвестием стали результаты многочисленных косвенных исследований, на протяжении предыдущего десятилетия проводившихся учеными, которые все пытались понять, отчего человек так сложно устроен. Над этой проблемой ломало голову немало специалистов и неспециалистов с тех самых пор, как выяснилось: полная расшифровка человеческого генома не выявила у человека большего числа генов, кодирующих белки, по сравнению с куда более простыми организмами. Исследователи проанализировали размеры части генома, кодирующей белки, у различных представителей царства животных, и процентную долю, которую составлял мусор в общем объеме генома. Результаты этого анализа (мы уже бегло коснулись их в главе 3) сжато показаны на рис. 14.1.
Как мы уже знаем, количество генетического материала, кодирующего белки, не очень-то соотносится со сложностью организма. Куда более убедительная зависимость существует между процентной долей мусора в геноме и тем, насколько сложно устроен носитель этого генома. Пытаясь интерпретировать этот факт, исследователи предположили, что различия между простыми и сложными существами порождаются главным образом именно мусорной ДНК. Возможно, это означает, что существенная доля мусорной ДНК все-таки обладает какими-то функциями6.
Рис. 14.1. График показывает, что по мерю увеличения сложности организма доля мусорной ДНК в геноме нарастает быстрее и отчетливее, чем размер части, кодирующей белки.
ENCODE рассчитывал долю функционирующих участков в нашем геноме, объединив всевозможные данные. В число этих данных вошла и информация о молекулах РНК, которые удалось обнаружить участникам проекта. Среди этих РНК оказались представлены как кодирующие белки, так и не кодирующие их, то есть мусорные РНК. Все они имели самую разную длину — от молекул протяженностью в тысячи нуклеотидных оснований до молекул в сотню раз меньше. Кроме того, ENCODE считал геномные области имеющими функции, если такие зоны несли на себе определенные комбинации эпигенетических модификаций, обычно связываемые с функциональными областями. Другие подходы предполагали, в частности, анализ участков, которые образуют петли и благодаря этому сближаются. Еще одна методика подразумевала характеризацию генома по специфическим физическим свойствам, связываемым с той или иной функцией[43].
Свойства эти отличались у разных типов человеческих клеток, что подтвердило гипотезу, согласно которой клетки могут использовать одну и ту же геномную информацию весьма гибко. К примеру, изучение образования петель показало, что одна разновидность взаимодействий между различными участками генома наблюдается лишь у каждого третьего из исследованных типов клеток7. Это позволяет предположить, что сложная трехмерная укладка нашего генетического материала — явление комплексное и зависящее от типа клетки.
Изучая физические характеристики, обычно связываемые с регуляторными областями, ученые пришли к выводу, что регуляторные участки ДНК также активируются в зависимости от типа клетки — и что, в свою очередь, характер клетки (то, какой она станет) формируется под действием этой мусорной ДНК8. К этому выводу исследователи пришли после того, как выявили около 3 миллионов таких мест (сайтов) путем анализа клеток 125 различных типов. Это не означает, что у клеток каждого типа 3 миллиона сайтов. Это лишь означает, что, проанализировав все эти клеточные типы, ученые обнаружили 3 миллиона сайтов. Опять-таки, это наводит на мысль, что регуляторный потенциал генома может использоваться по-разному — в зависимости от нужд той или иной клетки. Распределение сайтов по клеточным типам упрощенно показано на рис. 14.2.
Рис. 14.2. Анализируя наборы данных проекта ENCODE, ученые выявили свыше трех миллионов сайтов с характеристиками регуляторных областей (исследуя множество клеточных линий человека). Площади кругов отражают распределение таких сайтов. Большинство их обнаруживали в клетках двух и более типов, хотя значительная их доля оказалась специфической для отдельных типов клеток. И лишь очень малую часть сайтов удалось найти в каждой из проанализированных клеточных линий.
Свыше 90% регуляторных участков, выявленных благодаря этому методу, находились более чем за 2500 пар нуклеотидных оснований от начала ближайшего гена. Иногда они располагались вдали от всех генов, а иногда — в мусорной области, входящей в состав гена, но все равно они размещались далеко от его начала.
Большинство промоторов генов ассоциированы более чем с одним таким участком, а каждый такой участок обычно ассоциирован более чем с одним промотором. Однако, опять-таки, наши клетки, судя по всему, контролируют генетическую экспрессию отнюдь не прямолинейно. Они используют сложные сети взаимодействующих узлов.
Среди наиболее поразительных данных — информация, позволяющая предположить, что более 75% нашего генома хоть когда-нибудь, хоть в каких-нибудь клетках копируется в РНК9. Любопытное предположение. Никто не мог ожидать, что три четверти мусорной ДНК наших клеток может реально использоваться для производства РНК. При сравнении информационных РНК, кодирующих белки, с длинными некодирующими РНК ученые выявили существенную разницу в картине экспрессии. В 15 изученных клеточных линиях информационные РНК, кодирующие белки, гораздо охотнее экспрессировались во всех клеточных линиях, чем длинные некодирующие РНК (см. рис. 14.3). Исследователи пришли к выводу: длинные некодирующие РНК играют определяющую роль в управлении судьбой клеток.