Гены где находятся у человека


Геном человека — Википедия

Геном человека — совокупность наследственного материала, заключённого в клетке человека. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две аутосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований[1].

В ходе выполнения проекта «Геном человека» была определена последовательность ДНК всех хромосом и митохондриальной ДНК. В настоящее время эти данные активно используются по всему миру в биомедицинских исследованиях. Полное секвенирование выявило, что человеческий геном содержит 20—25 тыс. активных генов[2], что значительно меньше, чем ожидалось в начале проекта (порядка 100 тыс.) — то есть только 1,5 % всего генетического материала кодирует белки или функциональные РНК. Остальная часть является некодирующей ДНК, которую часто называют мусорной ДНК [3], но которая, как оказалось, играет важную роль в регуляции активности генов[4][5].

Хромосомы[править | править код]

Геном человека состоит из 23 пар хромосом (всего 46 хромосом). Каждая хромосома содержит сотни генов, разделённых межгенным пространством. Межгенное пространство содержит регуляторные участки и ничего не кодирующую ДНК.

В геноме присутствует 23 пары хромосом: 22 пары аутосомных хромосом, а также пара половых хромосом X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y-хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом[6][7].

Гены[править | править код]

Предварительные оценки предполагали наличие в геноме человека более 100 тысяч генов. По результатам проекта «Геном человека» количество генов, а точнее открытых рамок считывания, составило около 28 000 генов. В связи с усовершенствованием методов поиска (предсказания) генов предполагается дальнейшее уменьшение числа генов.

Число генов у человека лишь ненамного больше, чем у более простых организмов, например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster. Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.

Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бендами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.

Кроме генов, кодирующих белки, человеческий геном содержит тысячи РНК-генов, кодирующих транспортные РНК (tRNA), рибосомные РНК, микроРНК и прочие РНК, не кодирующие белок.

Регуляторные последовательности[править | править код]

В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию генов. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.

Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно данным молекулярных часов, эволюционные линии человека и мыши разделились около 100 миллионов лет назад [8]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности, идентичные или очень слабо отличающиеся в сравниваемых геномах) в некодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов у обоих организмов[9].

Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8 раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов[10].

Прочие объекты в геноме[править | править код]

Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома[3]. Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, пока не выяснена. Эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:

Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент[когда?].

Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и эти участки генома многие называют мусорной ДНК. Однако есть масса свидетельств в пользу того, что эти объекты обладают некоторой функцией, которая пока неясна.

Псевдогены[править | править код]

Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции[11].

Вирусы[править | править код]

Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты[12]. Большинство ретровирусов встроились в геном предков человека свыше 25 млн лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено[13][14].

Информационное содержание генома человека[править | править код]

Азотистые основания в ДНК (аденин, тимин, гуанин, цитозин) соответствуют 4 различным логическим состояниям, что эквивалентно 2 битам информации[15]. Таким образом, геном человека содержит более 6 гигабит информации в каждой цепи, что эквивалентно 800 мегабайтам и сопоставимо с количеством информации на компакт-диске[16]. Логика хранения данных в парных основаниях аналогична системе виртуализации данных RAID 1.

  1. ↑ Talking glossary of genetic terms: genome (англ.). National Human Genome Research Institute. Дата обращения 1 ноября 2012. Архивировано 4 ноября 2012 года.
  2. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. (англ.) // Nature. — 2004. — Vol. 431, no. 7011. — P. 931—945. — doi:10.1038/nature03001. — PMID 15496913.
  3. 1 2 International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. (англ.) // Nature. — 2001. — Vol. 409, no. 6822. — P. 860—921. — doi:10.1038/35057062. — PMID 11237011.
  4. ↑ «Мусорная» ДНК помогает включать гены (неопр.).
  5. ↑ «Мусорная» ДНК играет важнейшую роль в поддержании целостности генома (неопр.).
  6. Tjio J. H., Levan A. The chromosome number of man (англ.) // Hereditas (англ.)русск.. — 1956. — Vol. 42. — P. 1—6. — doi:10.1111/j.1601-5223.1956.tb03010.x. — PMID 345813. Первая работа с точно установленным числом хромосом у человека.
  7. ↑ Human Chromosome Number, здесь рассказана история подсчёта хромосом у человека
  8. Nei M., Xu P., Glazko G. Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms. (англ.) // Proceedings of the National Academy of Sciences of the United States of America. — 2001. — Vol. 98, no. 5. — P. 2497—2502. — doi:10.1073/pnas.051611498. — PMID 11226267.
  9. Loots G., Locksley R., Blankespoor C., Wang Z., Miller W., Rubin E., Frazer K. Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons. (англ.) // Science. — 2000. — Vol. 288, no. 5463. — P. 136—140. — doi:10.1126/science.288.5463.136. — PMID 10753117. Summary
  10. Meunier, Monique Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome (англ.) (недоступная ссылка). Genoscope. Дата обращения 12 сентября 2006. Архивировано 20 августа 2002 года.
  11. Claverie J. Fewer genes, more noncoding RNA. (англ.) // Science. — 2005. — Vol. 309, no. 5740. — P. 1529—1530. — doi:10.1126/science.1116800. — PMID 16141064.
  12. ↑ Предки человека заимствовали полезные гены у вирусов
  13. Eugene D. Sverdlov. Retroviruses and primate evolution // BioEssays. — Vol. 22, № 2. — P. 161—171. — doi:10.1002/(SICI)1521-1878(200002)22:2<161::AID-BIES7>3.0.CO;2-X. — PMID 10655035.
  14. Anders L Kjeldbjerg, Palle Villesen, Lars Aagaard, Finn Skou Pedersen. Gene conversion and purifying selection of a placenta-specific ERV-V envelope gene during simian evolution // BMC Evolutionary Biology. — 2008. — Vol. 8. — P. 266. — doi:10.1186/1471-2148-8-266. — PMID 18826608.
  15. Деньгуб В. М., Смирнов В. Г. Единицы величин. Словарь-справочник. — М.: Издательство стандартов, 1990. — С. 25. — 240 с. — ISBN 5-7050-0118-5.
  16. ↑ How much information does human DNA store? - Quora
  • Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. — Языки славянской культуры, 2003. — 396 с. — ISBN 5-94457-108-X.
  • Ридли Мэтт. Геном: автобиография вида в 23 главах. — М.: Эксмо, 2008. — 432 с. — ISBN 5-699-30682-4

Где спрятаны гены в организме человека?

На сегодняшний момент каждый знает, что есть наследственность и сущест­вует гены. Гены обвиняют чуть ли не во всех грехах: плохая успеваемость— из-за плохих генов, капризный характер — виноваты гены;  фигура  превосходна — роди­тели наградили хорошими генами...

На самом деле, многое в  жизни каждого определяется наследственными факторами. Только не все так однозначно, как кажется на первый взгляд. Например, ученые утверждают, что за  25 %  физического неблагополучия человека виноваты гены, за 10 % развития патологии отвечает несовершенство медицинского обслуживания, в 15 % случаев виновата неблагоприятная экологическая обстановка, а остальные 50 % обусловлены  образом жизни. Гены не только определяют предрасположенность к тем или иным заболевания и отрицательным признакам характера, но и влияют на многие другие признаки, отличающие людей друг от друга и придающие каждому индивидуальность, — цвет волос, глаз и кожи, тембр голоса, особенности роста, телосложения и об­мена веществ. 

Спрятаны гены в ядре каждой клетки тела, за исключением безъядерных эритроцитов, тромбоцитов, эмали зуба. Каждый ген способен нести от пары сотен до нескольких тысяч  пар молекул. Сами гены следуют один за другим по одной прямой линии без боковых ответвлений. Эта прямая и очень длинная нить носит название " молекула ДНК". В каждой ДНК имеется свой набор генов. Дабы нити не перепутались, каждая из них уложена в строгом порядке. Такая упакованная молекула ДНК именуется хромосомой. 

Хромосомы можно увидеть в ми­кроскопе — по форме они напоминают букву X. Число хромосом у каждого вида организмов является константой: у человека 46 хромосом (в ядре каждой клетки тела), у шимпанзе — 48, у голубя — 80, а у некоторых видов раков — по 200. Хромосомы бывают разных размеров и имеют разное строение, набор  генов. Но у каждой хромосомы имеется пара,  содержащая гены, которые  отвечают за те же признаки. 

Каждая пара хромосом — как два похожих набора конструктора, и потому часто упоминают не 46 хромосом, а 23 пары хромосом или говорят о двойном наборе хромосом. Гены в хромосомах  могут быть одинаковыми или разными. 

А вот половые клетки, или гаметы-  яйцеклетки и сперматозоиды, которые дают начало новой жизни, являются  исключением. В них имеется одинарный набор хро­мосом, то бишь  их ядрах есть лишь по одной хромосоме от каждой пары- то есть всего 23 хромосомы. При оплодотворении эти 2 одинарных набора сольются в 1 — и образуется двой­ной набор, 46 штук, как и должно быть. Получается, что каждый человек несет в себе ровно по 50 % генов матери и отца. На кого из них  будет  похож человек, зависит от того, чьи доминантные гены он унаследовал.

Геном — Википедия

Гено́м — совокупность наследственного материала, заключённого в клетке организма[1]. Геном содержит биологическую информацию, необходимую для построения и поддержания организма. Большинство геномов, в том числе геном человека и геномы всех остальных клеточных форм жизни, построены из ДНК, однако некоторые вирусы имеют геномы из РНК[2].

Существует также и другое определение термина «геном», в котором под геномом понимают совокупность генетического материала гаплоидного набора хромосом данного вида[3][4]. Когда говорят о размерах генома эукариот, то подразумевают именно это определение генома, то есть размер эукариотического генома измеряют в парах нуклеотидов ДНК или пикограммах ДНК на гаплоидный геном[5].

У человека (Homo sapiens) наследственный материал соматической клетки представлен 23 парами хромосом (22 пары аутосом и пара половых хромосом), находящихся в ядре, а также клетка обладает множеством копий митохондриальной ДНК. Двадцать две аутосомы, половые хромосомы Х и Y, митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований[1].

Термин «геном» был предложен Гансом Винклером в 1920 году в работе, посвящённой межвидовым амфидиплоидным растительным гибридам, для описания совокупности генов, заключённых в гаплоидном наборе хромосом организмов одного биологического вида. В Оксфордском энциклопедическом словаре указано, что термин образован слиянием слов «ген» и «хромосома»[6]. Однако Джошуа Ледерберг и Алекса T. МакКрэй считают, что ботаник Г. Винклер должен был быть знаком с ботаническими терминами «ризом», «таллом», «трахеом» и т. д. Все эти термины возникли до 20-х годов XX века, и суффикс «-ом» в них означает объединение частей в целое, например, «ризом» означает всю корневую систему растения. Таким образом, «геном» можно понимать как объединение генов в целое[7].

До недавнего времени термин «геном» использовался в двух смыслах. У эукариот геном соответствовал гаплоидному набору хромосом с локализованными в них генами. В генетике бактерий и вирусов термин «геном» употреблялся для обозначения совокупности наследственных факторов одной хромосомы или группы сцепления прокариот. Позже в генетике бактерий семантика термина «геном» претерпела дрейф в сторону обозначения всей наследственной конституции клетки, включая самые разные внехромосомные факультативные элементы. Постепенно в этом смысле термин «геном» стали употреблять и в генетике эукариот[8].

Первоначальный смысл этого термина указывал на то, что понятие генома, в отличие от генотипа, является генетической характеристикой вида в целом, а не отдельной особи. С развитием молекулярной генетики значение данного термина изменилось[9]. В настоящее время под «геномом» понимают совокупность наследственного материала отдельного представителя вида, примером может служить международный проект «1000 геномов»[en], целью которого является секвенирование геномов 1000 человек[10][11].

Геномы живых организмов — от вирусов до животных — различаются по размеру на шесть порядков: от нескольких тысяч пар оснований до нескольких миллиардов пар оснований. Если исключить вирусы, то для клеточных организмов ширина диапазона составит четыре порядка. По количеству генов диапазон значительно ýже и составляет четыре порядка с нижним пределом 2-3 гена у самых простых вирусов и с верхним значением около 40 тысяч генов у некоторых животных. Если исключить из рассмотрения вирусы и бактерии, которые ведут паразитический или симбиотический образ жизни, то диапазон изменчивости геномов по числу генов становится совсем узким, составляя немногим более одного порядка[12].

По соотношению размера генома и числа генов геномы могут быть разделены на два чётко выделенных класса:

  1. Небольшие компактные геномы размером, как правило, не более 10 млн пар оснований, со строгим соответствием между размером генома и числом генов. Такими геномами обладают все вирусы и прокариоты. У этих организмов плотность генов составляет от 0,5 до 2 генов на тысячу пар оснований, а между генами имеются очень короткие участки, занимающие 10-15 % длины генома. Межгенные участки в таких геномах состоят главным образом из регуляторных элементов. Помимо вирусов и прокариот, к этому классу могут быть отнесены и геномы большинства одноклеточных эукариот, хотя их геномы демонстрируют несколько меньшую зависимость между размером генома и числом генов, а размер генома может достигать 20 млн пар оснований.
  2. Обширные геномы размером более 100 млн пар оснований, у которых нет чёткой взаимосвязи между размером генома и числом генов. К этому классу относятся большие геномы многоклеточных эукариот и некоторых одноклеточных эукариот. В отличие от геномов первой группы, большинство нуклеотидов в геномах этого класса относится к последовательностям, которые не кодируют ни белков, ни РНК[13][14].

Прокариоты[править | править код]

Геном подавляющего числа прокариот представлен одиночной хромосомой, которая является кольцевой молекулой ДНК. Помимо хромосомы, в клетках бактерий часто находятся плазмиды — также замкнутые в кольцо ДНК, способные к независимой репликации[2]. У ряда бактерий, относящихся к различным филогенетическим группам, обнаружено линейное строение как хромосомы, так и плазмид. Например, геном спирохеты Borrelia burgdorferi, вызывающей болезнь Лайма, состоит из линейной хромосомы и нескольких плазмид, часть из которых имеет также линейное строение[15].

Геномы большинства прокариот маленькие и компактные, гены плотно упакованы и между ними находится минимальное количество регуляторной ДНК. Геномы почти всех эубактерий и архей содержат от 106 до 107 пар нуклеотидов и кодируют 1000-4000 генов[16]. Многие гены у прокариот организованы в совместно транскрибируемые группы — опероны[14].

Самыми маленькими геномами у прокариот обладают внутриклеточные симбионты и паразиты, такие как Hodgkinia cicadicola (144 Кб), Carsonella rudii (180 Кб)[17] или Mycoplasma genitalium (580 Кб)[18]. Самым большим прокариотическим геномом является геном обитающей в почве бактерии Sorangium cellulosum, размер которого составляет около 13 Мб[19].

Эукариоты[править | править код]

Практически вся генетическая информация у эукариот содержится в линейно-организованных хромосомах, находящихся в клеточном ядре. Внутриклеточные органеллы — митохондрии и хлоропласты — имеют свой собственный генетический материал. Геномы митохондрий и пластид организованы как прокариотические геномы.

Вирусы[править | править код]

Вирусные геномы очень малы. Например, геном вируса гепатита B представляет собой одну двуцепочечную кольцевую ДНК длиной около 3200 нуклеотидов[20].

Размер некоторых геномов с известной последовательностью[править | править код]

Тип организма Организм Размер генома
(пар оснований)
Примерное число генов Примечание Ссылка на Genbank
Вирус Porcine circovirus тип 1 1,759 1.8 kb Наименьший известный вирусный геном из способных самостоятельно размножаться в клетках эукариот.[21]
Вирус Бактериофаг MS2 3 547 3.5 kb 4 Первый расшифрованный РНК-геном, 1976 год[22] [1]
Вирус SV40 5,224 5.2 kb Расшифрован в 1978 году.[23] Миллионы людей были инфицированы вирусом SV40, так как в 1960-х годах он содержался в вакцине против вируса полиомиелита[24].
Вирус фаг φX174 5,386 5.4 kb 9 Первый расшифрованный ДНК-геном, 1977 год.[25]
Вирус ВИЧ тип 2 10359 10.3 kb 9 [2]
Вирус лямбда (λ) фаг 48,502 48.5 kb Часто используется как вектор клонирования рекомбинантной ДНК.

[26][27][28]

Вирус Мегавирус 1,259,197 1.3 Mb 1120 До 2013 года — самый длинный из известных вирусных геномов.[29]
Вирус Pandoravirus salinus 2,470,000 2.47 Mb Самый длинный из известных вирусных геномов.[30]
Бактерия Nasuia deltocephalinicola (штамм NAS-ALF) 112,091 112 kb 137 Наименьший известный невирусный геном. Расшифрован в 2013 году.[31]
Бактерия Carsonella ruddii 159,662 160 kb
Бактерия Buchnera aphidicola 600,000 600 kb [32]
Бактерия Wigglesworthia glossinidia 700,000 700 kb
Бактерия Haemophilus influenzae Гемофильная палочка 1,830,000 1.8 Mb Первый расшифрованный геном живого организма, июль 1995[33] Возбудитель гемофильной инфекции.
Бактерия Escherichia coli 4,600,000 4.6 Mb 4288 Наиболее хорошо изученная бактерия — E.Coli.[34] Широко используется в синтетической биологии. Часто применяется совместно с BioBrick.
Бактерия Solibacter usitatus (штамм Ellin 6076) 9,970,000 10 Mb [35]
Бактерия — цианобактерия Prochlorococcus spp. (1.7 Mb) 1,700,000 1.7 Mb 1884 Наименьший из известных геномов цианобактерий (способных к фотосинтезу). Один из морских видов цианобактерий.[36][37]
Бактерия — цианобактерия Nostoc punctiforme 9,000,000 9 Mb 7432 Многоклеточная цианобактерия[38]
Амёба Polychaos dubium 670,000,000,000 670 Gb   Возможно наибольший из известных геномов.[39] Оспаривается в 2010 году.[40]
Органелла эукариот Митохондрия человека 16,569 16.6 kb [41]
Растение Genlisea tuberosa, плотоядное цветное растение 61,000,000 61 Mb Наименьший известный на 2014 год геном цветочного растения.[42]
Растение Arabidopsis thaliana 135,000,000[43] 135 Mb 27,655[44] Первый расшифрованный геном растения, декабрь 2000.[45]
Растение Populus trichocarpa 480,000,000 480 Mb 73013 Первый расшифрованный геном дерева, сентябрь 2006[46]
Растение Fritillaria assyrica 130,000,000,000 130 Gb
Растение Paris japonica 150,000,000,000 150 Gb Наибольший из известных геном растения[47]
Растение — мох Physcomitrella patens 480,000,000 480 Mb Первый из расшифрованных геномов мохообразных, январь 2008.[48]
Гриб — дрожжи Saccharomyces cerevisiae 12,100,000 12.1 Mb 6294 Первый из расшифрованных геномов эукариот, 1996[49]
Гриб Aspergillus nidulans 30,000,000 30 Mb 9541 [50]
Нематода Pratylenchus coffeae 20,000,000 20 Mb [51]. Самый маленький из известных геном животного.[52]
Нематода Caenorhabditis elegans (C.elegans) 100,300,000 100 Mb 19000 Первый из расшифрованных геномов многоклеточного организма, декабрь 1998[53]
Насекомое Drosophila melanogaster (фруктовая мушка) 175,000,000 175 Mb 13600 Размер зависит от штамма (175-180Mb; стандартный y w штамм 175Mb)[54]
Насекомое Apis mellifera (медовая пчела) 236,000,000 236 Mb 10157 [55])
Насекомое Bombyx mori Тутовый шелкопряд 432,000,000 432 Mb 14623 [56]
Насекомое Solenopsis invicta (огненный муравей) 480,000,000 480 Mb 16569 [57]
Млекопитающее Mus musculus (Домо́вая мышь) 2,700,000,000 2.7 Gb 20210 [58]
Млекопитающее Homo sapiens (человек) 3,289,000,000 3.3 Gb 20000-30000 Большая часть расшифрована одновременно Проектом Генома Человека и Celera Genomics Крейга Вентера в 2000 году. Окончательной датой расшифровки считают 2003 год.[59][60]
Млекопитающее Pan paniscus (Бонобо́ или Карликовый шимпанзе) 3,286,640,000 3.3 Gb 20000 [61]
Рыба Tetraodon nigroviridis 385,000,000 390 Mb Наименьший из известных геномов позвоночных 340 Mb[62][63] — 385 Mb.[64]
Рыба Protopterus aethiopicus 130,000,000,000 130 Gb Наибольший из известных геномов позвоночных
  1. 1 2 Talking glossary of genetic terms: genome (англ.). National Human Genome Research Institute. Дата обращения 1 ноября 2012. Архивировано 4 ноября 2012 года.
  2. 1 2 Браун Т. А. Геномы = Genomes / /Пер. с англ. — М.-Ижевск: Институт компьютерных исследований, 2011. — 944 с. — ISBN 978-5-4344-0002-2.
  3. ↑ A Dictionary of genetics (англ.) / R.C.King, W.D.Stansfield, P.K.Mulligan. — 7th. — Oxford University Press, 2006. — ISBN 13978-0-19-530762-7.
  4. ↑ Генетика: энциклопедический словарь / Картель Н. А., Макеева Е. Н., Мезенко А. М.. — Минск: Тэхналогія, 1999. — 448 с.
  5. ↑ Альбертс и др., 2013, с. 44.
  6. ↑ Oxford dictionaries: genome (англ.). OED. Дата обращения 13 ноября 2012. Архивировано 19 ноября 2012 года.
  7. Joshua Lederberg and Alexa T. McCray. 'Ome Sweet 'Omics -- A Genealogical Treasury of Words (англ.) // The Scientist (англ.)русск. : journal. — 2001. — Vol. 15, no. 7. Архивировано 29 сентября 2006 года. Архивная копия от 29 сентября 2006 на Wayback Machine
  8. Голубовский М. Д. Век генетики: эволюция идей и понятий. Научно-исторические очерки. — СПб.: Борей Арт, 2000. — 262 с. — ISBN 5-7187-0304-3.
  9. Патрушев Л. И. Экспрессия генов / Ю. А. Берлин. — М.: Наука, 2000. — 526 с. — ISBN 5-02-001890-2.
  10. Abecasis G. R., Auton A., Brooks L. D., et al. An integrated map of genetic variation from 1,092 human genomes (англ.) // Nature : journal. — 2012. — November (vol. 491, no. 7422). — P. 56—65. — doi:10.1038/nature11632. — PMID 23128226.
  11. ↑ Стартовал международный проект расшифровки геномов 1000 человек (неопр.). Membrana (24 января 2008). Дата обращения 13 ноября 2012.
  12. ↑ Кунин, 2014, с. 69.
  13. ↑ Кунин, 2014, с. 72.
  14. 1 2 Koonin E. V. Evolution of Genome Architecture (англ.) // Int J Biochem Cell Biol. Feb 2009; 41(2): 298–306.. — 2009. — Vol. 41, no. 2. — P. 298—306. — doi:10.1016/j.biocel.2008.09.015.
  15. Fraser CM, Casjens S, Huang WM, et al. Genomic sequence of a Lyme disease spirochaete, Borrelia burgdorferi (англ.) // Nature. — 1997. — Vol. 390, no. 6660. — P. 580—586.
  16. ↑ Альбертс и др., 2013, с. 26.
  17. Koonin E. V., Wolf Y. I. Genomics of bacteria and archaea: the emerging dynamic view of the prokaryotic world (англ.) // Nucleic acids research. — 2008. — Vol. 36, no. 21. — P. 6688-6719.
  18. ↑ Альбертс и др., 2013, с. 27.
  19. ↑ Кунин, 2014, с. 134.
  20. Liang T. J. Hepatitis B: the virus and disease (англ.) // Hepatology (англ.)русск.. — Wiley-Liss, 2009. — Vol. 49, no. S5. — doi:10.1002/hep.22881.
  21. Mankertz P. Molecular Biology of Porcine Circoviruses // Animal Viruses: Molecular Biology (неопр.). — Caister Academic Press (англ.)русск., 2008. — ISBN 978-1-904455-22-6.
  22. Fiers W; Contreras, R.; Duerinck, F.; Haegeman, G.; Iserentant, D.; Merregaert, J.; Min Jou, W.; Molemans, F.; Raeymaekers, A.; Van Den Berghe, A.; Volckaert, G.; Ysebaert, M. Complete nucleotide-sequence of bacteriophage MS2-RNA – primary and secondary structure of replicase gene (англ.) // Nature : journal. — 1976. — Vol. 260, no. 5551. — P. 500—507. — doi:10.1038/260500a0. — Bibcode: 1976Natur.260..500F. — PMID 1264203.
  23. Fiers, W.; Contreras, R.; Haegeman, G.; Rogiers, R.; Van De Voorde, A.; Van Heuverswyn, H.; Van Herreweghe, J.; Volckaert, G.; Ysebaert, M. Complete nucleotide sequence of SV40 DNA (англ.) // Nature. — 1978. — Vol. 273, no. 5658. — P. 113—120. — doi:10.1038/273113a0. — Bibcode: 1978Natur.273..113F. — PMID 205802.
  24. Le Page, Michael. Does SV40 contamination matter?, New Scientist (10 июня 2004). Дата обращения 29 марта 2010. «More than 40 years after SV40 was first discovered, in polio vaccine, these crucial questions remain fiercely controversial».
  25. Sanger, F.; Air, G.M.; Barrell, B.G.; Brown, N.L.; Coulson, A.R.; Fiddes, J.C.; Hutchison, C.A.; Slocombe, P. M.; Smith, M. Nucleotide sequence of bacteriophage phi X174 DNA (англ.) // Nature. — 1977. — Vol. 265, no. 5596. — P. 687—695. — doi:10.1038/265687a0. — Bibcode: 1977Natur.265..687S. — PMID 870828.
  26. Thomason; Lynn; Court, Donald L.; Bubunenko, Mikail; Costantino, Nina; Wilson, Helen; Datta, Simanti; Oppenheim, Amos. Recombineering: genetic engineering in bacteria using homologous recombination (англ.) // Current Protocols in Molecular Biology : journal. — 2007. — Vol. Chapter 1. — P. Unit 1.16. — ISBN 0471142727. — doi:10.1002/0471142727.mb0116s78. — PMID 18265390.
  27. Court; D. L.; Oppenheim, A. B.; Adhya, S. L. A new look at bacteriophage lambda genetic networks (англ.) // American Society for Microbiology (англ.)русск. : journal. — 2007. — Vol. 189, no. 2. — P. 298—304. — doi:10.1128/JB.01215-06. — PMID 17085553.
  28. Sanger; F.; Coulson, A.R.; Hong, G.F.; Hill, D.F.; Petersen, G.B. Nucleotide sequence of bacteriophage lambda DNA (англ.) // Journal of Molecular Biology (англ.)русск. : journal. — 1982. — Vol. 162, no. 4. — P. 729—773. — doi:10.1016/0022-2836(82)90546-0. — PMID 6221115.
  29. Legendre, M; Arslan, D; Abergel, C; Claverie, J. M. Genomics of Megavirus and the elusive fourth domain of life| journal (англ.) // Communicative & Integrative Biology : journal. — 2012. — Vol. 5, no. 1. — P. 102—106. — doi:10.4161/cib.18624. — PMID 22482024.
  30. Philippe, N.; Legendre, M.; Doutre, G.; Coute, Y.; Poirot, O.; Lescot, M.; Arslan, D.; Seltzer, V.; Bertaux, L.; Bruley, C.; Garin, J.; Claverie, J.-M.; Abergel, C. Pandoraviruses: Amoeba Viruses with Genomes Up to 2.5 Mb Reaching That of Parasitic Eukaryotes (англ.) // Science : journal. — 2013. — Vol. 341, no. 6143. — P. 281—286. — doi:10.1126/science.1239181. — Bibcode: 2013Sci...341..281P. — PMID 23869018.
  31. Bennett, G. M.; Moran, N. A. Small, Smaller, Smallest: The Origins and Evolution of Ancient Dual Symbioses in a Phloem-Feeding Insect (англ.) // Genome Biology and Evolution (англ.)русск. : journal. — 2013. — 5 August (vol. 5, no. 9). — P. 1675—1688. — doi:10.1093/gbe/evt118. — PMID 23918810.
  32. Shigenobu, S; Watanabe, H; Hattori, M; Sakaki, Y; Ishikawa, H. Genome sequence of the endocellular bacterial symbiont of aphids Buchnera sp. APS (англ.) // Nature : journal. — 2000. — 7 September (vol. 407, no. 6800). — P. 81—6. — doi:10.1038/35024074. — PMID 10993077.
  33. Fleischmann R; Adams M; White O; Clayton R; Kirkness E; Kerlavage A; Bult C; Tomb J; Dougherty B; Merrick J; McKenney; Sutton; Fitzhugh; Fields; Gocyne; Scott; Shirley; Liu; Glodek; Kelley; Weidman; Phillips; Spriggs; Hedblom; Cotton; Utterback; Hanna; Nguyen; Saudek; Brandon. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd (англ.) // Science : journal. — 1995. — Vol. 269, no. 5223. — P. 496—512. — doi:10.1126/science.7542800. — Bibcode: 1995Sci...269..496F. — PMID 7542800.
  34. Frederick R. Blattner; Guy Plunkett III et al. The Complete Genome Sequence of Escherichia coli K-12 (англ.) // Science : journal. — 1997. — Vol. 277, no. 5331. — P. 1453—1462. — doi:10.1126/science.277.5331.1453. — PMID 9278503.
  35. Challacombe, Jean F.; Eichorst, Stephanie A.; Hauser, Loren; Land, Miriam; Xie, Gary; Kuske, Cheryl R.; Steinke, Dirk. Biological Consequences of Ancient Gene Acquisition and Duplication in the Large Genome of Candidatus Solibacter usitatus Ellin6076 (англ.) // PLoS ONE : journal / Steinke, Dirk. — 2011. — 15 September (vol. 6, no. 9). — P. e24882. — doi:10.1371/journal.pone.0024882. — Bibcode: 2011PLoSO...624882C. — PMID 21949776.
  36. Rocap, G.; Larimer, F. W.; Lamerdin, J.; Malfatti, S.; Chain, P.; Ahlgren, N. A.; Arellano, A.; Coleman, M.; Hauser, L.; Hess, W. R.; Johnson, Z. I.; Land, M.; Lindell, D.; Post, A. F.; Regala, W.; Shah, M.; Shaw, S. L.; Steglich, C.; Sullivan, M. B.; Ting, C. S.; Tolonen, A.; Webb, E. A.; Zinser, E. R.; Chisholm, S. W. Genome divergence in two Prochlorococcus ecotypes reflects oceanic niche differentiation (англ.) // Nature : journal. — 2003. — Vol. 424, no. 6952. — P. 1042—1047. — doi:10.1038/nature01947. — Bibcode: 2003Natur.424.1042R. — PMID 12917642.
  37. Dufresne, A.; Salanoubat, M.; Partensky, F.; Artiguenave, F.; Axmann, I. M.; Barbe, V.; Duprat, S.; Galperin, M. Y.; Koonin, E. V.; Le Gall, F.; Makarova, K. S.; Ostrowski, M.; Oztas, S.; Robert, C.; Rogozin, I. B.; Scanlan, D. J.; De Marsac, N. T.; Weissenbach, J.; Wincker, P.; Wolf, Y. I.; Hess, W. R. Genome sequence of the cyanobacterium Prochlorococcus marinus SS120, a nearly minimal oxyphototrophic genome (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2003. — Vol. 100, no. 17. — P. 10020—10025. — doi:10.1073/pnas.1733211100. — Bibcode: 2003PNAS..10010020D. — PMID 12917486.
  38. J. C.; Meeks; Elhai, J; Thiel, T; Potts, M; Larimer, F; Lamerdin, J; Predki, P; Atlas, R. An overview of the genome of Nostoc punctiforme, a multicellular, symbiotic cyanobacterium (англ.) // Drugs (англ.)русск. : journal. — Adis International, 2001. — Vol. 70, no. 1. — P. 85—106. — doi:10.1023/A:1013840025518. — PMID 16228364.
  39. Parfrey LW; Lahr DJG; Katz L. A. The Dynamic Nature of Eukaryotic Genomes (англ.) // Molecular Biology and Evolution (англ.)русск. : journal. — Oxford University Press, 2008. — Vol. 25, no. 4. — P. 787—794. — doi:10.1093/molbev/msn032. — PMID 18258610.
  40. ↑ ScienceShot: Biggest Genome Ever Архивировано 11 октября 2010 года., comments: «The measurement for Amoeba dubia and other protozoa which have been reported to have very large genomes were made in the 1960s using a rough biochemical approach which is now considered to be an unreliable method for accurate genome size determinations.»
  41. Anderson, S.; Bankier, A. T.; Barrell, B. G.; de Bruijn, M. H. L.; Coulson, A. R.; Drouin, J.; Eperon, I. C.; Nierlich, D. P.; Roe, B. A.; Sanger, F.; Schreier, P. H.; Smith, A. J. H.; Staden, R.; Young, I. G. Sequence and organization of the human mitochondrial genome (англ.) // Nature : journal. — 1981. — Vol. 290, no. 5806. — P. 457—465. — doi:10.1038/290457a0. — Bibcode: 1981Natur.290..457A. — PMID 7219534.
  42. Fleischmann A; Michael TP; Rivadavia F; Sousa A; Wang W; Temsch EM; Greilhuber J; Müller KF; Heubl G. Evolution of genome size and chromosome number in the carnivorous plant genus Genlisea (Lentibulariaceae), with a new estimate of the minimum genome size in angiosperms (англ.) // Annals of Botany : journal. — 2014. — Vol. 114, no. 8. — P. 1651—1663. — doi:10.1093/aob/mcu189. — PMID 25274549.
  43. ↑ TAIR — Genome Assembly
  44. ↑ Details — Arabidopsis thaliana — Ensembl Genomes 41
  45. Greilhuber J; Borsch T; Müller K; Worberg A; Porembski S; Barthlott W. Smallest angiosperm genomes found in Lentibulariaceae, with chromosomes of bacterial size (англ.) // Plant Biology : journal. — 2006. — Vol. 8, no. 6. — P. 770—777. — doi:10.1055/s-2006-924101. — PMID 17203433.
  46. Tuskan G. A., Difazio S., Jansson S., Bohlmann J., Grigoriev I., Hellsten U., Putnam N., Ralph S., Rombauts S., Salamov A., Schein J., Sterck L., Aerts A., Bhalerao R. R., Bhalerao R. P., Blaudez D., Boerjan W., Brun A., Brunner A., Busov V., Campbell M., Carlson J., Chalot M., Chapman J., Chen G. L., Cooper D., Coutinho P. M., Couturier J., Covert S., Cronk Q., Cunningham R., Davis J., Degroeve S., Déjardin A., Depamphilis C., Detter J., Dirks B., Dubchak I., Duplessis S., Ehlting J., Ellis B., Gendler K., Goodstein D., Gribskov M., Grimwood J., Groover A., Gunter L., Hamberger B., Heinze B., Helariutta Y., Henrissat B., Holligan D., Holt R., Huang W., Islam-Faridi N., Jones S., Jones-Rhoades M., Jorgensen R., Joshi C., Kangasjärvi J., Karlsson J., Kelleher C., Kirkpatrick R., Kirst M., Kohler A., Kalluri U., Larimer F., Leebens-Mack J., Leplé J. C., Locascio P., Lou Y., Lucas S., Martin F., Montanini B., Napoli C., Nelson D. R., Nelson C., Nieminen K., Nilsson O., Pereda V., Peter G., Philippe R., Pilate G., Poliakov A., Razumovskaya J., Richardson P., Rinaldi C., Ritland K., Rouzé P., Ryaboy D., Schmutz J., Schrader J., Segerman B., Shin H., Siddiqui A., Sterky F., Terry A., Tsai C. J., Uberbacher E., Unneberg P., Vahala J., Wall K., Wessler S., Yang G., Yin T., Douglas C., Marra M., Sandberg G., Van de Peer Y., Rokhsar D. The genome of black cottonwood, Populus trichocarpa (Torr. & Gray) (англ.) // Science : journal. — 2006. — 15 September (vol. 313, no. 5793). — P. 1596—1604. — doi:10.1126/science.1128691. — Bibcode: 2006Sci...313.1596T. — PMID 16973872.
  47. PELLICER, JAUME; FAY, MICHAEL F.; LEITCH, ILIA J. The largest eukaryotic genome of them all? (англ.) // Botanical Journal of the Linnean Society : journal. — 2010. — 15 September (vol. 164, no. 1). — P. 10—15. — doi:10.1111/j.1095-8339.2010.01072.x.
  48. Lang D; Zimmer AD; Rensing SA; Reski R. Exploring plant biodiversity: the Physcomitrella genome and beyond (англ.) // Trends Plant Sci (англ.)русск. : journal. — 2008. — October (vol. 13, no. 10). — P. 542—549. — doi:10.1016/j.tplants.2008.07.002. — PMID 18762443.
  49. ↑ Saccharomyces Genome Database (неопр.). Yeastgenome.org. Дата обращения 27 января 2011.
  50. Galagan J. E., Calvo S. E., Cuomo C., Ma L. J., Wortman J. R., Batzoglou S., Lee S. I., Baştürkmen M., Spevak C. C., Clutterbuck J., Kapitonov V., Jurka J., Scazzocchio C., Farman M., Butler J., Purcell S., Harris S., Braus G. H., Draht O., Busch S., D'Enfert C., Bouchier C., Goldman G. H., Bell-Pedersen D., Griffiths-Jones S., Doonan J. H., Yu J., Vienken K., Pain A., Freitag M., Selker E. U., Archer D. B., Peñalva M. A., Oakley B. R., Momany M., Tanaka T., Kumagai T., Asai K., Machida M., Nierman W. C., Denning D. W., Caddick M., Hynes M., Paoletti M., Fischer R., Miller B., Dyer P., Sachs M. S., Osmani S. A., Birren B. W. Sequencing of Aspergillus nidulans and comparative analysis with A. fumigatus and A. oryzae (англ.) // Nature : journal. — 2005. — Vol. 438, no. 7071. — P. 1105—1115. — doi:10.1038/nature04341. — Bibcode: 2005Natur.438.1105G. — PMID 16372000.
  51. Leroy, S.; Bouamer, S.; Morand, S.; Fargette, M. Genome size of plant-parasitic nematodes (англ.) // Nematology (англ.)русск.. — Brill Publishers (англ.)русск., 2007. — Vol. 9. — P. 449—450. — doi:10.1163/156854107781352089.
  52. Gregory TR. Animal Genome Size Database (неопр.). Gregory, T.R. (2016). Animal Genome Size Database. (2005).
  53. The C. elegans Sequencing Consortium. Genome sequence of the nematode C. elegans: a platform for investigating biology (англ.) // Science : journal. — 1998. — Vol. 282, no. 5396. — P. 2012—2018. — doi:10.1126/science.282.5396.2012. — PMID 9851916.
  54. Ellis LL; Huang W; Quinn A. M. Intrapopulation Genome Size Variation in "Drosophila melanogaster" Reflects Life History Variation and Plasticity (англ.) // PLoS Genetics (англ.)русск. : journal. — 2014. — Vol. 10, no. 7. — P. e1004522. — doi:10.1371/journal.pgen.1004522. — PMID 25057905.
  55. Honeybee Genome Sequencing Consortium; Weinstock; Robinson; Gibbs; Weinstock; Weinstock; Robinson; Worley; Evans; Maleszka; Robertson; Weaver; Beye; Bork; Elsik; Evans; Hartfelder; Hunt; Robertson; Robinson; Maleszka; Weinstock; Worley; Zdobnov; Hartfelder; Amdam; Bitondi; Collins; Cristino; Evans. Insights into social insects from the genome of the honeybee Apis mellifera (англ.) // Nature : journal. — 2006. — October (vol. 443, no. 7114). — P. 931—949. — doi:10.1038/nature05260. — Bibcode: 2006Natur.443..931T. — PMID 17073008.
  56. The International Silkworm Genome. The genome of a lepidopteran model insect, the silkworm Bombyx mori (англ.) // Insect Biochemistry and Molecular Biology : journal. — 2008. — Vol. 38, no. 12. — P. 1036—1045. — doi:10.1016/j.ibmb.2008.11.004. — PMID 19121390.
  57. Wurm Y; Wang, J.; Riba-Grognuz, O.; Corona, M.; Nygaard, S.; Hunt, B. G.; Ingram, K. K.; Falquet, L.; Nipitwattanaphon, M.; Gotzek, D.; Dijkstra, M. B.; Oettler, J.; Comtesse, F.; Shih, C.-J.; Wu, W.-J.; Yang, C.-C.; Thomas, J.; Beaudoing, E.; Pradervand, S.; Flegel, V.; Cook, E. D.; Fabbretti, R.; Stockinger, H.; Long, L.; Farmerie, W. G.; Oakey, J.; Boomsma, J. J.; Pamilo, P.; Yi, S. V.; Heinze, J. The genome of the fire ant Solenopsis invicta (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2011. — Vol. 108, no. 14. — P. 5679—5684. — doi:10.1073/pnas.1009690108. — Bibcode: 2011PNAS..108.5679W. — PMID 21282665.
  58. Church, DM; Goodstadt, L; Hillier, LW; Zody, MC; Goldstein, S; She, X; Bult, CJ; Agarwala, R; Cherry, JL; DiCuccio, M; Hlavina, W; Kapustin, Y; Meric, P; Maglott, D; Birtle, Z; Marques, AC; Graves, T; Zhou, S; Teague, B; Potamousis, K; Churas, C; Place, M; Herschleb, J; Runnheim, R; Forrest, D; Amos-Landgraf, J; Schwartz, DC; Cheng, Z; Lindblad-Toh, K; Eichler, EE; Ponting, CP; Mouse Genome Sequencing, Consortium. Lineage-specific biology revealed by a finished genome assembly of the mouse (англ.) // PLoS Biology : journal / Roberts, Richard J.. — 2009. — 5 May (vol. 7, no. 5). — P. e1000112. — doi:10.1371/journal.pbio.1000112. — PMID 19468303.
  59. ↑ Human Genome Project Information Site Has Been Updated (неопр.) (недоступная ссылка). Ornl.gov (23 июля 2013). Дата обращения 6 февраля 2014. Архивировано 20 сентября 2008 года.
  60. Venter, J. C. (англ.)русск.; Adams, M.; Myers, E.; Li, P.; Mural, R.; Sutton, G.; Smith, H.; Yandell, M.; Evans, C.; Holt, R. A.; Gocayne, J. D.; Amanatides, P.; Ballew, R. M.; Huson, D. H.; Wortman, J. R.; Zhang, Q.; Kodira, C. D.; Zheng, X. H.; Chen, L.; Skupski, M.; Subramanian, G.; Thomas, P. D.; Zhang, J.; Gabor Miklos, G. L.; Nelson, C.; Broder, S.; Clark, A. G.; Nadeau, J.; McKusick, V. A.; Zinder, N. The Sequence of the Human Genome (англ.) // Science. — 2001. — Vol. 291, no. 5507. — P. 1304—1351. — doi:10.1126/science.1058040. — Bibcode: 2001Sci...291.1304V. — PMID 11181995.
  61. ↑ Pan paniscus (pygmy chimpanzee) (неопр.). nih.gov. Дата обращения 30 июня 2016.
  62. Crollius, HR; Jaillon, O; Dasilva, C; Ozouf-Costaz, C; Fizames, C; Fischer, C; Bouneau, L; Billault, A; Quetier, F; Saurin, W; Bernot, A; Weissenbach, J. Characterization and Repeat Analysis of the Compact Genome of the Freshwater Pufferfish Tetraodon nigroviridis (англ.) // Genome Research (англ.)русск. : journal. — 2000. — Vol. 10, no. 7. — P. 939—949. — doi:10.1101/gr.10.7.939. — PMID 10899143.
  63. Olivier Jaillon et al. Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype (англ.) // Nature : journal. — 2004. — 21 October (vol. 431, no. 7011). — P. 946—957. — doi:10.1038/nature03025. — Bibcode: 2004Natur.431..946J. — PMID 15496914.
  64. ↑ Tetraodon Project Information (неопр.). Дата обращения 17 октября 2012. Архивировано 26 сентября 2012 года.
  • Сингер М., Берг П. Гены и геномы. — Москва, 1998.
  • Молекулярная биология клетки: в 3-х томах / Б. Альбертс, А. Джонсон, Д. Льюис и др. — М.-Ижевск: НИЦ «Регулярная и хаотическая динамика», Институт компьютерных исследований, 2013. — Т. I. — С. 1—68. — 808 с. — ISBN 978-5-4344-0112-8.
  • Кунин Е. В. Логика случая. О природе и происхождении биологической эволюции/Пер. с англ = The Logics of Chance. The Nature and Origin of Biological Evolution. — М: ЗАО Издательство Центрполиграф, 2014. — 527 с. — ISBN 978-5-227-04982-7.

Ген — Википедия

В другом языковом разделе есть более полная статья Gene (англ.).

Ген (др.-греч. γένος — род) — в классической генетике — наследственный фактор, который несёт информацию об определённом признаке или функции организма, и который является структурной и функциональной единицей наследственности. В таком качестве термин «ген» был введён в 1909 году датским ботаником, физиологом растений и генетиком Вильгельмом Йоханнсеном[1].

После открытия нуклеиновых кислот в качестве носителя наследственной информации определение гена изменилось, и ген стали определять как участок ДНК (у некоторых вирусов — участок РНК), задающий последовательность полипептида либо функциональной РНК[2].

По мере накопления сведений о строении и работе генов определение понятия «ген» продолжало изменяться, однако в настоящее время не существует универсального определения гена, которое удовлетворило бы всех исследователей[3][4][4][5]. Одно из современных определений гена звучит следующим образом: ген представляет собой последовательность ДНК, составляющие сегменты которой не обязательно должны быть физически смежными. Эта последовательность ДНК содержит информацию об одном или нескольких продуктах в виде белка или РНК. Продукты гена функционируют в составе генетических регуляторных сетей, результат работы которых реализуется на уровне фенотипа[6].

Совокупность генов организма составляют генотип. Генотип наряду с факторами окружающей среды и развитием определяют, каким будет фенотип. Передача генов потомству является основой наследования фенотипических признаков. Большинство биологических признаков являются полигенными, то есть находятся под влиянием многих генов. Гены могут изменяться в результате мутаций, изменяющих последовательность ДНК. Вследствие мутаций в популяции гены существуют в различных вариантах, называемых аллелями. Разные аллели гена могут кодировать различающиеся версии белка, что может проявляться фенотипически. Гены наряду с участками ДНК, не содержащими генов, входят в состав генома, представляющего собой весь наследственный материал организма.

Обнаружение генов как дискретных носителей наследственности[править | править код]

Грегор Мендель

Экспериментальные доказательства наличия дискретных факторов наследственности впервые были представлены в 1865 году Грегором Менделем в докладе на заседании Общества естествоиспытателей в Брно. В 1866 году доклад был опубликован в печатном виде[7]. Грегор Мендель изучал наследование признаков у гороха, количественно отслеживая частоту признаков у родительских растений и у потомства. В скрещиваниях растений с различными признаками он проанализировал более 8000 растений. В этих экспериментах Мендель продемонстрировал независимое наследование признаков, различие между доминантными и рецессивными признаками, различие между гетерозиготами и гомозиготами, а также явление прерывистого наследования. Результаты своих экспериментов он описал математически и интерпретировал их, предположив, что существуют дискретные, несмешиваемые в потомстве, факторы наследственности.

До работы Менделя доминирующей концепцией в объяснении закономерностей наследования была концепция, которая предполагала, что признаки родителей у потомков смешиваются аналогично смешиванию жидкостей. Этой концепции следует теория пангенезиса, разработанная Чарльзом Дарвином в 1868 году, два года спустя после публикации результатов Менделя[8]. В этой теории Дарвин предположил существование очень мелких частиц, названных им «геммулами», которые смешиваются во время зачатия.

Статья Менделя осталась практически незамеченной после её публикации в 1866 году, но она получила второе «рождение» в конце 19-го века, благодаря Хуго де Фризу, Карлу Корренсу и Эриху фон Чермаку, которые пришли к аналогичным выводам в своих собственных исследованиях[9]. В частности, в 1889 году Хуго де Фриз опубликовал свою книгу «Intracellular Pangenesis»[10], в которой он постулировал, что разные признаки имеют собственные наследственные носители, и что наследование специфических черт у организмов происходит при помощи частиц. Де Фрис назвал эти единицы «пангенами» (Pangens на немецком языке), использовав часть названия теории пангенеза Дарвина.

В 1909 году Вильгельм Йоханнсен ввел термин «ген»[1], а Уильям Бейтсон — термин «генетика»[11], в то время как Эдуард Страсбургер все ещё использовал термин «панген» для обозначения основной физической и функциональной единицы наследственности[12].

Открытие ДНК в качестве носителя генетической информации[править | править код]

Эксперименты, проведённые в 40-е годы американскими бактериологами из Рокфеллеровского института под руководством О. Эвери, показали, что молекулярным хранилищем генетической информации является ДНК. В работах по генетической трансформации пневмококков было показано, что передача признаков от одних бактерий к другим происходит при помощи только одного вещества — ДНК. Ни белок, ни другие химические компоненты клетки этим свойством не обладали [13][14][15]. В 1953 году при помощи рентгеновской кристаллографии Розалинд Франклин и Морис Уилкинс получили высококачественные снимки структуры ДНК. Эти снимки помогли Джеймсу Д. Уотсону и Фрэнсису Крику создать модель молекулы двуцепочечной спирали ДНК и сформулировать гипотезу механизма генетической репликации[16][17].

В начале 1950-х годов преобладало мнение, что гены в хромосоме действуют как отдельные объекты, неразделимые путем рекомбинации и расположенные как бусы на веревочке. Эксперименты Сеймура Бензера с использованием мутантов, дефектных бактериофагов в области rII T4[en] (1955—1959), показали, что отдельные гены имеют простую линейную структуру и, вероятно, эквивалентны линейному сечению ДНК[18][19].

В совокупности этот объём исследований установил центральную догму молекулярной биологии, которая утверждает, что белки транслируются с РНК, которая транскрибируется с ДНК. Эта догма с тех пор, как было показано, имеет исключения, такие как обратная транскрипция в ретровирусах. Современное исследование генетики на уровне ДНК известно как молекулярная генетика.

В 1972 году Уолтер Файерс и его команда первыми определили последовательность гена: последовательность белка оболочки Bacteriophage MS2 (англ.)русск.[20]. Последующее развитие секвенирования ДНК с Методом Сэнгера в 1977 году Фредериком Сангером улучшило эффективность секвенирования и превратило его в рутинный лабораторный инструмент[21]. Автоматизированная версия метода Сангера использовалась на ранних этапах проекта «Геном человека»[22].

Современный синтез и его преемники[править | править код]

Теории, разработанные в начале 20-го века для интеграции менделевской генетики с дарвиновской эволюцией, называются современным синтезом, термином, введенным Джулианом Хаксли[23].

Эволюционные биологи впоследствии модифицировали эту концепцию, такую как геноцентричный взгляд[en] Джорджа Уильямса на эволюцию. Он предложил эволюционную концепцию гена как единицы естественного отбора с определением: «то, что разделяет и рекомбинирует с заметной частотой»[24]:24. С этой точки зрения, молекулярный ген транскрибируется как единое целое, а эволюционный ген наследуется как единое целое. Связанные идеи, подчеркивающие центральную роль генов в эволюции, были популяризированы Ричардом Докинзом[25][26].

ДНК[править | править код]

Генетическая информация у подавляющего большинства организмов закодирована в длинных молекулах ДНК. ДНК состоит из двух спирально закрученных полимерных цепей, мономерами которых служат четыре нуклеотида: аденозин, цитидин, гуанозин и тимидин. Нуклеотиды в ДНК состоят из пятиуглеродного сахара (2-дезоксирибозы), фосфатной группы и одного из четырёх азотистых оснований: аденина, цитозина, гуанина и тимина[27]:2.1. Азотистое основание связано гликозидной связью с пятиуглеродным (пентозного) сахаром в 1'-положении. Остовом цепей ДНК служит чередующаяся последовательность пентозных сахаров и фосфатов, фосфатные группы присоединяются к сахару в 5'- и 3'-положениях. Номера позиций пентозного кольца отмечены штрихом для того, чтобы различать нумерацию колец в сахаре и азотистом основании[28].

Из-за химического состава пентозных остатков цепи ДНК имеют направленность. Один конец полимера ДНК содержит открытую гидроксильную группу на дезоксирибозе в 3'-положении; этот конец называется 3'-конец. Другой конец содержит открытую фосфатную группу, это 5'-конец. Две цепи (нити) двойной спирали ДНК ориентированы в противоположных направлениях. Синтез ДНК, в том числе при репликации ДНК, происходит в направлении 5 '→ 3', потому что новые нуклеотиды добавляются посредством реакции дегидратации, которая использует открытый 3’-гидроксил в качестве нуклеофила[29]:27.2.

Экспрессия генов, закодированных в ДНК, начинается с транскрипции нуклеотидной последовательности ДНК в последовательность нуклеотидов другого типа нуклеиновых кислот — РНК. РНК очень похожа на ДНК, но её мономеры содержат рибозу, а не дезоксирибозу. Кроме того, вместо тимина в РНК используется урацил. Молекулы РНК являются одноцепочечными и менее стабильны, чем ДНК. Гены белков содержат кодирующую последовательность, состоящую из серии тринуклеотидных блоков — триплетов, которые соответствуют аминокислотам. Правило, по которому определяется, какому триплету соответствует какая аминокислота, называется генетическим кодом. Считывание генетического кода происходит в рибосоме во время трансляции РНК в белок. Генетический код почти одинаков для всех известных организмов[27]:4.1.

Хромосома[править | править код]

Изображение нормального женского кариотипа, полученного при помощи флуоресцентной микроскопии и метода FISH. ДНК окрашена в красный цвет, а участки хромосом, обогащённые по числу локализованных в них генов, окрашены в зелёный цвет. Самые большие хромосомы примерно в 10 раз больше самых маленьких[30].

Наследственный материал организма, или геном, хранится в одной или нескольких хромосомах, число которых специфично для вида. Хромосома состоит из одной очень длинной молекулы ДНК, которая может содержать тысячи генов[27]:4.2. Область хромосомы, где находится ген, называется локусом. Каждый локус содержит определённый аллель гена. Представители популяции могут отличаться по аллелям гена, находящимся в одинаковых локусах хромосом.

Большинство эукариотических генов хранятся в нескольких линейных хромосомах. Хромосомы упакованы в ядре в комплексе с белками хроматина. Наиболее многочисленными белками хроматина являются гистоны, которые формируют белковую глобулу, называемую нуклеосомой. ДНК обвивается вокруг нуклеосом, что представляет собой первый уровень упаковки ДНК в хромосоме[27]:4.2. Распределение нуклеосом вдоль ДНК, а также химические модификации самих гистонов регулируют доступность ДНК для регуляторных факторов, участвующих в транскрипции, репликации, репарации. Помимо генов эукариотические хромосомы содержат также служебные последовательности, обеспечивающие стабильность и воспроизведение хромосом, а также их распределение между дочерними клетками в митозе. Это теломеры, сайты инициации репликации и центромера, соответственно[27]:4.2.

Трудно точно определить, в какую часть последовательности ДНК входит ген[5].

В настоящее время в молекулярной биологии установлено, что гены — это участки ДНК, несущие какую-либо целостную информацию — о строении одной молекулы белка или одной молекулы РНК. Эти и другие функциональные молекулы определяют развитие, рост и функционирование организма.

В то же время каждый ген характеризуется рядом специфических регуляторных последовательностей ДНК (англ.)русск., таких как промоторы, которые принимают непосредственное участие в регулировании проявления гена. Регуляторные последовательности могут находиться как в непосредственной близости от открытой рамки считывания, кодирующей белок, или начала последовательности РНК, как в случае с промоторами (так называемые cis-регуляторные элементы, англ. cis-regulatory elements), так и на расстоянии многих миллионов пар оснований (нуклеотидов), как в случае с энхансерами, инсуляторами и супрессорами (иногда классифицируемые как trans-регуляторные элементы, англ. trans-regulatory elements). Таким образом, понятие гена не ограничено только кодирующим участком ДНК, а представляет собой более широкую концепцию, включающую в себя и регуляторные последовательности.

Изначально термин «ген» появился как теоретическая единица передачи дискретной наследственной информации. История биологии помнит споры о том, какие молекулы могут являться носителями наследственной информации. Большинство исследователей считали, что такими носителями могут быть только белки, так как их строение (20 аминокислот) позволяет создать больше вариантов, чем строение ДНК, которое составлено всего из четырёх видов нуклеотидов. Позже было экспериментально доказано, что именно ДНК включает в себя наследственную информацию, что было выражено в виде центральной догмы молекулярной биологии.

Гены могут подвергаться мутациям — случайным или целенаправленным изменениям последовательности нуклеотидов в цепи ДНК. Мутации могут приводить к изменению последовательности, а следовательно изменению биологических характеристик белка или РНК, которые, в свою очередь, могут иметь результатом общее или локальное изменённое или анормальное функционирование организма. Такие мутации в ряде случаев являются патогенными, так как их результатом является заболевание, или летальными на эмбриональном уровне. Однако далеко не все изменения последовательности нуклеотидов приводят к изменению структуры белка (благодаря эффекту вырожденности генетического кода) или к существенному изменению последовательности и не являются патогенными. В частности, геном человека характеризуется однонуклеотидными полиморфизмами и вариациями числа копий (англ. copy number variations), такими как делеции и дупликации, которые составляют около 1 % всей нуклеотидной последовательности человека[31]. Однонуклеотидные полиморфизмы, в частности, определяют различные аллели одного гена.

Мономеры, составляющие каждую из цепей ДНК, представляют собой сложные органические соединения, включающие в себя азотистые основания: аденин (А), тимин (Т), цитозин (Ц), гуанин (Г), пятиатомный сахар (пентозу) — дезоксирибозу, по имени которой и получила название сама ДНК, — а также остаток фосфорной кислоты. Эти соединения носят название нуклеотидов.

Мутация[править | править код]

Репликация ДНК по большей части чрезвычайно точна, однако ошибки (мутации) случаются[27]:7.6. Частота ошибок в эукариотических клетках может составлять всего 10−8 в нуклеотиде на репликацию[32][33], тогда как для некоторых РНК-вирусов она может достигать 10−3[34]. Это означает, что в каждое поколение, каждый человек в геноме накапливает 1-2 новые мутации[34]. Небольшие мутации могут быть вызваны репликацией ДНК и последствиями повреждения ДНК и включают точечные мутации, в которых изменяется одно основание, и мутации со сдвигом рамки, в которых одно основание вставляется или удаляется. Любая из этих мутаций может изменить ген по миссенс (изменить код для кодирования другой аминокислоты) или по нонсенс (преждевременный стоп-кодон)[35]. Большие мутации могут быть вызваны ошибками в рекомбинации, чтобы вызвать хромосомные аномалии, включая дублирование, делецию, перегруппировку или инверсию больших участков хромосомы. Кроме того, механизмы восстановления ДНК могут вносить мутационные ошибки при восстановлении физического повреждения молекулы. Восстановление, даже с мутацией, является более важным для выживания, чем восстановление точной копии, например, при восстановлении двухцепочечных разрывов[27]:5.4.

Когда в популяции вида присутствует несколько различных аллелей гена, это называется полиморфизм. Большинство различных аллелей функционально эквивалентны, однако некоторые аллели могут вызывать различные фенотипические признаки. Самый распространенный аллель гена называется диким типом, а редкие аллели - мутантами. Генетические различия в относительных частотах различных аллелей в популяции обусловлены как естественным отбором, так и генетическим дрейфом[36]. Аллель дикого типа не обязательно является предком менее распространенных аллелей и не обязательно более приспособлена.

Количество генов[править | править код]

Размер генома и количество генов, которые он содержит, значительно варьируют у таксономических групп. Наименьший геном встречаются у вирусов[37], и вироидов (которые действуют как один некодирующий ген РНК)[38]. И наоборот, растения могут иметь очень большие геномы[39], в рисе содержатся более 46 000 генов, кодирующих белок[40]. Общее количество кодирующих белок генов (протеома Земли) оценивается в 5 миллионов последовательностей[41].

Генная инженерия — это методы модификации генетического материала для изменения свойств живого организма. С 1970-х годов было разработано множество методов, специально предназначенных для добавления, удаления и редактирования генов в вирусах, бактериях, растениях, грибах и животных, включая человека[42]. Недавно разработанные методы геномной инженерии используют инженерные нуклеазные ферменты для создания целевой репарации ДНК в хромосоме, чтобы либо разрушить, либо отредактировать ген в процессе репарации искусственно внесённого разрыва ДНК[43][44][45][46]. Связанный термин синтетическая биология иногда используется для обозначения обширной дисциплины генной инженерии организма[47].

Генная инженерия в настоящее время является рутинным инструментом при работе с модельными организмами. Например, гены легко добавляются к бактериям[48], а линии «Knockout mouse (англ.)русск.» мышей с нарушенной функцией определённого гена используются для исследования функции этого гена[49][50]. Многие организмы были генетически модифицированы для применения в сельском хозяйстве, промышленной биотехнологии и медицине.

У многоклеточных организмов обычно модифицируется эмбрион, который вырастает во взрослый генетически модифицированный организм[51]. Однако геномы клеток взрослого организма можно редактировать с использованием методов генной терапии для лечения генетических заболеваний.

  1. дискретность — несмешиваемость генов;
  2. стабильность — способность сохранять структуру;
  3. лабильность — способность многократно мутировать;
  4. множественный аллелизм — многие гены существуют в популяции во множестве молекулярных форм;
  5. аллельность — в генотипе диплоидных организмов только две формы гена;
  6. специфичность — каждый ген кодирует свой признак;
  7. плейотропия — множественный эффект гена;
  8. экспрессивность — степень выраженности гена в признаке;
  9. пенетрантность — частота проявления гена в фенотипе;
  10. амплификация — увеличение количества копий гена[источник не указан 2028 дней].
  1. Структурные гены — гены, кодирующие информацию о первичной структуре белка. Расположение нуклеотидных триплетов в структурных генах коллинеарно последовательности аминокислот в полипептидной цепи, кодируемой данным геном (См. также статью гены домашнего хозяйства).
  2. Функциональные гены — гены, которые контролируют и направляют деятельность структурных генов[52].
  1. 1 2 Johannsen, W. (1905). Arvelighedslærens elementer («The Elements of Heredity». Copenhagen). Rewritten, enlarged and translated into German as Elemente der exakten Erblichkeitslehre (Jena: Gustav Fischer, 1909; Scanned full text. Архивная копия от 30 мая 2009 на Wayback Machine
  2. Тарантул В. З. Толковый словарь по молекулярной и клеточной биотехнологиию Русско-английский. — М: Языки славянской литературы, 2015. — Т. 1. — С. 370—371. — 984 с. — ISBN 978-5-94457-249-3.
  3. Pearson H. Genetics: what is a gene? (англ.) // Nature. — 2006. — May (vol. 441, no. 7092). — P. 398—401. — doi:10.1038/441398a. — Bibcode: 2006Natur.441..398P. — PMID 16724031.
  4. 1 2 Pennisi E. Genomics. DNA study forces rethink of what it means to be a gene (англ.) // Science : journal. — 2007. — June (vol. 316, no. 5831). — P. 1556—1557. — doi:10.1126/science.316.5831.1556. — PMID 17569836.
  5. 1 2 Gericke, Niklas Markus; Hagberg, Mariana. Definition of historical models of gene function and their relation to students' understanding of genetics (англ.) // Science & Education (англ.)русск. : journal. — 2006. — 5 December (vol. 16, no. 7—8). — P. 849—881. — doi:10.1007/s11191-006-9064-4. — Bibcode: 2007Sc&Ed..16..849G.
  6. Portin P., Wilkins A. The evolving definition of the term “gene” (англ.) // Genetics. — 2017. — Vol. 205, no. 4. — P. 1353—1364.
  7. Noble D. Genes and causation (англ.) // Philosophical Transactions of the Royal Society of London. Series A, Mathematical and Physical Sciences (англ.)русск. : journal. — 2008. — September (vol. 366, no. 1878). — P. 3001—3015. — doi:10.1098/rsta.2008.0086. — Bibcode: 2008RSPTA.366.3001N. — PMID 18559318.
  8. Magner, Lois N. A History of the Life Sciences (неопр.). — Third. — Marcel Dekker, CRC Press, 2002. — С. 371. — ISBN 978-0-203-91100-6.
  9. Henig, Robin Marantz. The Monk in the Garden: The Lost and Found Genius of Gregor Mendel, the Father of Genetics (англ.). — Boston: Houghton Mifflin (англ.)русск., 2000. — P. 1—9. — ISBN 978-0395-97765-1.
  10. ↑ Де Фриз, Хуго, Intracellulare Pangenese, Verlag von Gustav Fischer, Йена (город), 1889. Translated in 1908 from German to English by C. Stuart Gager as Intracellular Pangenesis, Open Court Publishing Co., Chicago, 1910
  11. Либацкая Т. Е. Уильям Бэтсон: у истоков генетики // Вестник Российской академии наук. — 2003. — Т. 73, № 9. — С. 830—837.
  12. ↑ C. Stuart Gager, Translator’s preface to Intracellular Pangenesis, p. viii.
  13. ↑ Франк-Каменецкий, 2004, с. 18.
  14. Avery, OT; MacLeod, CM; McCarty, M. Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type III (англ.) // The Journal of Experimental Medicine (англ.)русск. : journal. — Rockefeller University Press (англ.)русск., 1944. — Vol. 79, no. 2. — P. 137—158. — doi:10.1084/jem.79.2.137. — PMID 19871359.
  15. Hershey, AD; Chase, M. Independent functions of viral protein and nucleic acid in growth of bacteriophage (англ.) // The Journal of General Physiology (англ.)русск. : journal. — Rockefeller University Press (англ.)русск., 1952. — Vol. 36, no. 1. — P. 39—56. — doi:10.1085/jgp.36.1.39. — PMID 12981234.
  16. Judson, Horace (англ.)русск.. The Eighth Day of Creation: Makers of the Revolution in Biology (англ.). — Cold Spring Harbor Laboratory Press (англ.)русск., 1979. — P. 51—169. — ISBN 978-0-87969-477-7.
  17. Watson, J.D.; Crick, F. H. Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid (рум.) // Nature. — 1953. — Т. 171, nr. 4356. — P. 737—738. — doi:10.1038/171737a0. — Bibcode: 1953Natur.171..737W. — PMID 13054692.
  18. Benzer S. Fine Structure of a Genetic Region in Bacteriophage (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 1955. — Vol. 41, no. 6. — P. 344—354. — doi:10.1073/pnas.41.6.344. — Bibcode: 1955PNAS...41..344B. — PMID 16589677.
  19. Benzer S. On the Topology of the Genetic Fine Structure (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 1959. — Vol. 45, no. 11. — P. 1607—1620. — doi:10.1073/pnas.45.11.1607. — Bibcode: 1959PNAS...45.1607B. — PMID 16590553.
  20. Min Jou W., Haegeman G., Ysebaert M., Fiers W. Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein (англ.) // Nature : journal. — 1972. — May (vol. 237, no. 5350). — P. 82—88. — doi:10.1038/237082a0. — Bibcode: 1972Natur.237...82J. — PMID 4555447.
  21. Sanger, F; Nicklen, S; Coulson, A. R. DNA sequencing with chain-terminating inhibitors (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 1977. — Vol. 74, no. 12. — P. 5463—5467. — doi:10.1073/pnas.74.12.5463. — Bibcode: 1977PNAS...74.5463S. — PMID 271968.
  22. Adams, Jill U. DNA Sequencing Technologies (неопр.) // Nature Education Knowledge. — Nature Publishing Group, 2008. — Т. 1, № 1. — С. 193.
  23. Huxley, Julian. Evolution: the Modern Synthesis (неопр.). — Cambridge, Massachusetts: MIT Press, 1942. — ISBN 978-0262513661.
  24. Williams, George C. Adaptation and Natural Selection a Critique of Some Current Evolutionary Thought (англ.). — Online. — Princeton: Princeton University Press, 2001. — ISBN 9781400820108.
  25. Dawkins, Richard. The selfish gene (англ.). — Repr. (with corr.). — London: Oxford University Press, 1977. — ISBN 978-0-19-857519-1.
  26. Dawkins, Richard. The extended phenotype (англ.). — Paperback. — Oxford: Oxford University Press, 1989. — ISBN 978-0-19-286088-0.
  27. 1 2 3 4 5 6 7 Alberts, Bruce (англ.)русск.; Johnson, Alexander; Lewis, Julian (англ.)русск.; Raff, Martin (англ.)русск.; Roberts, Keith; Walter, Peter (англ.)русск.. Molecular Biology of the Cell (неопр.). — Fourth. — New York: Garland Science (англ.)русск., 2002. — ISBN 978-0-8153-3218-3.
  28. ↑ Кребс, 2017, с. 21.
  29. Stryer L., Berg J. M., Tymoczko J. L. Biochemistry (неопр.). — 5th. — San Francisco: W.H. Freeman (англ.)русск., 2002. — ISBN 978-0-7167-4955-4.
  30. Bolzer, Andreas; Kreth, Gregor; Solovei, Irina; Koehler, Daniela; Saracoglu, Kaan; Fauth, Christine; Müller, Stefan; Eils, Roland; Cremer, Christoph; Speicher, Michael R.; Cremer, Thomas. Three-Dimensional Maps of All Chromosomes in Human Male Fibroblast Nuclei and Prometaphase Rosettes (англ.) // PLoS Biology : journal. — 2005. — Vol. 3, no. 5. — P. e157. — doi:10.1371/journal.pbio.0030157. — PMID 15839726.

Геном человека - это... Что такое Геном человека?

Графическое представление нормального человеческого кариотипа.

Геном человека — совокупность наследственного материала, заключенного в клетке человека. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две аутосомные хромосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований[1].

В ходе выполнения проекта «Геном человека» была определена последовательность ДНК всех хромосом и митохондриальной ДНК. В настоящее время эти данные активно используется по всему миру в биомедицинских исследованиях. Полное секвенирование выявило, что человеческий геном содержит 20 000—25 000 генов[2], что значительно меньше, чем ожидалось в начале проекта. Только 1,5 % всего генетического материала кодирует белки или функциональную РНК. Остальная часть является некодирующей ДНК, которую часто называют мусорной ДНК[3].

Особенности

Хромосомы

Геном человека состоит из 23 пар хромосом (в сумме 46 хромосом), где каждая хромосома содержит сотни генов, разделённых межгенным пространством. Межгенное пространство содержит регуляторные участки и ничего не кодирующую ДНК.

В геноме присутствует 23 пары хромосом: 22 пары аутосомных хромосом, а также пара половых хромосомы X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом.

Гены

По результатам проекта Геном человека, количество генов в геноме человека составляет около 28000 генов. Начальная оценка была более чем 100 тысяч генов. В связи с усовершенствованием методов поиска генов (предсказание генов) предполагается дальнейшее уменьшение числа генов.

Число генов человека не намного превосходит число генов у более простых организмов, например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster. Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.

Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бандами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.

Кроме кодирующих белок генов человеческий геном содержит тысячи РНК-генов, включая транспортную РНК (tRNA), рибосомную РНК, микро РНК (microRNA) и прочие не кодирующие белок РНК последовательности.

Регуляторные последовательности

В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию гена. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.

Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно некоторой гипотезе, в эволюционном дереве ветвь разделяющая человека и мышь появилась приблизительно 70-90 миллионов лет назад[4]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности идентичные или очень слабо отличающиеся в сравниваемых геномах) в не кодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов для обоих организмов[5].

Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8-раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов[6].

Прочие объекты в геноме

Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома[3]. Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, на текущий момент не выяснена. Фактически эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:

Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент.

Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и на эти участки генома многие ссылаются как на «мусорную ДНК». Однако существует масса свидетельств, которая говорит о том, что эти объекты обладают некоторой функцией, которая не вполне понятна на текущий момент.

Псевдогены

Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции[7].

Вирусы

Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн. лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты.

Большинство ретровирусов встроились в геном предков человека свыше 25 млн. лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено[8],[9].

См. также

Примечания

  1. Talking glossary of genetic terms: genome  (англ.). National Human Genome Research Institute. Архивировано из первоисточника 4 ноября 2012. Проверено 1 ноября 2012.
  2. International Human Genome Sequencing Consortium (2004). «Finishing the euchromatic sequence of the human genome.». Nature 431 (7011): 931-45. PMID 15496913. [1]
  3. 1 2 International Human Genome Sequencing Consortium (2001). «Initial sequencing and analysis of the human genome.». Nature 409 (6822): 860-921. PMID 11237011. [2]
  4. Nei M, Xu P, Glazko G (2001). «Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms.». Proc Natl Acad Sci U S A 98 (5): 2497-502. PMID 11226267.
  5. Loots G, Locksley R, Blankespoor C, Wang Z, Miller W, Rubin E, Frazer K (2000). «Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons.». Science 288 (5463): 136-40. PMID 10753117. Summary
  6. Meunier, Monique Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome  (англ.). Genoscope.(недоступная ссылка — история) Проверено 12 сентября 2006.
  7. Claverie J (2005). «Fewer genes, more noncoding RNA.». Science 309 (5740): 1529-30. PMID 16141064.
  8. Eugene D. Sverdlov. Retroviruses and primate evolution. BioEssays Volume 22, Issue 2, pages 161–171, February 2000
  9. Anders L Kjeldbjerg, Palle Villesen, Lars Aagaard, Finn Skou Pedersen. Gene conversion and purifying selection of a placenta-specific ERV-V envelope gene during simian evolution // BMC Evolutionary Biology. 2008. V. 8. P. 266.

Список литературы

  • Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. — Языки славянской культуры, 2003. — 396 с. — ISBN 5-94457-108-X.
  • Ридли Мэтт. Геном: автобиография вида в 23 главах. — М.: Эксмо, 2008. — 432 с. — ISBN 5-699-30682-4

Ссылки

что это такое и как они работают. Что такое хромосомы?

Ген – это наследственный фактор, в котором зашифрован определенный признак организма. Физически ген представляет собой участок ДНК (реже – РНК), который задает последовательность белков либо функциональной РНК. Совокупность генов в организме называют генотипом, а науку о генах – генетикой.

Всё началось с гороха

Аббат Грегор Мендель, австрийский ботаник и биолог, заметил, что потомство не всегда повторяет признаки, которыми обладали родители. Чтобы понять взаимосвязь, Мендель стал выращивать горох, скрещивать различные растения и отслеживать частоту наследования признаков.

Мендель доказал, что отдельные признаки (цвет, форма цветка и т.д.) могут наследоваться независимо. Он вывел теорию доминантных и рецессивных признаков, описал явление прерывистого наследования, математически интерпретировал результаты своих экспериментов.

Труды Менделя впервые опубликовали в 1866 году. Именно его считают основоположником генетики.

До этого ученые считали, что родительские признаки смешиваются подобно жидкости и потомки наследуют именно такой «коктейль». Теория пангенезиса, которую Чарльз Дарвин сформулировал в 1868 году, также следует этой концепции.

Впрочем, Дарвин считал, что «коктейль» состоит из мельчайших отдельных частиц – геммул. Они смешиваются во время зачатия. В целом ученый был недалек от истины.

Собственно термин «ген» в 1909 году ввел Вильгельм Йоханнсен. До этого признаки называли пангенами.

ДНК как носитель генов

В 1940-е годы американский биолог Освальд Эвери из Рокфеллеровского института доказал, что дезоксирибонуклеиновая кислота, которая присутствует в ядре клетки, является физическим носителем генетической информации. В экспериментах с пневмококками он установил, что только ДНК, а не белок или другие компоненты, передает признаки от бактерий к их наследникам.

Первые фото ДНК удалось получить только в 1953 году Розалинд Франклин и Морису Уилкинсу. На их основе Джеймс Д. Уотсон и Фрэнсис Крик разработали модель молекулы двухцепочечной спирали ДНК, а также сформулировали теорию генетической репликации – создания двух дочерних ДНК от материнской клетки.

Всё это привело к появлению главной догмы молекулярной биологии. РНК (рибонуклеиновая кислота, одинарная цепочка) транскрибируется с ДНК: ДНК выступает в качестве базы, с которой на РНК переносится информация. При этом белки транслируются с РНК. Обратный процесс (когда ДНК создается по РНК) происходит только в некоторых вирусах, например, в ВИЧ (вирусе иммунодефицита человека).

ДНК состоит из четырех различных нуклеотидов: аденина (А), цитозина (Ц), гуанина (Г) и тимина (Т). Они образуют спаренные основания: ЦГ, АТ, ГЦ, ТА. Противоположные основания в спирали ДНК связаны водородными связями.

Что такое хромосомы

Хромосома образуется из очень длинной молекулы ДНК, которая содержит повторяющиеся цепочки генов. У каждого вида свой набор хромосом (кариотип). Например, у человека 46 хромосом: 22 пары аутосом разной длины и пара половых хромосом – XX или XY.

В геноме человека насчитывается 20-25 тыс. генов. Если молекулу ДНК из самой длинной хромосомы расположить вдоль линии, она займет около 1,5 м. Длина отдельного участка ДНК, который кодирует ген, составит всего 0,005 мм.

Место хранения определенного гена в хромосоме называют локусом. В каждом локусе – определенный аллель гена, одна из нескольких его форм.

Аллели могут быть одинаковыми – тогда говорят, что организм гомозиготный. Если аллели разные, то один из них главенствует, доминирует над другим. Доминантный ген подавляет рецессивный. В результате проявляется только один признак, но наследуются оба.

Набор хромосом и аллелей генов в них определяет наш внешний вид, физические и психические данные. Это база, которую затем изменяют природа, среда, образ жизни и т.д.

Как работают гены

Гены можно разделить на две группы – структурные и регуляторные. В структурных генах хранится информация о полипептидных цепях – это собственно признаки. Регуляторные, или функциональные гены включают и выключают структурные гены.

Назначение структурного гена в любом организме – в нужный момент обеспечить появление в клетке белка, который он кодирует. Чтобы это произошло, задействуются различные части гена.

Так, промотор, который находится перед белок-кодирующей частью, задает основные характеристики активности гена. Промотор определяет, в каких клетках будет работать ген, насколько долго и с какой интенсивностью. В конце гена находится терминатор – это сигнал конца цепочки.

РНК-полимераза проходит путь от промотора до терминатора и выполняет синтез матричной РНК – своеобразной инструкции для синтеза белка, правильного расположения в нем нужных аминокислот. Этот процесс называют транскрипцией.

Регуляторные гены – это гены-регуляторы и гены-операторы. Оператор непосредственно связан с определенной группой структурных генов (и такая конструкция называется «оперон»). Регулятор через белок-репрессор воздействует на структурные гены и обеспечивает синтез белка – трансляцию.

В синтезе белка участвует два десятка аминокислот. Каждые три нуклеотида ДНК кодируют определенную аминокислоту. Трансляция происходит на базе РНК-копии гена из ДНК:

  1. Матричная РНК выходит из ядра клетки в цитоплазму и связывается с рибосомой.

  2. В рибосоме синтезируется РНК-копия гена по инструкции из матричной РНК. Затем у этой РНК-копии будет синтезироваться белок.

  3. Из РНК-копии удаляются нитроны – нуклеотиды, которые не нужны для синтеза белка.

  4. Оперон начинает реакцию по синтезу белка. Пока молекул белка недостаточно, белок-репрессор неактивен.

  5. Как только накопилось достаточно молекул синтезируемого белка, белок-репрессор активируется.

  6. Он связывается с геном-оператором.

  7. После связывания синтез белка прекращается.

Что такое мутация

При репликации (копировании) ДНК очень редко, но всё же могут возникать ошибки. Их называют мутациями. Ученые подсчитали, что представитель каждого нового поколения несет в своем геноме 1-2 новых мутации.

Обычно мутации возникают из-за повреждения ДНК в процессе копирования. Они могут привести к хромосомным аномалиям: когда достаточно большие участки хромосомы дублируются, удаляются или перегруппируются.

В результате мутаций белки начинают синтезироваться неправильно. В целом в организмах есть механизмы «ремонта» ДНК после мутаций или уничтожения клеток-мутантов, но они не всегда срабатывают.

Если мутации происходят в половой клетке, у плода могут неправильно сформироваться целые органы и системы. Если в обычной клетке, то могут появиться доброкачественные или злокачественные образования.

С другой стороны, отдельные мутации оказывались удачными. Они сыграли важную роль в процессе естественного отбора и привели к созданию более выносливых и приспособленных организмов.

Сколько у нас генов?

Статья на конкурс «био/мол/текст»: Это интересный вопрос, ответ на который должен был дать проект «Геном человека», завершившийся в 2003 году. После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалось не такой простой. Цель настоящей статьи — суммировать и проанализировать научные данные по составлению каталога генов у человека.

Эта работа опубликована в номинации «Свободная тема» конкурса «био/мол/текст»-2018.


Генеральный спонсор конкурса — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.


Спонсором приза зрительских симпатий выступил медико-генетический центр Genotek.


«Книжный» спонсор конкурса — «Альпина нон-фикшн»

Как же мало известно о генах! Первый раз я остро ощутила это, находясь на практике в лаборатории медицинской генетики Харбинского медицинского университета. Исследовательская группа, где я проходила стажировку, занималась изучением онкогена Sei-1, который индуцирует образование двухминутных хромосом (DM), что способствует развитию онкогенеза. Однако механизм образования онкогена Sei-1 остается неизвестным до сих пор. А ведь различные мутации генов являются причиной возникновения и других опасных заболеваний человека, помимо рака. Итак, в данной статье мы изложим некоторые соображения о том, почему мы все еще многое не знаем о генах, а также сформулируем наше мнение о том, сколько генов у человека.

В 1977 году Фредерик Сэнгер впервые разработал метод секвенирования ДНК [1], основанный на терминации ДНК-полимеразной реакции с помощью дидезоксинуклеотидов, за что в 1980 году был удостоен Нобелевской премии в области химии. В этом же году Нобелевскую премию получили Максам и Гилберт, которые предложили метод секвенирования ДНК путем химической деградации. В 1985 году была выявлена первая полная последовательность ДНК бактерии (Haemophilus influenzae), в 1996 году получен первый геном эукариотической клетки (дрожжи Saccharomyces ceravisiae), а в 1998 году расшифрован геном дождевого червя (Caenorhabditis elegans). Завершение в 2003 году проекта «Геном человека» привело к публикации полной последовательности человеческого генома. Но «полной» ее можно назвать весьма условно, учитывая, что около 8% не секвенировано и по сей день [2].

Проект «Геном человека» и полный список генов

Выявление полного списка генов необходимо для выяснения молекулярных механизмов возникновения и развития рака, шизофрении [3], деменции, а также многих других заболеваний человека. Секвенирование ДНК, выделенной из тканей больных, позволяет выявлять такие мутации, как нуклеотидные замены, делеции и вставки, ответственные за возникновение этих заболеваний.

Рисунок 1. Арт-проект на выставке «Геном — расшифровка кода жизни» в Национальном музее естественной истории в Вашингтоне

Собственно, ради этого и затевался проект «Геном человека» (Human genome project, HGP), который продолжался с 1990 по 2003 год. Его основной задачей было определение нуклеотидной последовательности ДНК человека и локализации 100 000 человеческих генов (как тогда полагали) [4]. Параллельно с этим планировалось изучить ДНК набора модельных организмов, чтобы получить сравнительную информацию, необходимую для понимания функционирования генома человека. Предполагалось, что информация, полученная в результате HGP, станет настольной книгой для биомедицинской науки в XXI веке [5]. Целями данных исследований являлось получение информации о причинах ряда болезней [6] и, в конечном итоге, разработка способов лечения более чем 4000 генетических заболеваний, которые затрагивают человечество, включая многофакторные, в которых генетическая предрасположенность играет важную роль. Считалось, что результаты секвенирования генома позволят определить локализацию каждого гена и их общее количество. Однако последовавшие за этим события доказали обратное: сегодня существует несколько баз данных генов, которые существенно отличаются друг от друга. Причем число белок-кодирующих генов совпадает, а число генов других типов расходится.

Проект «Протеом человека»

В 2010 году по инициативе Организации по изучению протеома человека (Human proteome organization, HUPO) был начат проект «Протеом человека» (HPP), целью которого является создание полного списка белков вида Homo sapiens [7]. Для этого, во-первых, предполагается идентифицировать и охарактеризовать, по крайней мере, по одному белковому продукту белок-кодирующих генов, их однонуклеотидные полиморфизмы и варианты сплайсинга, а также виды посттрансляционной модификации белков [8]. Во-вторых, данные протеомики, полученные в результате реализации HPP, способствуют, в дополнение к геномным данным, решению различных биомедицинских задач и созданию новых аннотированных баз знаний, таких как neXtProt [9].

В настоящее время neXtProt содержит информацию о 17 487 белках, существование которых экспериментально подтверждено, 1728 белках, подтвержденных на уровне транскриптов, 515-и, определенных на основании гомологии, 76-и предсказанных и 571-м неизвестной природы. Особый интерес вызывают белки, существование которых экспериментально не доказано, хотя данные о том, что они кодируются геномом, существуют. Это так называемые «потерянные» белки, которые составляют примерно 18% всех кодируемых белков. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia [7].

«Протеом человека» является продолжением проекта «Геном человека». Предполагается, что благодаря проекту по изучению протеома мы узнаем точное количество белок-кодирующих генов, что впоследствии позволит понять, сколько всего генов у человека.

Немного о РНК

Проект «Геном человека» показал, что молекулы РНК также важны для жизни, как и ДНК. Внутри клеток существует множество РНК (рис. 2). Изначально РНК подразделяются на некодирующие РНК (нкРНК), которые не транслируются в белки, и кодирующие РНК (мРНК), служащие матрицей для синтеза полипептидных цепей белка. Некодирующие РНК имеют более сложную классификацию. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК представлены рибосомными РНК (рРНК) и транспортными РНК (тРНК). Молекулы рРНК синтезируются в ядрышке и составляют основу рибосомы, а также кодируют белки субъединиц рибосомы. После того, как рРНК полностью собраны, они переходят в цитоплазму, где в качестве ключевых регуляторов трансляции, участвуют в чтении кода мРНК. Последовательность из трех азотистых оснований в мРНК указывает на включение определенной аминокислоты в последовательность белка. Молекулы тРНК, приносят указанные аминокислоты на рибосомы, где синтезируется белок.

Рисунок 2. Виды РНК

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют ряд важных функций (табл. 1).

Таблица 1. Некодирующие регуляторные РНК
НазваниеОбозначениеДлинаФункции
Длинные некодирующие РНК днкРНК, lncRNA 200 нуклеотидов 1. Регулируют избирательное метилирование ДНК, направляя ДНК-метилтрансферазу
2. Руководят избирательной посадкой репрессорных комплексов polycomb
Малые РНК Малые ядерные РНК мяРНК, snRNA 150 нуклеотидов 1. Участвуют в сплайсинге
2. Регулируют активность факторов транскрипции
3. Поддерживают целостность теломер [13]
Малые ядрышковые РНК мякРНК, snoRNA 60–300 нуклеотидов 1. Участвуют в химической модификации рРНК, тРНК и мяРНК
2. Возможно, участвуют в стабилизации структуры рРНК и защите от действия гидролаз
Малые интерферирующие РНК миРНК, siRNA 21–22 нуклеотидов 1. Осуществляют антивирусную иммунную защиту
2. Подавляют активность собственных генов
Микро-РНК мкРНК, miRNA 18–25 нуклеотидов Подавляют трансляцию путем РНК-интерференции
Антисмысловые РНК [14] asRNA 1. Короткие: менее 200 нуклеотидов
2. Длинные: более 200 нуклеотидов
Блокируют трансляцию, образуя гибриды с мРНК
РНК, связанные с белками Piwi piRNA, piwiRNA 26–32 нуклеотидов Их также называют «стражами генома», они подавляют активность мобильных генетических элементов во время эмбриогенеза

Проблема терминологии

Прежде чем ответить на вопрос: «Сколько у нас генов?», нужно понять, что же такое ген?

Основное внимание HGP было направлено на белок-кодирующие гены [15]. Однако, как было указано в первоначальном докладе HGP в 2001 году, «тысячи генов человека продуцируют некодирующие РНК (нкРНК), являющиеся их конечным продуктом», хотя на тот момент было известно около 706 генов нкРНК [2]. В своей недавней статье, опубликованной в журнале BMC Biology Стивен Зальцберг (Steven L. Salzberg) дает следующее определение гена [16]:

Ген
любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок.

Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, и позволяет определять все варианты альтернативного сплайсинга в одном локусе как варианты одного и того же гена. Это позволяет исключить псевдогены – нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Результаты двух первых исследований свидетельствовали о наличии у человека 31 000 [2] и 26 588 белок-кодирующих генов [17], а в 2004 появилась полная последовательность генома человека [4], и авторы подсчитали, что полный каталог насчитывает 24 000 белок-кодирующих генов. Каталог человеческих генов Ensembl включает 22 287 белок-кодирующих генов и 34 214 транскриптов [18].

Секвенирование нового поколения (NGS)

Появление высокопроизводительных методов параллельного секвенирования (в ходе такого секвенирования миллионы фрагментов ДНК из одного образца секвенируются одновременно) или секвенирования нового (следующего) поколения (next-generation sequencing, NGS) [1] позволило значительно ускорить поиск функциональных участков генома [4]. Биотехнологические компании разработали и коммерциализировали различные платформы для NG-секвенирования, позволяющие секвенировать от 1 млн до десятков млрд коротких последовательностей (ридов, reads) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся такие, как Illumina и IonTorrent, использующие амплификацию ДНК с помощью ПЦР [19], а также платформы одномолекулярного секвенирования, такие как Helicos Biosciences HeliScope, Pacific Biosciences SMRT (single molecule real-time sequencing), и нанопорового секвенирования Oxford Nanopore, осуществляющие секвенирование в реальном времени и позволяющие прочитывать значительно более длинные риды — до 10–60 тыс. нуклеотидов. Кроме того, изобретение секвенирования РНК (RNA-seq) в 2008 году, которое создавалось для количественного определения экспрессии генов, также способствовало обнаружению транскрибируемых последовательностей, как кодирующих, так и некодирующих РНК [20].

Благодаря NGS, базы данных днкРНК и других генов РНК (таких как микро-РНК) резко выросли за десятилетие, и текущие каталоги генов человека теперь содержат больше генов, кодирующих РНК, чем белки (табл. 2).

Таблица 2. Количество разных типов генов в следующих базах данных: Gencode, Ensembl, RefSeq, CHESS
Типы геновGencodeEnsemblRefSeqCHESS
Белок-кодирующие гены 19 901 20 376 20 345 21 306
Гены длинных некодирующих РНК 15 779 14 720 17 712 18 484
Антисмысловые РНК 5501 28 2694
Другие некодирующие РНК 2213 2222 13 899 4347
Псевдогены 14 723 1740 15 952
Общее число транскриптов 203 835 203 903 154 484 323 827

Рисунок 3. Последовательность ДНК, получаемая после секвенирования человеческого генома

В ходе секвенирования РНК обнаружилось, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции проиcходят гораздо чаще, чем полагали, затрагивая до 95% человеческих генов. Следовательно, даже если известно местоположение всех генов, сначала нужно выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или они просто представляют собой ошибки сплайсинга.

Базы данных генов человека

Задача по составлению каталога всех генов по-прежнему не решена. Проблема заключается в том, что за последние 15 лет только две исследовательские группы составили список доминантных генов: RefSeq, которая поддерживается Национальным центром биотехнологической информации (NCBI) при Национальных институтах здоровья (NIH), и Ensembl/Gencode, которая поддерживается Европейской молекулярно-биологической лабораторией (EMBL). Однако, несмотря на большой прогресс, сейчас в каталогах различается количество белок-колирующих генов, генов длинных некодирующих РНК, псевдогенов, а также варьирует количество антисмысловых РНК и других некодирующих РНК (табл. 2). Каталоги еще дорабатываются: например, в прошлом году сотни генов, кодирующих белок, были добавлены или удалены из списка Gencode. Эти разногласия объясняют проблему создания полного каталога человеческих генов.

В 2017 году была создана новая база данных генов человека — CHESS. Примечательно, что она включает все белок-кодирующие гены как Gencode, так и RefSeq, так что пользователям CHESS не нужно решать, какую базу данных они предпочитают. Бóльшее количество генов может вызывать больше ошибок, но создатели считают, что бóльший набор окажется полезным при исследовании болезней человека, которые еще не отнесены к генетическим. Набор генов CHESS в настоящее время в версии 2.0 еще не окончательный, и, безусловно, создатели работают над его усовершенствованием.

Таким образом, все еще неизвестно, сколько всего генов у человека. Существует ряд проблем, затрудняющих эту задачу. Например, многие гены (особенно, гены днкРНК), видимо, имеют высокую тканеспецифичность. Из этого следует, что пока ученые подробно не исследуют все типы клеток человека, они не могут быть уверены, что обнаружили все человеческие гены и транскрипты. Безусловно, сегодня знания о человеческих генах стали значительно обширнее, чем в начале проекта «Геном человека», а технологии совершеннее. Это дает надежду на то, что в скором времени мы узнаем точный ответ на поставленный вопрос.

  1. 12 методов в картинках: секвенирование нуклеиновых кислот;
  2. Eric S. Lander, Lauren M. Linton, Bruce Birren, Chad Nusbaum, Michael C. Zody, et. al.. (2001). Initial sequencing and analysis of the human genome. Nature. 409, 860-921;
  3. Власть колец: всемогущие кольцевые РНК;
  4. International Human Genome Sequencing Consortium. (2004). Finishing the euchromatic sequence of the human genome. Nature. 431, 931-945;
  5. Mohammad Ilyas. (2017). Next-Generation Sequencing in Diagnostic Pathology. Pathobiology. 84, 292-305;
  6. Геном человека: полезная книга, или глянцевый журнал?;
  7. Mark S. Baker, Seong Beom Ahn, Abidali Mohamedali, Mohammad T. Islam, David Cantor, et. al.. (2017). Accelerating the search for the missing proteins in the human proteome. Nat Comms. 8, 14271;
  8. SUMO: японская борьба или уникальная посттрансляционная модификация?;
  9. Pascale Gaudet, Pierre-André Michel, Monique Zahn-Zabal, Aurore Britan, Isabelle Cusin, et. al.. (2017). The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Res. 45, D177-D182;
  10. Обо всех РНК на свете, больших и малых;
  11. Кодирующие некодирующие РНК;
  12. Власть колец: всемогущие кольцевые РНК;
  13. Цинковые пальцы смерти;
  14. Есть ли смысл в антисенсах?;
  15. Геном человека: как это было и как это будет;
  16. Steven L. Salzberg. (2018). Open questions: How many genes do we have?. BMC Biol. 16;
  17. J. C. Venter, H. O. Smith, M. D. Adams. (2015). The Sequence of the Human Genome. Clinical Chemistry. 61, 1207-1208;
  18. Eric T. Wang, Rickard Sandberg, Shujun Luo, Irina Khrebtukova, Lu Zhang, et. al.. (2008). Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476;
  19. 12 методов в картинках: полимеразная цепная реакция;
  20. Hassaan Mehboob Awan, Abdullah Shah, Farooq Rashid, Ge Shan. (2017). Primate-specific Long Non-coding RNAs and MicroRNAs. Genomics, Proteomics & Bioinformatics. 15, 187-195.

Что такое ДНК — и еще 15 простых и важных вопросов про генетику

В де­каб­ре в из­да­тель­стве «Ин­ди­ви­ду­ум» вы­шла кни­га швед­ской жур­на­лист­ки Ка­рин Бойс «Моя до­и­сто­ри­че­ская се­мья. Ге­не­ти­че­ский де­тек­тив». Че­рез ис­то­рию сво­ей се­мьи ав­тор по­ка­зы­ва­ет, как в ге­нах со­вре­мен­ных ев­ро­пей­цев спле­та­ют­ся судь­бы мно­же­ства на­ро­дов, и рас­ска­зы­ва­ет о до­сти­же­ни­ях и от­кры­ти­ях со­вре­мен­ных ге­не­ти­ков. «Цех» пуб­ли­ку­ет от­ры­вок из гла­вы «ДНК: во­про­сы и от­ве­ты» но­вой кни­ги Бойс.

Что та­кое ДНК?

ДНК — со­кра­ще­ние от «дез­ок­си­ри­бо­ну­кле­и­но­вая кис­ло­та». Это хи­ми­че­ское со­еди­не­ние, ко­то­рое на­хо­дит­ся во всех на­ших клет­ках и слу­жит по­сред­ни­ком при пе­ре­да­че из по­ко­ле­ния в по­ко­ле­ние био­ло­ги­че­ской ин­фор­ма­ции.

ДНК-мо­ле­ку­ла со­сто­ит из че­ты­рех со­еди­не­ний, так на­зы­ва­е­мых азо­ти­стых ос­но­ва­ний или нук­лео­ти­дов. Они на­зы­ва­ют­ся аде­нин, гу­а­нин, ци­то­зин и ти­мин (со­кра­щен­но А, G, C, и T). Ге­ном че­ло­ве­ка со­сто­ит при­мер­но из трех мил­ли­ар­дов та­ких А, G, C, и T. Два слу­чай­но вы­бран­ных че­ло­ве­ка бу­дут раз­ли­чать­сяь­в­се­го на одну ты­сяч­ную доли этих азо­ти­стых со­еди­не­ний; все осталь­ное иден­тич­но. Но, хотя раз­ли­чия ни­чтож­ны, они опре­де­ля­ют наши от­ли­чия друг от дру­га, и срав­не­ние меж­ду со­бой по­сле­до­ва­тель­но­стей этих ос­но­ва­ний, или, как мы го­во­рим, «букв», мо­жет дать очень мно­го ин­фор­ма­ции о про­ис­хож­де­нии каж­до­го от­дель­но­го че­ло­ве­ка и его род­ствен­ных свя­зях.

Что та­кое гены?

Гены — это часть ДНК, ко­ди­ру­ю­щая ин­фор­ма­цию о стро­е­нии бел­ков ор­га­низ­ма. Они со­став­ля­ют все­го несколь­ко про­цен­тов от об­щей по­сле­до­ва­тель­но­сти ДНК. Кро­ме того, в мо­ле­ку­ле ДНК есть так на­зы­ва­е­мые ре­гу­ля­тор­ные об­ла­сти, ко­то­рые опре­де­ля­ют, ко­гда и в ка­ком ко­ли­че­стве бу­дет син­те­зи­ро­вать­ся тот или иной бе­лок. Кро­ме того, до­ста­точ­но боль­шая часть ДНК пред­став­ле­на так на­зы­ва­е­мы­ми «неко­ди­ру­ю­щи­ми об­ла­стя­ми». Дан­ные о по­сле­до­ва­тель­но­сти ДНК каж­до­го че­ло­ве­ка яв­ля­ют­ся при­ват­ной ин­фор­ма­ци­ей. Од­на­ко для по­лу­че­ния наи­бо­лее раз­вер­ну­той ин­фор­ма­ции о ва­шем про­ис­хож­де­нии и ис­то­рии рода хо­ро­шо иметь дан­ные о по­сле­до­ва­тель­но­сти всей ва­шей ДНК, го­во­ря дру­ги­ми сло­ва­ми, все­го ге­но­ма.

Что та­кое ми­то­хон­дрии?

Ми­то­хон­дрии — так на­зы­ва­е­мые «ор­га­нел­лы» кле­ток, ко­то­рые от­ве­ча­ют за кле­точ­ное ды­ха­ние и обес­пе­чи­ва­ют клет­ки энер­ги­ей, необ­хо­ди­мой для их жиз­не­де­я­тель­но­сти. Они со­дер­жат свою соб­ствен­ную ДНК. Это та­кая неболь­шая коль­це­вая мо­ле­ку­ла, ко­то­рая со­сто­ит толь­ко из 16 000 пар азо­ти­стых ос­но­ва­ний. Ми­то­хон­дрий в клет­ке мно­го, по­это­му и та­ких оди­на­ко­вых мо­ле­кул ДНК в каж­дой клет­ке очень мно­го. Ми­то­хон­дрии в ос­нов­ном пе­ре­да­ют­ся от ма­те­рей к де­тям, по­это­му бла­го­да­ря им мы мо­жем про­сле­дить ма­те­рин­скую ли­нию че­ло­ве­ка на мно­го по­ко­ле­ний на­зад.


Что та­кое ядер­ная ДНК?

Ядер­ная ДНК — это, соб­ствен­но, вся осталь­ная, кро­ме ми­то­хон­дри­аль­ной, часть на­шей ДНК, ко­то­рая на­хо­дит­ся в спе­ци­аль­ной ча­сти клет­ки — ядре. Это очень боль­шая мо­ле­ку­ла, она об­ра­зо­ва­на тре­мя мил­ли­ар­да­ми пар азо­ти­стых ос­но­ва­ний. Изу­че­ние ядер­ной ДНК, без­услов­но, дает го­раз­до боль­ше ин­фор­ма­ции. Но, есте­ствен­но, изу­чить по­сле­до­ва­тель­ность та­кой дли­ны го­раз­до слож­нее и до­ро­же. Кро­ме того, не надо за­бы­вать, что ядро в клет­ке одно, а ми­то­хон­дрий очень мно­го. По­это­му если речь идет об «ис­ко­па­е­мой» ДНК, то со­хра­ня­ет­ся в первую оче­редь
ми­то­хон­дри­аль­ная ДНК — ее боль­ше и она ко­ро­че.

Что та­кое ауто­со­мы?

ДНК в ядре ор­га­ни­зо­ва­на в хро­мо­со­мы. У че­ло­ве­ка их 23 пары. В паре хро­мо­сом одна на­сле­ду­ет­ся от отца, дру­гая от ма­те­ри. В слу­чае 22 пар от отца и от ма­те­ри на­сле­ду­ют­ся оди­на­ко­вые хро­мо­со­мы, ко­то­рые от­ли­ча­ют­ся друг от дру­га по по­сле­до­ва­тель­но­сти вхо­дя­щих в их со­став азо­ти­стых ос­но­ва­ний в сред­нем на 0,1%. Они на­зы­ва­ют­ся ауто­со­ма­ми. Са­мые про­стые и де­ше­вые ге­не­ти­че­ские те­сты ос­но­вы­ва­ют­ся на ауто­сом­ных ДНК. Они мо­гут дать ин­фор­ма­цию о бра­тьях и сест­рах, о ро­ди­те­лях, дво­ю­род­ных и тро­ю­род­ных бра­тьях и сест­рах вплоть до седь­мо­го ко­ле­на. Но сов­па­де­ние мож­но опре­де­лить, толь­ко если дру­гие люди тоже про­шли тест. Од­на­ко есть еще хро­мо­со­мы, на­ли­чие ко­то­рых опре­де­ля­ет пол у че­ло­ве­ка. Это так на­зы­ва­е­мые Х- и Y-хро­мо­со­мы.

Что та­кое Х‐хро­мо­со­ма?

Это одна из двух по­ло­вых хро­мо­сом. У жен­щи­ны есть толь­ко две Х-хро­мо­со­мы, она пе­ре­да­ет сво­е­му ре­бен­ку X-хро­мо­со­му. А у муж­чин (и это, соб­ствен­но, опре­де­ля­ет их при­над­леж­ность к муж­ско­му полу) есть Х-хро­мо­со­ма от ма­те­ри и Y-хро­мо­со­ма
от отца. Если он пе­ре­даст свою Х-хро­мо­со­му бу­ду­ще­му ре­бен­ку, то но­си­тель двух X-хро­мо­сом бу­дет де­воч­кой, а вот если он пе­ре­даст Y-хро­мо­со­му, то по­лу­чит­ся маль­чик.

Что та­кое Y‐хро­мо­со­ма?

Y-хро­мо­со­ма — это хро­мо­со­ма, ко­то­рая все­гда пе­ре­да­ет­ся от отца к сыну. Срав­ни­вая по­сле­до­ва­тель­но­сти азо­ти­стых ос­но­ва­ний в Y-хро­мо­со­ме, мож­но про­сле­дить от­цов­скую ли­нию маль­чи­ка. По­дроб­ные те­сты Y-хро­мо­сом дают го­раз­до боль­ше ин­фор­ма­ции, чем ана­лиз ми­то­хон­дрий, и поз­во­ля­ют по­лу­чить на­мно­го боль­ше зна­ний и о древ­но­сти, и о со­вре­мен­но­сти.

Что та­кое гап­ло­груп­па?

Гап­ло­груп­па — это груп­па схо­жих по­сле­до­ва­тель­но­стей ДНК, име­ю­щих об­ще­го пред­ка, у ко­то­ро­го про­изо­шла му­та­ция, уна­сле­до­ван­ная все­ми по­том­ка­ми. Ина­че го­во­ря, все, кто вхо­дит в гап­ло­груп­пу, при­над­ле­жат к од­ной вет­ви ге­не­а­ло­ги­че­ско­го дре­ва.

Что та­кое STR?

Со­кра­ще­ние от ан­глий­ско­го «short tan­dem re­peats». Это ме­сто, где ДНК-мо­ле­ку­лу как бы «за­еда­ет», и ко­рот­кая по­сле­до­ва­тель­ность ос­но­ва­ний по­вто­ря­ет­ся несколь­ко раз. Чис­ло по­вто­ров пе­ре­да­ет­ся по на­след­ству и у раз­ных лю­дей раз­ли­ча­ет­ся. По­след­нее де­ла­ет STR удоб­ным ин­стру­мен­том для иден­ти­фи­ка­ции лич­но­сти по ДНК и уста­нов­ле­ния род­ства. На­чи­ная с 1980-х го­дов STR ис­поль­зу­ют при рас­сле­до­ва­нии уго­лов­ных дел; сей­час ме­то­ди­ка при­ме­ня­ет­ся так­же в со­став­ле­нии ро­до­слов­ных, осо­бен­но для срав­не­ния Y-хро­мо­сом. По­сколь­ку меж­ду STR и на­след­ствен­ны­ми ка­че­ства­ми нет ви­ди­мой свя­зи, об­ра­ще­ние к STR обыч­но не вы­зы­ва­ет спо­ров. Ком­мер­че­ские те­сты Y-хро­мо­сом — Y-DNA37, Y-DNA67 и Y-DNA111 — под­счи-
ты­ва­ют чис­ло по­вто­ров в 37, 67 и, со­от­вет­ствен­но, 111 ме­стах вдоль Y-хро­мо­со­мы. Чем выше циф­ра, тем боль­ше точ­ность и, сле­до­ва­тель­но, тем бли­же к со­вре­мен­но­сти мо­жет по­дой­ти ге­не­а­лог. Ком­про­мисс­ным ва­ри­ан­том с точ­ки зре­ния цены мо­жет быть ана­лиз сред­не­го ко­ли­че­ства STR, до­пол­нен­ный те­стом на так на­зы­ва­е­мые «сни­пы» — SNP.

Что та­кое SNP?

SNP (аб­бре­ви­а­ту­ра от ан­глий­ско­го «sin­gle nu­cleotide poly­mor­phism») — раз­ли­чие меж­ду дву­мя по­сле­до­ва­тель­но­стя­ми в один нук­лео­тид (одно азо­ти­стое ос­но­ва­ние). Чис­ло та­ких SNP, или, как их в про­сто­ре­чии на­зы­ва­ют, «сни­пов», опре­де­ля­ет раз­ли­чие меж­ду дву­мя по­сле­до­ва­тель­но­стя­ми ДНК. Вме­сто ис­сле­до­ва­ния всей ДНК мож­но про­ве­сти ана­лиз ка­ко­го-то ко­ли­че­ства та­ких от­ли­чий, так на­зы­ва­е­мый SNP-ана­лиз, это про­ще и де­шев­ле. Сни­пы уже дав­но при­ме­ня­ют­ся в ме­ди­цин-
ских ис­сле­до­ва­ни­ях, а те­перь пе­ре­шли и в ар­се­нал ге­не­а­ло­гов. SNP-те­стов ты­ся­чи, и преж­де чем де­лать за­каз, сто­ит по­со­ве­то­вать­ся со спе­ци­а­ли­стом, что­бы опре­де­лить, ка­кой тест наи­бо­лее ре­ле­ван­тен в каж­дом от­дель­ном слу­чае.

Что та­кое HVR1 и HVR2?

Со­кра­ще­ния для «hy­per­vari­able re­gion» 1 и 2. Это два неболь­ших участ­ка на­ших ми­то­хон­дрий, где му­та­ции про­ис­хо­дят чаще, чем в осталь­ной ДНК. Ис­сле­дуя эти участ­ки, мож­но опре­де­лить, в ка­кую ми­то­хон­дри­аль­ную гап­ло­груп­пу вхо­дит че­ло­век. Но этот ана­лиз дает очень при­бли­зи­тель­ную ин­фор­ма­цию и толь­ко о про­ис­хож­де­нии че­ло­ве­ка по ма­те­рин­ской ли­нии мно­го ты­сяч лет на­зад. Что­бы по­лу­чить дан­ные о бо­лее близ­ком к на­ше­му вре­ме­ни род­стве, тре­бу­ет­ся бо­лее пол­ный и по­дроб­ный ДНК-ана­лиз ми­то­хон­дрий.

Что та­кое CRS и rCRS?

Со­кра­ще­ния для Cam­bridge Ref­er­ence Se­quence, ис­поль­зу­ет­ся для срав­не­ния ми­то­хон­дри­аль­ных ДНК. При этом ис­сле­ду­ют, ка­кие му­та­ции от­ли­ча­ют­ся от пер­вой се­кве­ни­ро­ван­ной ми­то­хон­дри­аль­ной ДНК (пер­вое се­кве­ни­ро­ва­ние про­изо­шло в 1970–е годы в Кем­бри­дже). Усо­вер­шен­ство­ван­ный ва­ри­ант на­зы­ва­ет­ся rCRS — re­vised Cam­bridge Ref­er­ence Sys­tem.

Что та­кое RSRS?

Со­кра­щен­ное Re­vised Sapi­ens Ref­er­ence Se­quence; это но­вый спо­соб срав­не­ния ми­то­хон­дри­аль­ных ДНК. При­ме­ня­ет­ся с 2012 года. При срав­не­нии ис­хо­дят из по­сле­до­ва­тель­но­сти, ко­то­рую долж­на была иметь, по рас­че­там уче­ных, наша об­щая пра­ро­ди­тель­ни­ца, «ми­то­хон­дри­аль­ная Ева».

Что та­кое му­та­ции?

Му­та­ции — это слу­чай­ные из­ме­не­ния в мо­ле­ку­ле ДНК, ко­гда опре­де­лен­ные еди­ни­цы — азо­ти­стые ос­но­ва­ния — за­ме­ня­ют­ся, ис­че­за­ют или до­бав­ля­ют­ся. В каж­дом но­вом по­ко­ле­нии лю­дей про­ис­хо­дит око­ло трид­ца­ти но­вых му­та­ций. Чем стар­ше отец, тем боль­ше му­та­ций бу­дет у ре­бен­ка. В ми­то­хон­дри­ях одна му­та­ция в од­ной род­ствен­ной ли­нии про­ис­хо­дит в сред­нем раз в две ты­ся­чи лет.

Что озна­ча­ют циф­ры и бук­вы в ре­зуль­та­тах ана­ли­за моей ми­то­хон­дри­аль­ной ДНК?

Все это обо­зна­че­ния раз­ных ти­пов му­та­ций. «C40624T», на­при­мер, озна­ча­ет, что азо­ти­стое ос­но­ва­ние ци­то­зин © за­ме­ни­лось ти­ми­ном (Т) в по­зи­ции 40624. Если в на­ча­ле или в кон­це сто­ят А, Т или G, это озна­ча­ет, что эти ос­но­ва­ния тоже сме­ни­лись дру­ги­ми, по срав­не­нию с ре­фе­ренсной си­сте­мой (см. выше, CRS и rCRS).

Ино­гда по­сле букв и цифр сто­ит вос­кли­ца­тель­ный знак: «C40624T!». Это об­рат­ная му­та­ция. Зна­чит, в ис­ход­ной вер­сии у ми­то­хон­дри­аль­ной Евы или в Кем­бридж­ской ре­фе­ренсной по­сле­до­ва­тель­но­сти в этой по­зи­ции сто­я­ло имен­но Т. В бо­лее круп­ной гап­ло­груп­пе — «тол­стой вет­ке» ро­до­слов­но­го дре­ва — это ос­но­ва­ние за­ме­ни­лось дру­гим. Но имен­но та ве­точ­ка, в ко­то­рую вхо­дит ис­сле­до­ван­ная про­ба, по­том му­ти­ро­ва­ла об­рат­но, в ис­ход­ное Т.

Ино­гда на блан­ке с ре­зуль­та­та­ми ана­ли­за мож­но уви­деть, на­при­мер, «315,1» или «315+С». Это озна­ча­ет, что до­пол­ни­тель­ное азо­ти­стое ос­но­ва­ние — в дан­ном слу­чае С — до­ба­ви­лось по­сле по­зи­ции 315. Ан­то­ни­мич­ным на­пи­са­ни­ем бу­дет, на­при­мер, «315D». Здесь D озна­ча­ет delе­tion: азо­ти­стое ос­но­ва­ние в дан­ной по­зи­ции вы­па­ло.

Встре­ча­ют­ся и дру­гие обо­зна­че­ния раз­лич­ных част­ных ви­дов му­та­ций.


12 де­каб­ря в Куль­тур­ном цен­тре ЗИЛ прой­дет лек­ция Ка­рин Бойс и ге­не­раль­но­го ди­рек­то­ра ком­па­нии Genotek Ва­ле­рия Ильин­ско­го «Что мо­жет рас­ска­зать о нас ге­не­ти­ка?». Ме­ро­при­я­тие про­во­дит­ся при под­держ­ке По­соль­ства и Ге­не­раль­но­го кон­суль­ства Шве­ции, а так­же Швед­ско­го на­ци­о­наль­но­го со­ве­та по во­про­сам куль­ту­ры.

Генетика человека — Википедия

Гене́тика челове́ка — раздел генетики, изучающий закономерности наследования и изменчивости признаков у человека. Эту отрасль условно подразделяют на антропогенетику, изучающую наследственность и изменчивость нормальных признаков человеческого организма, и медицинскую генетику. Генетика человека связана также с эволюционной теорией, так как исследует конкретные механизмы эволюции человека и его место в природе, вместе с психологией, философией и социологией[1].

Изучение наследственности и изменчивости человека затруднено вследствие невозможности применить многие стандартные подходы генетического анализа. В частности, невозможно осуществить направленное скрещивание или экспериментально получить мутации. Человек является трудным объектом для генетических исследований также из-за позднего полового созревания и малочисленности потомства. Особенности человека как генетического объекта отражаются на наборе доступных методов исследования[2].

Генеалогический метод[править | править код]

В генетике человека вместо суперклассического гибридологического анализа применяют генеалогический метод, который состоит в анализе распределения в семьях (точнее, в родословных) лиц, обладающих данным признаком (или аномалией) и не обладающих им, что раскрывает тип наследования, частоту и интенсивность проявления признака и так далее. При анализе семейных данных получают также цифры эмпирического риска, то есть вероятность обладания признаком в зависимости от степени родства с его носителем. Генеалогическим методом уже показано, что более 1800 морфологических, биохимических и других признаков человека наследуется по законам Менделя. Многие признаки и болезни человека наследуются сцепленно с полом и обусловлены генами, локализованными в Х-хромосоме. Таких генов известно около 120. К ним относятся гены гемофилии А и В, недостаточности фермента глюкозо-6-фосфатдегидрогеназы, цветовой слепоты и другие.

Близнецовый метод[править | править код]

Другой метод — близнецовый. Однояйцевые близнецы (ОБ) развиваются из одной яйцеклетки, оплодотворённой одним спермием; поэтому их генотип идентичен. Разнояйцевые близнецы (РБ) развиваются из двух и более яйцеклеток, оплодотворённых разными спермиями; поэтому их генотипы различаются так же, как у братьев и сестёр (сибсов). Сравнение внутрипарных различий между ОБ и РБ позволяет судить об относительном значении наследственности и среды в определении свойств человеческого организма. В близнецовых исследованиях особенно важен показатель конкордантности, выражающий (в %) вероятность обладания данным признаком одним из членов пары ОБ или РБ, если его имеет другой член пары. Если признак детерминирован преимущественно наследственными факторами, то процент конкордантности намного выше у ОБ, чем у РБ. Например, конкордантность по группам крови, которые детерминированы только генетически, у ОБ равна 100 %. При шизофрении конкордантность у ОБ достигает 67 %, в то время как у РБ — 12,1 %; при врождённом слабоумии (олигофрении) — 94,5 % и 42,6 % соответственно. Подобные сравнения проведены в отношении ряда заболеваний. Исследования близнецов показывают, что вклад наследственности и среды в развитие самых разнообразных признаков различен и признаки развиваются в результате взаимодействия генотипа и внешней среды. Одни признаки обусловлены преимущественно генотипом, при формировании других признаков генотип выступает в качестве предрасполагающего фактора (или фактора, лимитирующего норму реакции организма на действия внешней среды).

Популяционно-статистический метод[править | править код]

Распространение мутаций среди больших групп населения изучает популяционная генетика человека, позволяющая составить карты распространения генов, определяющих развитие нормальных признаков и наследственных болезней. Особый интерес для этой генетики представляют изоляты — группы населения, в которых по каким-либо причинам (например, географическим, экономическим, социальным, религиозным) браки заключаются чаще между членами группы. Это приводит к повышению частоты кровного родства вступающих в брак, а значит, и вероятности того, что рецессивные гены перейдут в гомозиготное состояние и проявятся, что особенно заметно при малочисленности изолята.

Методами популяционной генетики пользуются органы здравоохранения для решения вопросов медицинского, медикаментозного и диагностического обеспечения населения. Данные популяционной генетики используются в практическом здравоохранении для расчета коечного фонда, количества необходимых специалистов, выделении финансов при организации лечебно-профилактической помощи при особо опасных, но редко встречающихся заболеваниях[3].

Цитогенетический метод[править | править код]

Широкое использование в генетике человека цитологических методов способствовало развитию цитогенетики, где основной объект исследования — хромосомы, то есть структуры клеточного ядра, в которых локализованы гены. Установлено (1956), что хромосомный набор в клетках тела человека (соматических) состоит из 46 хромосом, причём женский пол определяется наличием двух Х-хромосом, а мужской — Х-хромосомы и Y-xpoмосомы. В зрелых половых клетках находится половинное (гаплоидное) число хромосом. Митоз, мейоз и оплодотворение поддерживают преемственность и постоянство хромосомного набора как в ряду клеточных поколений, так и в поколениях организмов. В результате нарушений указанных процессов могут возникать аномалии хромосомного набора с изменением числа и структуры хромосом, что приводит к возникновению т. н. хромосомных болезней, которые нередко выражаются в слабоумии, развитии тяжёлых врождённых уродств, аномалий половой дифференцировки или обусловливают самопроизвольные аборты.

Дерматоглифический метод[править | править код]

Дерматоглифика — раздел медицинской генетики, изучающий наследственную обусловленность рисунков на коже кончиков пальцев, ладоней и подошв человека. Дерматоглифика может применяться для диагностики некоторых врождённых пороков развития, так как они сопровождаются характерным изменением не только рисунков пальцев и ладоней, но и основных сгибательных борозд на коже ладоней[4][3].

Рисунки кожных узоров строго индивидуальны и наследственно обусловлены. Процесс образования папиллярного рельефа пальцев, ладоней и стоп происходит в течение 3-6 месяца внутриутробного развития. В процессе формирования гребней на коже выделяют 3 этапа. Первый (подготовительный этап): на 8-10 неделе беременности происходит накопление индукторов и репрессоров для «запуска» генов, детерминирующих гребнеобразование и формирование папиллярных рисунков. Второй этап: на 10-24-й неделе наблюдаются генетически обусловленное формирование гребней и папиллярных узоров. Третий этап: с 24-й недели до момента рождения происходит формирование кожи как тактильного органа[3].

Успехи в развитии генетики человека сделали возможными предупреждение и лечение наследственных заболеваний. Один из эффективных методов их предупреждения — медико-генетическое консультирование с предсказанием риска появления больного в потомстве лиц, страдающих данным заболеванием или имеющих больного родственника. Достижения биохимической генетики человека раскрыли первопричину (молекулярный механизм) многих наследственно обусловленных дефектов, аномалий обмена веществ, что способствовало разработке методов экспресс-диагностики, позволяющих быстро и рано выявлять больных, и лечения многих прежде неизлечимых наследственных болезней. Чаще всего лечение состоит во введении в организм веществ, не образующихся в нём вследствие генетического дефекта, или в составлении специальных диет, из которых устранены вещества, оказывающие токсическое действие на организм в результате наследственно обусловленной неспособности к их расщеплению. Многие генетические дефекты исправляются с помощью своевременного хирургического вмешательства или педагогической коррекции. Практические мероприятия, направленные на поддержание наследственного здоровья человека, на охрану генофонда человечества, осуществляются через систему медико-генетических консультаций. Их основная цель — информировать заинтересованных лиц о вероятности риска появления в потомстве больных. К медико-генетическим мероприятиям относится также пропаганда генетических знаний среди населения, так как это способствует более ответственному подходу к деторождению. Медико-генетическая консультация воздерживается от мер принудительного или поощрительного характера в вопросах деторождения или вступления в брак, принимая на себя лишь функцию информации. Большое значение имеет система мер, направленных на создание наилучших условий для проявления положительных наследственных задатков и предотвращение вредных воздействий среды на наследственность человека.

Генетика человека представляет собой естественнонаучную основу борьбы с расизмом, убедительно показывая, что расы — это формы адаптации человека к конкретным условиям среды (климатическим и иным), что они отличаются друг от друга не наличием «хороших» или «плохих» генов, а частотой распространения обычных генов, свойственных всем расам. Генетика человека показывает, что все расы равноценны (но не одинаковы) с биологической точки зрения и обладают равными возможностями для развития, определяемого не генетическими, а социально-историческими условиями. Констатация биологических наследственных различий между отдельными людьми или расами не может служить основанием для каких-либо выводов морального, юридического или социального порядка, ущемляющих права этих людей или рас.

Примеры доминантных и рецессивных признаков у людей
Части тела Доминантный признак Рецессивный признак
Глаза Большие Маленькие
Разрез глаз прямой Разрез глаз косой
Монголоидный тип глаз Европеоидный тип глаз
Верхнее веко нависающее Верхнее веко нормальное
Длинные ресницы Короткие ресницы
Близорукость Норма
Дальнозоркость Норма
Астигматизм Норма
Карие (светло-карие и зеленые) Серые или голубые
Предрасположенность к катаракте Норма
Куриная слепота (ослабленное зрение в сумерках) Норма
Рот Способность загибать язык назад Нет
Способность свертывать язык трубочкой Нет
Зубы при рождении Отсутствие зубов при рождении
Выступающие вперед зубы и челюсти Зубы и челюсти не выступают
Щель между резцами Отсутствует
Предрасположенность к кариесу зубов Норма
Полные губы Тонкие губы
Габсбургская губа Норма
Лицо и голова Короткий череп (брахицефалия) Длинный (долихоцефалия)
Лицо круглое Продолговатое
Подбородок прямой Скошенный подбородок
Ямочка на подбородке Гладкий подбородок
Ямочки на щеках Гладкие щеки
Выдающиеся скулы Норма
Веснушки Отсутствие веснушкек
Подбородок длинный Короткий
Подбородок широкий Узкий и острый
Голос Сопрано у женщин Альт
Бас у мужчин Тенор
Нос Крупный Средней величины или маленький
Узкий, острый, выступающий вперед Широкий
Высокая и узкая переносица Низкая и широкая переносица
Нос с горбинкой Прямая или согнутая переносица
Кончик носа направлен прямо Курносый нос
Широкие ноздри Узкие ноздри
Уши Свободная мочка Приросшая мочка
Острая верхушка уха (дарвиновский бугорок имеется) Отсутствует
Лопоухость Норма
Слух Абсолютный музыкальный слух Слух отсутствует
Волосы Темные Светлые
Нерыжие Рыжие
Курчавые Волнистые
Волнистые Прямые
Шерстистые Гладкие
Облысение (у мужчин) Норма
Норма Облысение (у женщин)
Белая прядь Норма
«Мыс вдовы» Норма
Преждевременное поседение Норма
Обильная волосатость тела Мало волос на теле
Широкие пушистые брови Норма
Синофриз Норма
Руки Праворукость Леворукость
Указательный палец руки длиннее безымянного (у мужчин) Указательный палец руки длиннее безымянного (у женщин)
Большой палец руки толстый и короткий (расплющенный) Нормальное строение пальца (нормальной длины, равномерной толщины, не широкий)
Ногти тонкие и плоские Нормальные
Ногти очень твердые Нормальные
Узоры на коже пальцев эллиптические Узоры на коже пальцев циркулярные
Ноги Предрасположенность к варикозному расширению вен Норма
Второй палец ноги длиннее большого Второй палец ноги короче
Повышенная подвижность большого пальца Норма
Кожа Смуглая кожа Светлая кожа
Пегая пятнистость (белопегость) Нормальный цвет кожи
Пигментированное пятно в области крестца Отсутствует
Кожа толстая Кожа тонкая
Кровь Группы крови А, В и АВ Группа крови О
Наличие резус-фактора (Rh+) Отсутствие резус-фактора (Rh-)
Обмен веществ Ощущение вкуса фенилтиомочевины Неспособность ощущать вкус фенилтиомочевины
Способность к секреции в слюну агглютининов (т. н. «секреторы») Отсутствие этого признака
Способность выделять в мочу после приема пищи метанэтиола (спаржи), бетанина (свеклы), β-аминоизомасляной кислоты (продукт катаболизма тимина) Отсутствие этих признаков
Склонность к ожирению Отсутствует
Наследственные заболевания рецессивного типа Норма Фенилкетонурия
Норма Предрасположенность к шизофрении
Норма Предрасположенность к сахарному диабету
Норма Парагемофилия (склонность к кожным и носовым кровотечениям)
Норма Альбинизм
Норма Пигментная ксеродерма
Норма Врожденная глухонемота
Норма Отсутствие резцов и клыков на верхней челюсти
Норма Серповидноклеточная анемия
Норма Талассемия
Норма Муковисцидоз
Норма Цистофиброз
Норма Тританопия
Норма Анэнцефалия
Наследственные заболевания доминантного типа Полидактилия Норма
Брахидактилия Норма
Синдактилия Норма
Элиптоцитоз Норма
Арахнодактилия Норма
Ахондроплазия Норма
Ключично-черепной дизостоз Норма
Отсутствие малых коренных зубов Норма
Нейрофиброматоз Норма
Некоторые формы аниридии Норма
Краниосиностоз Норма
Миоплегия Норма
Склонность к подагре Норма
Гиперхолестеринемия Норма
Множественная телеангиэктазия Норма
  1. Супотницкий М. В. Словарь генетических терминов. — М: Вузовская книга, 2007. — 508 с. — (Словари. Справочники). — ISBN 5-9502-0201-5.
  2. Инге-Вечтомов С.Г. Генетика с основами селекции: учебник для студентов высших учебных заведений / С. Г. Инге-Вечтомов. — СПб.: Изд-во Н-Л, 2010. — С. 597—658. — 720 с. — ISBN 978-5-94869-105-3.
  3. 1 2 3 О.-Я.Л.Бекиш. Медицинская биология. — Минск: Ураджай, 2000. — С. 171—173. — 518 с.
  4. Schaumann B., Alter M. Dermatoglyphics in medical disorders. — Springer Science & Business Media, 1976. — ISBN 978-3-642-51622-1.

Сколько у нас генов?

Юлия Макарова,
кафедра биотехнологии Сеченовского университета (Москва)
«Химия и жизнь» №4, 2019

После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалась непростой. Точное число неизвестно до сих пор, и все же оценки становятся все более достоверными.

«Геном человека» завершен, поиск генов продолжается

В 1977 году Фредерик Сэнгер разработал метод определения нуклеотидной последовательности ДНК (секвенирования), который используется и по сей день (см. «Химию и жизнь» № 8, 2018). В 1995 году был расшифрован первый геном бактерии Haemophilis influenza, в 1996 году — геном эукариотической клетки (дрожжей Saccharomyces cerevisiae), а в 1998 году — геном нематоды Caenorhabditis elegans.

Конечно, на рубеже тысячелетий все с нетерпением ждали результатов проекта «Геном человека», который продолжался с 1990 по 2003 год. Его задачей было определение нуклеотидной последовательности ДНК человека и — главное! — локализация человеческих генов (изначально предполагалось, что их около 100 000). Биомедицинская наука вот-вот должна была получить бесценный инструмент: полный список генов, необходимых для расшифровки молекулярных механизмов возникновения и развития тяжелых болезней — рака, шизофрении, деменции и многих других. О подготовке «черновой» версии генома человека торжественно объявили летом 2000 года, опубликована она была в 2001-м. «Геном человека» официально завершил свою работу в 2003 году и 27 мая 2004 года опубликовал полную последовательность генома.

«Полной» ее можно было назвать с некоторыми оговорками. Прежде всего, секвенировалась только ДНК в составе эухроматина, то есть такая ДНК, которая между делениями клетки пребывает в неплотно упакованном состоянии. Примерно 8% человеческого генома — это гетерохроматин, компактно уложенная ДНК, она приходится в основном на районы центромер и теломер (то есть концов хромосом и участков, к которым прикрепляются нити веретена деления). С другой стороны, эти 8% ДНК и менее интересны, чем остальные 92, поскольку они крайне слабо транскрибируются, то есть содержат относительно мало генов. (Напомним, что транскрипция — это синтез РНК на матрице ДНК, а что дальше происходит с РНК, разберем чуть позже.) К тому же они богаты повторами, что затрудняет сборку непрерывной последовательности из прочтенных фрагментов. «Белые пятна» в геноме человека продолжают заполнять до сих пор: на начало 2019 года разрывов все еще больше 500, и в основном это те же центромерные и концевые области хромосом. Те, кому интересно, как продвигается дело, могут следить за процессом в Сети, на сайте международной организации, которая занимается эталонными геномами, — Genome Reference Consortium.

Считалось, что секвенирование генома человека позволит определить локализацию каждого гена и их общее количество. Однако сегодня существует несколько баз данных генов, которые в значительной мере отличаются друг от друга.

С генами, кодирующими белки, удалось достичь некоторой ясности. Их оказалось гораздо меньше 100 000. В 2010 году по инициативе Организации по изучению протеома человека (HUPO — Human Proteome Organization) запущен одноименный проект — «Протеом человека», который должен составить полный список человеческих белков.

Какие факты позволяют утверждать, что определенный участок генома — это ген белка? Возможно, у нас есть белок, последовательность аминокислот в котором соответствует последовательности нуклеотидных триплетов в этом участке, и (или) имеются другие доказательства. Например, известна матричная РНК (мРНК) — молекула РНК, которая синтезируется в ходе транскрипции на матрице ДНК и, в свою очередь, становится матрицей для белка. Кстати, одна и та же мРНК может кодировать несколько белков за счет альтернативного сплайсинга — различных вариантов сшивания ее кодирующих участков. Вообще, белков у человека больше, чем белок-кодирующих генов. В рамках проекта «Протеом человека» предполагается идентифицировать и охарактеризовать не менее одного белка, считываемого с каждого гена, описать однонуклеотидные полиморфизмы (отличия в одну «букву») в этих генах, а также варианты сплайсинга мРНК и посттрансляционной модификации белков.

Однако есть и другие способы. Сейчас довольно много известно о том, какими признаками должны обладать гены белка, и существуют программы, которые ищут их in silico — в компьютере, с помощью анализа генома. Подсказкой может служить и то, что гены разных видов эукариот в силу общности эволюционного происхождения сходны между собой (гомологичны), и если мы видим последовательность, которая у другого живого существа кодировала белок, — возможно, она кодирует белок и у человека.

Данные, полученные в рамках проекта «Протеом человека», представлены в аннотированных базах знаний, таких как neXtProt. Белки делятся на пять групп, по достоверности наших сведений об их существовании — PE1, 2, 3, 4, 5 (PE означает protein existence). В марте 2019 года neXtProt содержала информацию о 17694 белках, существование которых экспериментально подтверждено, 1548 белках, для которых известны мРНК, 510 — определенных на основании гомологии с другими белками, 71 белке, предсказанном по последовательности ДНК, без других доказательств, и 576 сомнительных белках, относительно которых неясно, существуют они или нет.

Особый интерес вызывают белки, чье существование экспериментально не доказано, — так называемые потерянные (missing) белки. К этой категории относят все вышеперечисленные группы, кроме первой либо первой и последней. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia.

Не только белки

Но белками все не исчерпывается. Проект «Геном человека» показал, что кроме матричных, транспортных и рибосомных РНК существует еще множество типов РНК, не менее важных для жизни.

РНК подразделяются на некодирующие РНК (нкРНК), которые не транслируются в белки, и кодирующие, или матричные РНК (мРНК), служащие матрицей для синтеза белков. У некодирующих РНК более сложная классификация. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК известны нам из школьных учебников — это рибосомные РНК (рРНК) и транспортные РНК (тРНК). Молекулы рРНК составляют основу рибосомы — молекулярной машины, которая и строит белок на матричной РНК (проводит трансляцию). Последовательность из трех нуклеотидов в мРНК указывает, какую аминокислоту следуют включить в белок. Молекулы тРНК приносят указанные аминокислоты на рибосомы в ходе трансляции.

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют важные функции (см. таблицу 1). По сравнению с генами белков, длина которых обычно измеряется в килобазах — тысячах пар нуклеотидов, а точнее, в десятках и сотнях тысяч пар, они совсем маленькие (что не облегчает поиск их генов). Но рычажку «вкл.—выкл.» и не надо быть большим.

Таблица 1. Некодирующие регуляторные РНК

Название Длина
(нуклеотиды)
Функции
Длинные некодирующие РНК (днкРНК, lncRNA) 200 1. Регулируют избирательное метилирование ДНК
2. Руководят избирательной посадкой на хроматин белковых комплексов, подавляющих активность генов
Малые РНК
Малые ядерные РНК (мяРНК, snRNA) 150 1. Участвуют в сплайсинге
2. Регулируют активность факторов транскрипции
3. Поддерживают целостность теломер
Малые ядрышковые РНК (мякРНК, snoRNA) 60–300 1. Участвуют в химической модификации рРНК, тРНК и мяРНК
2. Возможно, участвуют в стабилизации структуры рРНК и защите от действия ферментов гидролаз
Малые интерферирующие РНК (миРНК, siRNA) 21–22 1. Обеспечивают антивирусную иммунную защиту
2. Подавляют активность собственных генов
МикроРНК (мкРНК, miRNA) 18–25 Подавляют трансляцию путем РНК-интерференции
Антисмысловые РНК (asRNA) 1. Короткие: менее 200
2. Длинные: более 200
Блокируют трансляцию, образуя гибриды с мРНК
РНК, связанные с белками Piwi (piRNA, piwiRNA) 26–32 Их называют «стражами генома», они подавляют активность мобильных генетических элементов во время эмбриогенеза

Таким образом, прежде чем ответить на вопрос: «Сколько у нас генов?», необходимо понять, что «ген» может кодировать не только белок. Собственно, это ясно уже давно. Основное внимание проекта «Геном человека» было направлено на белок-кодирующие гены. Однако уже в первом докладе о геноме, опубликованном в 2001 году, сказано, что «тысячи генов человека продуцируют некодирующие РНК (нкРНК), являющиеся их конечным продуктом», хотя на тот момент было известно лишь около 706 генов нкРНК.

Стивен Зальцберг из Университета Джонса Хопкинса в своей статье, посвященной как раз проблеме подсчета человеческих генов, дает следующее определение: «Ген — любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок». Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, но исключает псевдогены — нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Публикация проекта «Геном человека» 2001 года оценила количество белок-кодирующих генов в 31 000, а группа под руководством Крейга Вентера (которая успешно соперничала с международным проектом), назвала «точное» число 26 588. В 2004 году, после завершения официального проекта предполагаемое число белок-кодирующих генов снизилось до 24 000. Каталог человеческих генов Ensembl (версия 34d) на тот момент включал 22 287 белок-кодирующих генов и 34 214 транскриптов. Скорее всего, мы не ошибемся, если скажем, что генов, кодирующих белки, у человека около 20 000 или чуть больше. Но что с генами РНК?

Новое секвенирование и базы данных

Исследовать многообразие РНК не так просто по многим причинам, от их высокой лабильности до малых размеров. Однако появление высокопроизводительных методов параллельного секвенирования (когда миллионы фрагментов ДНК из одного образца читаются одновременно), оно же секвенирование нового поколения (next-generation sequencing, NGS), значительно ускорило поиск функциональных участков генома.

Различные платформы для NGS позволяют читать от миллиона до десятков миллиардов коротких последовательностей (отсеквенированные «за один проход» участки называют ридами, от английского read) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся Illumina и IonTorrent, и все больше внимания привлекают к себе платформы для секвенирования единичных молекул — Pacific Biosciences, нанопоровое секвенирование Oxford Nanopore, Helicos Biosciences HeliScope (компания Helicos объявлена банкротом, но технология лицензирована другим компаниям). Последним не нужно нарабатывать много копий ДНК для секвенирования — они действительно работают с отдельными молекулами! Другой их важный плюс в том, что они позволяют прочитывать значительно более длинные риды, до 10–60 тысяч нуклеотидов. Именно благодаря этому качеству, например, метод нанопорового секвенирования с успехом применили для секвенирования богатого повторами центромерного участка Y-хромосомы человека.

Кроме того, появились методы секвенирования РНК — сначала через создание ДНК-копий, а потом и прямые. Изначально они создавались для количественного определения экспрессии генов, но также способствовали обнаружению ранее не известных РНК, как кодирующих, так и не кодирующих.

Благодаря методам NGS базы данных генов lncRNA и других РНК всего за десятилетие резко выросли, и каталоги генов человека теперь содержат больше генов РНК, чем генов белков. Кроме того, секвенирование РНК позволило установить, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции происходят гораздо чаще, чем полагали, и затрагивают до 95% человеческих генов. Следовательно, даже когда мы узнаем местоположение всех генов в геноме, нужно будет выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или просто представляют собой ошибки сплайсинга.

Задача по составлению каталога всех генов по-прежнему не решена. В последние 15 лет только две исследовательские группы составляют, корректируют и пополняют список генов: RefSeq и Ensembl / Gencode. Первая поддерживается Национальным центром биотехнологической информации при Национальных институтах здравоохранения США, вторая — Европейской молекулярно-биологической лабораторией. Кстати, Gencode — подпроект консорциума ENCODE, «масштабной научной экспедиции в пустыни генома, не кодирующего белки» (см. «Химию и жизнь» № 10, 2012). В этих каталогах есть сотни различий по белок-кодирующим генам, тысячи — по генам длинных некодирующих РНК; имеются существенные расхождения и в других группах (см. таблицу 2).

Таблица 2. Количество разных типов генов в базах данных Gencode, RefSeq, CHESS

Типы генов Gencode RefSeq CHESS
Белок-кодирующие гены 19 901 20 345 21 306
Гены длинных некодирующих РНК 15 779 17 712 18 484
Антисмысловые РНК 5501 28 2694
Другие некодирующие РНК 2213 13 899 4347
Псевдогены 14 723 15 952
Общее число транскриптов (видов РНК) 203 835 154 484 323 827

По: BMC Biology, 2018, 16:94

В 2017 году сотрудники Университета Джонса Хопкинса под руководством Стивена Зальцберга создали еще одну базу данных генов человека — CHESS. Они использовали данные глубокого секвенирования РНК, чтобы заново получить информацию о всех продуктах транскрипции в разнообразных тканях человеческого организма, и отмечают, что существенно пополнили списки генов. Примечательно, что новая база включает все белок-кодирующие гены как Gencode, так и RefSeq, поэтому пользователям CHESS не нужно решать, какую базу данных они предпочитают. Создатели CHESS отмечают, что более обширная база с большей вероятностью содержит последовательности, ошибочно отнесенные к генам, но лучше потом удалить такую последовательность, чем пропустить существующий ген.

Итак, все еще неизвестно, сколько всего генов у человека. Существуют проблемы, затрудняющие получение точного ответа. Например, многие гены (особенно гены lncRNA), видимо, имеют высокую тканеспецифичность. Во всех клетках один и тот же геном, однако в разных тканях транскрибируются различные гены, не только белков, но и регуляторных РНК. А значит, пока ученые подробно не исследуют все типы клеток человека, они не могут быть уверены, что обнаружили все человеческие гены. И все же сегодня знания о человеческих генах значительно обширнее, чем в начале проекта «Геном человека», а технологии совершеннее. Это дает надежду на то, что в скором времени мы узнаем точный ответ на поставленный вопрос. А пока ограничимся приблизительными данными: чуть более 20 тысяч генов белков, а вместе с генами РНК — возможно, 200–300 тысяч, но, может быть, и меньше.

Где находится днк человека, клетка содержит днк в

Где находится днк человека ? клетка содержит днк в :

Геном человека – это полный набор генетической информации для людей (Homo Sapiens Sapiens). Эта информация кодируется как ДНК-последовательности в пределах пары хромосом 23 в ядрах клеток и в небольшой молекуле ДНК, найденной в отдельных митохондриях. Геном человека включают в себя белок-кодирующие гены ДНК и некодирующие ДНК. Гаплоидных генома человека (содержащиеся в яйце и сперматозоидов) состоят из трех миллиардов пар оснований ДНК, в то время как диплоидные геномы (найдены в соматических клетках) имеют в два раза меньше ДНК.

В то время как существуют значительные различия между геномами человека лиц (порядка 0,1%), это значительно меньше, чем различия между людьми и их ближайших родственников, шимпанзе (примерно 4%).

Проект «Геном человека» уже много лет пытается дать ответ на вопрос где находится днк человека. И вот уже получены первые полные последовательности отдельных геномов человека. По состоянию на 2012, тысячи геномов человека были полностью исследованы, и многое другое были нанесены на карту на более низких уровнях разрешения. Полученные данные используются во всем мире в области биомедицины, антропологии, судебной медицины и других отраслях науки.

Существует широко распространенное ожидание того, что геномные исследования приведут к достижениям в области диагностики и лечения заболеваний, а также новых идей во многих областях биологии, в том числе эволюции человека.

Хотя последовательность генома человека была почти полностью исследована путем секвенирования ДНК, она еще не полностью изучена. Большинство (хотя, вероятно, не все) гены были идентифицированы с помощью комбинации с высокой пропускной способностью экспериментальных и биоинформатических подходов, но многое еще предстоит сделать для дальнейшего выяснения биологических функций белковых и РНК продуктов.


Смотрите также

Описание: