Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.
Дезоксирибонуклеи́новая кислота́ (ДНК) — макромолекула (одна из трёх основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования организмов. Молекула ДНК хранит биологическую информацию в виде генетического кода, состоящего из последовательности нуклеотидов[1]. ДНК содержит информацию о структуре различных видов РНК и белков.
В клетках эукариот (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органеллах (митохондриях и пластидах). В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У прокариот и у низших эукариот (например дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами. Кроме того, одно- или двухцепочечные молекулы ДНК могут образовывать геном ДНК-содержащих вирусов.
С химической точки зрения ДНК — длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в полимерной цепи образуются за счёт дезоксирибозы и фосфатной группы (фосфодиэфирные связи).
В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух нуклеотидных цепей. В нуклеотидах, входящих в состав ДНК, встречаются четыре азотистых основания: аденин (A), гуанин (G), тимин (T) и цитозин (C). Азотистые основания одной цепи соединены с азотистыми основаниями другой цепи водородными связями, обеспечивая таким образом связь двух цепей макромолекулы ДНК друг с другом. Азотистые основания образуют связи попарно согласно принципу комплементарности: аденин (A) соединяется только с тимином (T), гуанин (G) — только с цитозином (C) .
Двухцепочечная молекула ДНК закручена по винтовой линии. Структура молекулы ДНК в целом получила традиционное, но ошибочное название «двойной спирали»: на самом деле, она является «двойным винтом». Винтовая линия может быть правой (A- и B-формы ДНК) или левой (Z-форма ДНК)[2]. Формы ДНК также различаются по диаметру, количеству оснований на виток спирали и шагу спирали[3][4] .
Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и далее принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК содержит последовательности, выполняющие в клетках регуляторные и структурные функции. Кроме того, в геноме эукариот часто встречаются участки, принадлежащие «генетическим паразитам», например транспозонам.
Расшифровка структуры ДНК (1953 год) стала одним из поворотных моментов в истории биологии. За выдающийся вклад в это открытие Фрэнсису Крику, Джеймсу Уотсону и Морису Уилкинсу была присуждена Нобелевская премия по физиологии или медицине 1962 года. Розалинд Франклин, получившая рентгенограммы, без которых Уотсон и Крик не имели бы возможность сделать выводы о структуре ДНК, умерла в 1958 году от рака (Нобелевскую премию не дают посмертно)[5].
ДНК как химическое вещество была выделена Иоганном Фридрихом Мишером в 1869 году из остатков клеток, содержащихся в гное. Он выделил вещество, в состав которого входят азот и фосфор. Вначале новое вещество получило название нуклеин, а позже, когда Мишер определил, что это вещество обладает кислотными свойствами, вещество получило название нуклеиновая кислота[6]. Биологическая функция новооткрытого вещества была неясна, и долгое время ДНК считалась запасником фосфора в организме. Более того, даже в начале XX века многие биологи считали, что ДНК не имеет никакого отношения к передаче информации, поскольку строение молекулы, по их мнению, было слишком однообразным и не могло содержать закодированную информацию.
До 1930-х годов считалось, что ДНК содержится только в животных клетках, а в растительных — РНК. В 1934 году в журнале «Hoppe-Seyler’s Zeitschrift für physiologishe Chemie»[7], затем в 1935 году в «Учёных записках МГУ»[8] вышли статьи советских биохимиков А. Н. Белозерского и А. Р. Кизеля, в которых доказывалось присутствие ДНК в растительных клетках. В 1936 году группой Белозерского ДНК была выделена из семян и тканей бобовых, злаковых и других растений[9]. Результатом исследований этой же группы советских учёных в 1939—1947 годах стала первая в мировой научной литературе информация о содержании нуклеиновых кислот у различных видов бактерий.
Постепенно было доказано, что именно ДНК, а не белки, как считалось раньше, является носителем генетической информации. Одно из первых решающих доказательств принесли эксперименты Освальда Эвери, Колина Маклауда и Маклина Маккарти (1944 г.) по трансформации бактерий. Им удалось показать, что за так называемую трансформацию (приобретение болезнетворных свойств безвредной культурой в результате добавления в неё мёртвых болезнетворных бактерий) отвечает выделенная из пневмококков ДНК. Эксперимент американских учёных Алфреда Херши и Марты Чейз[англ.] (эксперимент Херши — Чейз, 1952 г.) с помеченными радиоактивными изотопами белками и ДНК бактериофагов показали, что в заражённую клетку передаётся только нуклеиновая кислота фага, а новое поколение фага содержит такие же белки и нуклеиновую кислоту, как исходный фаг[10].
Вплоть до 1950-х годов точное строение ДНК, как и способ передачи наследственной информации, оставалось неизвестным. Хотя и было доподлинно известно, что ДНК состоит из нескольких цепочек, состоящих из нуклеотидов, никто не знал точно, сколько этих цепочек и как они соединены.
В результате работы группы биохимика Эрвина Чаргаффа в 1949—1951 гг. были сформулированы так называемые правила Чаргаффа. Чаргаффу и сотрудникам удалось разделить нуклеотиды ДНК при помощи бумажной хроматографии и определить точные количественные соотношения нуклеотидов разных типов. Соотношение, выявленное для аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), оказалось следующим: количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц[11][12]. Эти правила, наряду с данными рентгеноструктурного анализа, сыграли решающую роль в расшифровке структуры ДНК.
Структура двойной спирали ДНК была предложена Френсисом Криком и Джеймсом Уотсоном в 1953 году на основании рентгеноструктурных данных, полученных Морисом Уилкинсом и Розалинд Франклин, и правил Чаргаффа[13]. Позже предложенная Уотсоном и Криком модель строения ДНК была доказана, а их работа отмечена Нобелевской премией по физиологии или медицине 1962 г. Среди лауреатов не было скончавшейся к тому времени от рака Розалинд Франклин, так как премия не присуждается посмертно[14].
Интересно, что в 1957 году американцы Александер Рич, Гэри Фелзенфелд и Дэйвид Дэйвис описали нуклеиновую кислоту, составленную тремя спиралями[15]. А в 1985—1986 годах Максим Давидович Франк-Каменецкий в Москве показал, как двухспиральная ДНК складывается в так называемую H-форму, составленную уже не двумя, а тремя нитями ДНК[16][17].
Дезоксирибонуклеиновая кислота (ДНК) представляет собой биополимер (полианион), мономером которого является нуклеотид[18][19].
Каждый нуклеотид состоит из остатка фосфорной кислоты, присоединённого по 5'-положению к сахару дезоксирибозе, к которому также через гликозидную связь (C—N) по 1'-положению присоединено одно из четырёх азотистых оснований. Именно наличие характерного сахара и составляет одно из главных различий между ДНК и РНК, зафиксированное в названиях этих нуклеиновых кислот (в состав РНК входит сахар рибоза)[20]. Пример нуклеотида — аденозинмонофосфат, у которого основанием, присоединённым к фосфату и рибозе, является аденин (A) (показан на рисунке).
Исходя из структуры молекул, основания, входящие в состав нуклеотидов, разделяют на две группы: пурины (аденин [A] и гуанин [G]) образованы соединёнными пяти- и шестичленным гетероциклами; пиримидины (цитозин [C] и тимин [T]) — шестичленным гетероциклом[21].
В виде исключения, например, у бактериофага PBS1, в ДНК встречается пятый тип оснований — урацил ([U]), пиримидиновое основание, отличающееся от тимина отсутствием метильной группы на кольце, обычно заменяющее тимин в РНК[22].
Тимин (T) и урацил (U) не так строго приурочены к ДНК и РНК соответственно, как это считалось ранее. Так, после синтеза некоторых молекул РНК значительное число урацилов в этих молекулах метилируется с помощью специальных ферментов, превращаясь в тимин. Это происходит в транспортных и рибосомальных РНК[23].
Полимер ДНК обладает довольно сложной структурой. Нуклеотиды соединены между собой ковалентно в длинные полинуклеотидные цепи. Эти цепи в подавляющем большинстве случаев (кроме некоторых вирусов, обладающих одноцепочечными ДНК-геномами) попарно объединяются при помощи водородных связей во вторичную структуру, получившую название двойной спирали[13][20]. Остов каждой из цепей состоит из чередующихся фосфатов и сахаров[24]. Внутри одной цепи ДНК соседние нуклеотиды соединены фосфодиэфирными связями, которые формируются в результате взаимодействия между 3'-гидроксильной (3'—ОН) группой молекулы дезоксирибозы одного нуклеотида и 5'-фосфатной группой (5'—РО3) другого. Асимметричные концы цепи ДНК называются 3' (три прайм) и 5' (пять прайм). Полярность цепи играет важную роль при синтезе ДНК (удлинение цепи возможно только путём присоединения новых нуклеотидов к свободному 3'-концу).
Как уже было сказано выше, у подавляющего большинства живых организмов ДНК состоит не из одной, а из двух полинуклеотидных цепей. Эти две длинные цепи закручены одна вокруг другой в виде двойной спирали, стабилизированной водородными связями, образующимися между обращёнными друг к другу азотистыми основаниями входящих в неё цепей. В природе эта спираль, чаще всего, правозакрученная. Направления от 3'-конца к 5'-концу в двух цепях, из которых состоит молекула ДНК, противоположны (цепи «антипараллельны» друг другу).
Диаметр двойной спирали составляет от 22 до 24 Å, или 2,2—2,4 нм, длина каждого нуклеотида — 3,3 Å (0,33 нм)[25]. Подобно тому, как в винтовой лестнице сбоку можно увидеть ступеньки, на двойной спирали ДНК в промежутках между фосфатным остовом молекулы можно видеть рёбра оснований, кольца которых расположены в плоскости, перпендикулярной по отношению к продольной оси макромолекулы.
В двойной спирали различают малую (12 Å) и большую (22 Å) бороздки[26]. Белки, например, факторы транскрипции, которые присоединяются к определённым последовательностям в двухцепочечной ДНК, обычно взаимодействуют с краями оснований в большой бороздке, где те более доступны[27].
Каждое основание на одной из цепей связывается с одним определённым основанием на второй цепи. Такое специфическое связывание называется комплементарным. Пурины комплементарны пиримидинам (то есть способны к образованию водородных связей с ними): аденин образует связи только с тимином, а цитозин — с гуанином. В двойной спирали цепочки также связаны с помощью гидрофобных взаимодействий и стэкинга, которые не зависят от последовательности оснований ДНК[28].
Комплементарность двойной спирали означает, что информация, содержащаяся в одной цепи, содержится и в другой цепи. Обратимость и специфичность взаимодействий между комплементарными парами оснований важна для репликации ДНК и всех остальных функций ДНК в живых организмах.
Так как водородные связи нековалентны, они легко разрываются и восстанавливаются. Цепочки двойной спирали могут расходиться как замок-молния под действием ферментов (хеликазы) или при высокой температуре[29]. Разные пары оснований образуют разное количество водородных связей. АТ связаны двумя, ГЦ — тремя водородными связями, поэтому на разрыв ГЦ требуется больше энергии. Процент ГЦ-пар и длина молекулы ДНК определяют количество энергии, необходимой для диссоциации цепей: длинные молекулы ДНК с большим содержанием ГЦ более тугоплавки[30]. Температура плавления нуклеиновых кислот зависит от ионного окружения, рост ионной силы стабилизирует ДНК по отношению к денатурированию. При добавлении к ДНК хлорида натрия существует линейная зависимость между температурой плавления и логарифмом ионной силы раствора. Предполагается, что добавление электролита ведёт к экранированию зарядов в цепях ДНК и этим уменьшает силы электростатического отталкивания между заряженными фосфатными группами, способствуя жёсткости структуры. Аналогично температуру плавления ДНК повышают ионы марганца, кобальта, цинка и никеля, но ионы меди, кадмия и свинца, напротив, понижают её[31].
Части молекул ДНК, которые из-за их функций должны быть легко разделяемы, например, ТАТА последовательность в бактериальных промоторах, обычно содержат большое количество А и Т.
Азотистые основания в составе ДНК могут быть ковалентно модифицированы, что используется при регуляции экспрессии генов. Например, в клетках позвоночных метилирование цитозина с образованием 5-метилцитозина используется соматическими клетками для передачи профиля генной экспрессии дочерним клеткам. Метилирование цитозина не влияет на спаривание оснований в двойной спирали ДНК. У позвоночных метилирование ДНК в соматических клетках ограничивается метилированием цитозина в последовательности ЦГ[32]. Средний уровень метилирования отличается у разных организмов, так, у нематоды Caenorhabditis elegans метилирование цитозина не наблюдается, а у позвоночных обнаружен высокий уровень метилирования — до 1 %[33]. Другие модификации оснований включают метилирование аденина у бактерий и гликозилирование урацила с образованием «J-основания» в кинетопластах[34].
Метилирование цитозина с образованием 5-метилцитозина в промоторной части гена коррелирует с его неактивным состоянием[35]. Метилирование цитозина важно также для инактивации Х-хромосомы у млекопитающих[36]. Метилирование ДНК используется в геномном импринтинге[37]. Значительные нарушения профиля метилирования ДНК происходят при канцерогенезе[38].
Несмотря на биологическую роль, 5-метилцитозин может спонтанно утрачивать аминную группу (деаминироваться), превращаясь в тимин, поэтому метилированные цитозины являются источником повышенного числа мутаций[39].
ДНК может повреждаться разнообразными мутагенами, к которым относятся окисляющие и алкилирующие вещества, а также высокоэнергетическая электромагнитная радиация — ультрафиолетовое и рентгеновское излучение. Тип повреждения ДНК зависит от типа мутагена. Например, ультрафиолет повреждает ДНК путём образования в ней димеров тимина, которые возникают при образовании ковалентных связей между соседними основаниями[41].
Оксиданты, такие как свободные радикалы или пероксид водорода, приводят к нескольким типам повреждения ДНК, включая модификации оснований, в особенности гуанозина, а также двухцепочечные разрывы в ДНК[42]. По некоторым оценкам, в каждой клетке человека окисляющими соединениями ежедневно повреждается порядка 500 оснований[43][44]. Среди разных типов повреждений наиболее опасные — это двухцепочечные разрывы, потому что они трудно репарируются и могут привести к потерям участков хромосом (делециям) и транслокациям.
Многие молекулы мутагенов вставляются (интеркалируют) между двумя соседними парами оснований. Большинство этих соединений, например: бромистый этидий, даунорубицин, доксорубицин и талидомид, имеет ароматическую структуру. Для того чтобы интеркалирующее соединение могло поместиться между основаниями, они должны разойтись, расплетая и нарушая структуру двойной спирали. Эти изменения в структуре ДНК мешают репликации, вызывая мутации, и транскрипции. Поэтому интеркалирующие соединения часто являются канцерогенами, наиболее известные из которых — бензопирен, акридины, афлатоксин и бромистый этидий[45][46][47]. Несмотря на эти негативные свойства, в силу их способности подавлять транскрипцию и репликацию ДНК, интеркалирующие соединения используются в химиотерапии для подавления быстро растущих клеток рака[48].
Некоторые вещества (цисплатин[49], митомицин C[50], псорален[51]) образуют поперечные сшивки между нитями ДНК и подавляют синтез ДНК, благодаря чему используются в химиотерапии некоторых видов рака (см. Химиотерапия злокачественных новообразований).
Если взяться за концы верёвки и начать скручивать их в разные стороны, она становится короче и на верёвке образуются «супервитки». Так же может быть суперскручена и ДНК. В обычном состоянии цепочка ДНК делает один оборот на каждые 10,4 пар оснований, но в суперскрученном состоянии спираль может быть свёрнута туже или расплетена[52]. Выделяют два типа суперскручивания: положительное — в направлении нормальных витков, при котором основания расположены ближе друг к другу; и отрицательное — в противоположном направлении. В природе молекулы ДНК обычно находятся в отрицательном суперскручивании, которое вносится ферментами — топоизомеразами[53]. Эти ферменты удаляют дополнительное скручивание, возникающее в ДНК в результате транскрипции и репликации[54].
На концах линейных хромосом находятся специализированные структуры ДНК, называемые теломерами. Основная функция этих участков — поддержание целостности концов хромосом[56]. Теломеры также защищают концы ДНК от деградации экзонуклеазами и предотвращают активацию системы репарации[57]. Поскольку обычные ДНК-полимеразы не могут реплицировать 3' концы хромосом, это делает специальный фермент — теломераза.
В клетках человека теломеры часто представлены одноцепочечной ДНК и состоят из нескольких тысяч повторяющихся единиц последовательности ТТАГГГ[58]. Эти последовательности с высоким содержанием гуанина стабилизируют концы хромосом, формируя очень необычные структуры, называемые G-квадруплексами и состоящие из четырёх, а не двух взаимодействующих оснований. Четыре гуаниновых основания, все атомы которых находятся в одной плоскости, образуют пластинку, стабилизированную водородными связями между основаниями и хелатированием в центре неё иона металла (чаще всего калия). Эти пластинки располагаются стопкой друг над другом[59].
На концах хромосом могут образовываться и другие структуры: основания могут быть расположены в одной цепочке или в разных параллельных цепочках. Кроме этих «стопочных» структур теломеры формируют большие петлеобразные структуры, называемые Т-петли или теломерные петли. В них одноцепочечная ДНК располагается в виде широкого кольца, стабилизированного теломерными белками[60]. В конце Т-петли одноцепочечная теломерная ДНК присоединяется к двухцепочечной ДНК, нарушая спаривание цепочек в этой молекуле и образуя связи с одной из цепей. Это трёхцепочечное образование называется Д-петля (от англ. displacement loop)[59].
ДНК является носителем генетической информации, записанной в виде последовательности нуклеотидов с помощью генетического кода. С молекулами ДНК связаны два основополагающих свойства живых организмов — наследственность и изменчивость. В ходе процесса, называемого репликацией ДНК, образуются две копии исходной цепочки, наследуемые дочерними клетками при делении, отсюда следует, что образовавшиеся клетки оказываются генетически идентичны исходной.
Генетическая информация реализуется при экспрессии генов в процессах транскрипции (синтеза молекул РНК на матрице ДНК) и трансляции (синтеза белков на матрице РНК).
Последовательность нуклеотидов «кодирует» информацию о различных типах РНК: информационных, или матричных (мРНК), рибосомальных (рРНК) и транспортных (тРНК). Все эти типы РНК синтезируются на основе ДНК в процессе транскрипции. Роль их в биосинтезе белков (процессе трансляции) различна. Информационная РНК содержит информацию о последовательности аминокислот в белке, рибосомальные РНК служат основой для рибосом (сложных нуклеопротеиновых комплексов, основная функция которых — сборка белка из отдельных аминокислот на основе иРНК), транспортные РНК доставляют аминокислоты к месту сборки белков — в активный центр рибосомы, «ползущей» по иРНК.
Большинство природных ДНК имеет двухцепочечную структуру, линейную (эукариоты, некоторые вирусы и отдельные роды бактерий) или кольцевую (прокариоты, хлоропласты и митохондрии). Линейную одноцепочечную ДНК содержат некоторые вирусы и бактериофаги. Молекулы ДНК находятся in vivo в плотно упакованном, конденсированном состоянии[61]. В клетках эукариот ДНК располагается главным образом в ядре и на стадии профазы, метафазы или анафазы митоза доступны для наблюдения с помощью светового микроскопа в виде набора хромосом. Бактериальная (прокариоты) ДНК обычно представлена одной кольцевой молекулой ДНК, расположенной в неправильной формы образовании в цитоплазме, называемым нуклеоидом[62]. Генетическая информация генома состоит из генов. Ген — единица передачи наследственной информации и участок ДНК, который влияет на определённую характеристику организма. Ген содержит открытую рамку считывания, которая транскрибируется, а также регуляторные последовательности[англ.], например промотор и энхансер, которые контролируют экспрессию открытых рамок считывания.
У многих видов только малая часть общей последовательности генома кодирует белки. Так, только около 1,5 % генома человека состоит из кодирующих белок экзонов, а больше 50 % ДНК человека состоит из некодирующих повторяющихся последовательностей ДНК[63]. Причины наличия такого большого количества некодирующей ДНК в эукариотических геномах и огромная разница в размерах геномов (С-значение) — одна из неразрешённых научных загадок[64]; исследования в этой области также указывают на большое количество фрагментов реликтовых вирусов в этой части ДНК.
В настоящее время накапливается всё больше данных, противоречащих идее о некодирующих последовательностях как «мусорной ДНК» (англ. junk DNA). Теломеры и центромеры содержат малое число генов, но они важны для функционирования и стабильности хромосом[57][65]. Часто встречающаяся форма некодирующих последовательностей человека — псевдогены, копии генов, инактивированные в результате мутаций[66]. Эти последовательности нечто вроде молекулярных ископаемых, хотя иногда они могут служить исходным материалом для дупликации и последующей дивергенции генов[67]. Другой источник разнообразия белков в организме — это использование интронов в качестве «линий разреза и склеивания» в альтернативном сплайсинге[68]. Наконец, не кодирующие белок последовательности могут кодировать вспомогательные клеточные РНК, например мяРНК[69]. Недавнее исследование транскрипции генома человека показало, что 10 % генома даёт начало полиаденилированным РНК[70], а исследование генома мыши показало, что 62 % его транскрибируется[71].
Генетическая информация, закодированная в ДНК, должна быть прочитана и в конечном итоге выражена в синтезе различных биополимеров, из которых состоят клетки. Последовательность оснований в цепочке ДНК напрямую определяет последовательность оснований в РНК, на которую она «переписывается» в процессе, называемом транскрипцией. В случае мРНК эта последовательность определяет аминокислоты белка. Соотношение между нуклеотидной последовательностью мРНК и аминокислотной последовательностью определяется правилами трансляции, которые называются генетическим кодом. Генетический код состоит из трёхбуквенных «слов», называемых кодонами, состоящих из трёх нуклеотидов (то есть ACT, CAG, TTT и т. п.). Во время транскрипции нуклеотиды гена копируются на синтезируемую РНК РНК-полимеразой. Эта копия в случае мРНК декодируется рибосомой, которая «читает» последовательность мРНК, осуществляя спаривание матричной РНК с транспортными РНК, которые присоединены к аминокислотам. Поскольку в трёхбуквенных комбинациях используются 4 основания, всего возможны 64 кодона (4³ комбинации). Кодоны кодируют 20 стандартных аминокислот, каждой из которых соответствует в большинстве случаев более одного кодона. Один из трёх кодонов, которые располагаются в конце мРНК, не означает аминокислоту и определяет конец белка, это «стоп» или «нонсенс» кодоны — TAA, TGA, TAG.
Деление клеток необходимо для размножения одноклеточного и роста многоклеточного организма, но до деления клетка должна удвоить геном, чтобы дочерние клетки содержали ту же генетическую информацию, что и исходная клетка. Из нескольких теоретически возможных механизмов удвоения (репликации) ДНК реализуется полуконсервативный. Две цепочки разделяются, а затем каждая недостающая комплементарная последовательность ДНК воспроизводится ферментом ДНК-полимеразой. Этот фермент синтезирует полинуклеотидную цепь, находя правильный нуклеотид через комплементарное спаривание оснований и присоединяя его к растущей цепочке. ДНК-полимераза не может начинать новую цепь, а может лишь наращивать уже существующую, поэтому она нуждается в короткой цепочке нуклеотидов — (праймере), синтезируемом праймазой. Так как ДНК-полимеразы могут синтезировать цепочку только в направлении 5' --> 3', антипараллельные цепи ДНК копируются по-разному: одна цепь синтезируется непрерывно, а вторая прерывчато[72].
Все функции ДНК зависят от её взаимодействия с белками. Взаимодействия могут быть неспецифическими, когда белок присоединяется к любой молекуле ДНК, или зависеть от наличия особой последовательности. Ферменты также могут взаимодействовать с ДНК, из них наиболее важные — это РНК-полимеразы, которые копируют последовательность оснований ДНК на РНК в транскрипции или при синтезе новой цепи ДНК — репликации.
Хорошо изученными примерами взаимодействия белков и ДНК, не зависящего от нуклеотидной последовательности ДНК, является взаимодействие со структурными белками. В клетке ДНК связана с этими белками, образуя компактную структуру, которая называется хроматин. У эукариот хроматин образован при присоединении к ДНК небольших щелочных белков — гистонов, менее упорядоченный хроматин прокариот содержит гистон-подобные белки[73][74]. Гистоны формируют дискообразную белковую структуру — нуклеосому, вокруг каждой из которых вмещается два оборота спирали ДНК. Неспецифические связи между гистонами и ДНК образуются за счёт ионных связей щелочных аминокислот гистонов и кислотных остатков сахарофосфатного остова ДНК[75]. Химические модификации этих аминокислот включают метилирование, фосфорилирование и ацетилирование[76]. Эти химические модификации изменяют силу взаимодействия между ДНК и гистонами, влияя на доступность специфических последовательностей для факторов транскрипции и изменяя скорость транскрипции[77]. Другие белки в составе хроматина, которые присоединяются к неспецифическим последовательностям — белки с высокой подвижностью в гелях, которые ассоциируют большей частью с согнутой ДНК[78]. Эти белки важны для образования в хроматине структур более высокого порядка[79].
Особая группа белков, присоединяющихся к ДНК — это белки, которые ассоциируют с одноцепочечной ДНК. Наиболее хорошо охарактеризованный белок этой группы у человека — репликационный белок А, без которого невозможно протекание большинства процессов, где расплетается двойная спираль, включая репликацию, рекомбинацию и репарацию. Белки этой группы стабилизируют одноцепочечную ДНК и предотвращают формирование стеблей-петель или деградации нуклеазами[80].
В то же время другие белки узнают и присоединяются к специфическим последовательностям. Наиболее изученная группа таких белков — различные классы факторов транскрипции, то есть белки, регулирующие транскрипцию. Каждый из этих белков узнаёт свою последовательность, часто в промоторе, и активирует или подавляет транскрипцию гена. Это происходит при ассоциации факторов транскрипции с РНК-полимеразой либо напрямую, либо через белки-посредники. Полимераза ассоциирует сначала с белками, а потом начинает транскрипцию[81]. В других случаях факторы транскрипции могут присоединяться к ферментам, которые модифицируют находящиеся на промоторах гистоны, что изменяет доступность ДНК для полимераз[82].
Так как специфические последовательности встречаются во многих местах генома, изменения в активности одного типа фактора транскрипции могут изменить активность тысяч генов[83]. Соответственно, эти белки часто регулируются в процессах ответа на изменения в окружающей среде, развития организма и дифференцировки клеток. Специфичность взаимодействия факторов транскрипции с ДНК обеспечивается многочисленными контактами между аминокислотами и основаниями ДНК, что позволяет им «читать» последовательность ДНК. Большинство контактов с основаниями происходит в главной бороздке, где основания более доступны[27].
В клетке ДНК находится в компактном, т. н. суперскрученном состоянии, иначе она не смогла бы в ней уместиться. Для протекания жизненно важных процессов ДНК должна быть раскручена, что производится двумя группами белков — топоизомеразами и хеликазами.
Топоизомеразы — ферменты, которые имеют и нуклеазную, и лигазную активности. Они изменяют степень суперскрученности в ДНК. Некоторые из этих ферментов разрезают спираль ДНК и позволяют вращаться одной из цепей, тем самым уменьшая уровень суперскрученности, после чего фермент заделывает разрыв[53]. Другие ферменты могут разрезать одну из цепей и проводить вторую цепь через разрыв, а потом лигировать разрыв в первой цепи[84]. Топоизомеразы необходимы во многих процессах, связанных с ДНК, таких как репликация и транскрипция[54].
Хеликазы — белки, которые являются одним из молекулярных моторов. Они используют химическую энергию нуклеозидтрифосфатов, чаще всего АТФ, для разрыва водородных связей между основаниями, раскручивая двойную спираль на отдельные цепочки[85]. Эти ферменты важны для большинства процессов, где белкам необходим доступ к основаниям ДНК.
В различных процессах, происходящих в клетке, например рекомбинации и репарации, участвуют ферменты, способные разрезать и восстанавливать целостность нитей ДНК. Ферменты, разрезающие ДНК, носят название нуклеаз. Нуклеазы, которые гидролизуют нуклеотиды на концах молекулы ДНК, называются экзонуклеазами, а эндонуклеазы разрезают ДНК внутри цепи. Наиболее часто используемые в молекулярной биологии и генетической инженерии нуклеазы — это эндонуклеазы рестрикции (рестриктазы), которые разрезают ДНК около специфических последовательностей. Например, фермент EcoRV (рестрикционный фермент № 5 из 'E. coli') узнаёт шестинуклеотидную последовательность 5'-GAT|ATC-3' и разрезает ДНК в месте, указанном вертикальной линией. В природе эти ферменты защищают бактерии от заражения бактериофагами, разрезая ДНК фага, когда она вводится в бактериальную клетку. В этом случае нуклеазы — часть системы модификации-рестрикции[86]. ДНК-лигазы «сшивают» концы фрагментов ДНК между собой, катализируя формирование фосфодиэфирной связи с использованием энергии АТФ. Рестрикционные нуклеазы и лигазы используются в клонировании и фингерпринтинге.
Существует также важная для метаболизма ДНК группа ферментов, которые синтезируют цепи полинуклеотидов из нуклеозидтрифосфатов — ДНК-полимеразы. Они добавляют нуклеотиды к 3'-гидроксильной группе предыдущего нуклеотида в цепи ДНК, поэтому все полимеразы работают в направлении 5'--> 3'[87]. В активном центре этих ферментов субстрат — нуклеозидтрифосфат — спаривается с комплементарным основанием в составе одноцепочечной полинуклеотидной цепочки — матрицы.
В процессе репликации ДНК ДНК-зависимая ДНК-полимераза синтезирует копию исходной последовательности ДНК. Точность очень важна в этом процессе, так как ошибки в полимеризации приведут к мутациям, поэтому многие полимеразы обладают способностью к «редактированию» — исправлению ошибок. Полимераза узнаёт ошибки в синтезе по отсутствию спаривания между неправильными нуклеотидами. После определения отсутствия спаривания активируется 3'--> 5' экзонуклеазная активность полимеразы, и неправильное основание удаляется[88]. В большинстве организмов ДНК-полимеразы работают в виде большого комплекса, называемого реплисомой, которая содержит многочисленные дополнительные субъединицы, например хеликазы[89].
РНК-зависимые ДНК-полимеразы — специализированный тип полимераз, которые копируют последовательность РНК на ДНК. К этому типу относятся обратная транскриптаза, которая содержится в ретровирусах и используется при инфекции клеток, а также теломераза, необходимая для репликации теломер[90]. Теломераза — необычный фермент, потому что она содержит собственную матричную РНК[57].
Транскрипция осуществляется ДНК-зависимой РНК-полимеразой, которая копирует последовательность ДНК одной цепочки на мРНК. В начале транскрипции гена РНК-полимераза присоединяется к последовательности в начале гена, называемой промотором, и расплетает спираль ДНК. Потом она копирует последовательность гена на матричную РНК до тех пор, пока не дойдёт до участка ДНК в конце гена — терминатора, где она останавливается и отсоединяется от ДНК. Также как ДНК-зависимая ДНК-полимераза человека, РНК-полимераза II, которая транскрибирует большую часть генов в геноме человека, работает в составе большого белкового комплекса, содержащего регуляторные и дополнительные единицы[91].
Двойная спираль ДНК обычно не взаимодействует с другими сегментами ДНК, и в человеческих клетках разные хромосомы пространственно разделены в ядре[92]. Это расстояние между разными хромосомами важно для способности ДНК действовать в качестве стабильного носителя информации. В процессе рекомбинации с помощью ферментов две спирали ДНК разрываются, обмениваются участками, после чего непрерывность спиралей восстанавливается, поэтому обмен участками негомологичных хромосом может привести к повреждению целостности генетического материала.
Рекомбинация позволяет хромосомам обмениваться генетической информацией, в результате этого образуются новые комбинации генов, что увеличивает эффективность естественного отбора и важно для быстрой эволюции новых белков[93]. Генетическая рекомбинация также играет роль в репарации, особенно в ответе клетки на разрыв обеих цепей ДНК[94].
Самая распространённая форма кроссинговера — это гомологичная рекомбинация, когда принимающие участие в рекомбинации хромосомы имеют очень похожие последовательности. Иногда в качестве участков гомологии выступают транспозоны. Негомологичная рекомбинация может привести к повреждению клетки, поскольку в результате такой рекомбинации возникают транслокации. Реакция рекомбинации катализируется ферментами, которые называются рекомбиназы, например, Cre. На первом этапе реакции рекомбиназа делает разрыв в одной из цепей ДНК, позволяя этой цепи отделиться от комплементарной цепи и присоединиться к одной из цепей второй хроматиды. Второй разрыв в цепи второй хроматиды позволяет ей также отделиться и присоединиться к оставшейся без пары цепи из первой хроматиды, формируя структуру Холлидея. Структура Холлидея может передвигаться вдоль соединённой пары хромосом, меняя цепи местами. Реакция рекомбинации завершается, когда фермент разрезает соединение, а две цепи лигируются[95].
ДНК содержит генетическую информацию, которая делает возможной жизнедеятельность, рост, развитие и размножение всех современных организмов. Однако как долго в течение четырёх миллиардов лет истории жизни на Земле ДНК была главным носителем генетической информации, неизвестно. Существуют гипотезы, что РНК играла центральную роль в обмене веществ, поскольку она может и переносить генетическую информацию, и осуществлять катализ с помощью рибозимов[96][97][98]. Кроме того, РНК — один из основных компонентов «фабрик белка» — рибосом. Древний РНК-мир, где нуклеиновая кислота была использована и для катализа, и для переноса информации, мог послужить источником современного генетического кода, состоящего из четырёх оснований. Это могло произойти в результате того, что число оснований в организме было компромиссом между небольшим числом оснований, увеличивавшим точность репликации, и большим числом оснований, увеличивающим каталитическую активность рибозимов[99].
Древние генетические системы не дошли до наших дней. ДНК в окружающей среде в среднем сохраняется в течение 1 миллиона лет, постепенно деградируя до коротких фрагментов. Извлечение ДНК из бактериальных спор, заключённых в кристаллах соли 250 млн лет назад, и определение последовательности генов 16S рРНК[100] служит темой оживлённой дискуссии в научной среде[101][102]. Самой древней ДНК на момент 2023 г. считается ДНК возрастом более 2 млн лет[103][104][105].