Одинаково ли число пар оснований в данной хромосоме у разных людей?

Это основной вопрос, но я не смог найти ответ с помощью веб-поиска; надеюсь, это правильное место, чтобы спросить. Одинаково ли число пар оснований в одной хромосоме у всех людей? Например, если я возьму Х-хромосому от двух случайных людей, насчитываю ли я ровно 155 270 560 пар оснований в обоих случаях? или есть мутации, которые сделают один длиннее другого? Если они не совсем одинаковы, каков диапазон изменения длины?

Мало того, что это не то же самое у двух разных людей. Это не то же самое у одного человека (на протяжении всей его жизни или двух разных клеток в любой момент). en.wikipedia.org/wiki/Telomere См. также en.wikipedia.org/wiki/Insertion_(genetics) и en.wikipedia.org/wiki/Deletion_(genetics) .
@Адам сделай из этого ответ
Если кто-то хочет использовать мой комментарий, чтобы сформулировать ответ (или улучшить существующий ответ, пожалуйста, не стесняйтесь). У меня действительно нет времени прямо сейчас, чтобы собрать хорошо ссылочный ответ, которым я был бы доволен.
@ Адам, я добавлю.

Ответы (3)

Добро пожаловать в Biology.SE.

если я возьму Х-хромосому от двух случайных людей, я насчитал бы ровно 155 270 560 пар оснований в обоих случаях?

Нет, вы, вероятно, не найдете точно такое же количество пар оснований, потому что мутации не только заменяют один нуклеотид на другой (что мы называем заменой), но иногда добавляют или удаляют несколько (а иногда и много) нуклеотидов.

обратите внимание, кстати, что вам не нужно брать двух разных людей, вы можете просто рассмотреть две Х-хромосомы женщины (или любую другую пару хромосом любого пола) и найти эту разницу в длине хромосом.

каков диапазон изменения длины?

Хороший вопрос (+1)!

Проблема с теломерами

Прежде чем я начну, я хочу уточнить, что я рассматриваю длину этих хромосом в момент зачатия. Хромосомы будут меняться по длине в течение жизни из-за сокращения теломер. Я не буду учитывать это в следующих расчетах. Кроме того, некоторые мутации напрямую вводят (или удаляют) большое количество нуклеотидов (например, мобильных элементов), я не рассматриваю эти мутации здесь, предполагая, что они редки по сравнению с одиночными вставками и одиночными делециями (это предположение может быть неверным! ). Поэтому, пожалуйста, отнеситесь к следующему с недоверием.

Давайте сделаем некоторые грязные расчеты

В классической теоретической популяционной генетике мы склонны в основном рассматривать замены. Но, может быть, я могу попытаться сделать некоторую экстраполяцию из этой работы, если вы позволите мне сделать несколько сильных предположений, использовать неверные оценки фактических истинных значений и использовать некоторую нестрогую математику! Это будет некрасиво и не очень доверчиво ¨ .

Не объясняя, почему это так (это результат теории слияния), ожидаемое количество попарных различий между двумя нейтральными последовательностями для диплоидной популяции составляет Е [ π ] знак равно 4 Н мю (весьма впечатляюще простой результат), где Н - размер популяции (при условии панмиктической популяции) и мю скорость мутаций для всей последовательности. Предполагая постоянную скорость мутации на сайт мю с знак равно 10 9 . Зная длину интересующей последовательности (хромосома X) л 1,55 10 8 , частота мутаций для всей последовательности равна мю знак равно л мю с знак равно 0,155 . Рассмотрим численность населения Н знак равно 5 10 7 (уравнения предполагают панмиктическое население, поэтому я просто взял некоторое значение, которое показалось мне более или менее разумным, намного меньшим, чем фактическая численность населения во всем мире). Таким образом, общее количество замен должно быть Е [ π ] знак равно 4 5 10 7 0,155 10 7 .

Теперь предположим, что только часть 1 100 мутаций вносят изменения в число нуклеотидов, мы могли бы рассмотреть значение 1 100 10 7 знак равно 10 3 . И поскольку мутация, которая удаляет нуклеотид из длинной последовательности, скорее уменьшит количество вариантов в длине последовательности, чем увеличит ее, скажем, это число разделится на 10!... так что я бы сказал, что две типичные Х-хромосомы будут различаются по длине примерно на 100 нуклеотидов.

Я уверен, что при некоторой работе можно прийти к более строгим расчетам и более точному ожиданию. Интуитивно, результат 100 нуклеотидов не кажется совершенно сумасшедшим (по крайней мере, это не 1 и не 10^6).

Кроме того, вероятно, можно было бы использовать имеющиеся данные о последовательности для оценки этого значения.

В каком-то смысле да, но то, как вы это формулируете, вводит в заблуждение. Мутации могут привести к изменению длины хромосом. Затем, в течение жизни отдельной хромосомы длина сильно варьируется, потому что при каждом митозе хромосомы могут укорачиваться (вам нужно будет прочитать о хромосомных репликах, теломерах, направлении нитей ДНК, фрагментах Окасаки, чтобы понять почему). Таким образом, один из таких механизмов объясняет изменчивость как функцию возраста двух особей, которых вы отбираете, в то время как другой механизм не зависит от возраста и объясняет вариацию длины хромосом, присутствующих в яйцеклетке.
Спасибо за объяснение. Таким образом, кажется, что есть (по крайней мере) два разных механизма, которые могут изменить длину хромосомы: (1) сокращение теломер и (2) случайная делеция пары оснований (возможно ли добавление?). Из того, что я читал до сих пор, первое включает удаление частей повторяющейся последовательности оснований на концах хромосом. Это кажется более детерминированным процессом, чем второй. Я думаю, что расчеты, которые вы сделали, учитывают второй тип. Если правильно (100 из 155 миллионов), диапазон довольно мал.
Я рассчитал ожидаемую разницу в длине между двумя хромосомами, взятыми случайным образом из яиц (без учета сокращения теломер в течение жизни, что заставило бы нас учитывать распределение возраста, распределение числа митозов с учетом возраста и ожидаемое сокращение теломер в каждом случае). митоз). Ожидаемый общий диапазон длины в данной популяции обязательно больше, чем ожидаемая попарная разница в длине ... может быть, в 10 или 100 раз больше, я бы сказал интуитивно.
Также, пожалуйста, опять же, не относитесь к этим цифрам слишком серьезно, так как расчеты не очень строгие. Я был рад видеть, что в итоге получил ценность, которая казалась мне интуитивно понятной.
Существуют также мобильные элементы, которые могут изменять локусы в геноме. У различных микробов они могут поглощать или удалять плазмиды. Ретровирусы могут включать свою ДНК в своих хозяев.
Я понимаю, что это действительно обратная сторона расчетов типа конверта; но все же они достаточно полезны, чтобы вести следующий уровень детализации. Следующим шагом для меня является изучение того, как эти вариации учитываются при создании, обновлении и обработке баз данных хромосом.
Обычно мне легче чему-то научиться, если у меня есть конкретная проблема с реальными данными для работы. Если я возьму одну короткую хромосому из простого организма и просто хочу провести простой статистический анализ вариаций этих хромосом; Что было бы хорошим вводным материалом о том, как получить доступ к общедоступной базе данных и выполнить некоторые простые вычисления.
Вы должны открыть новый пост для своего нового вопроса и проверить ответ, если на ваш вопрос в этом посте был дан ответ (или просто ничего не отмечайте, если на ваш вопрос еще нет ответа). Я не совсем уверен, в чем именно заключается ваш вопрос, но если вы еще этого не сделали, вы можете сначала пройти курс биоинформатики.

Существуют ли мутации, из-за которых один длиннее другого? Если они не совсем одинаковы, каков диапазон изменения длины?

Как указано в других ответах, могут быть мутации, которые изменяют длину ДНК между людьми и даже отдельными клетками одной и той же ткани.

Существуют различные процессы, которые могут изменить длину генома. Наиболее распространенные из них:

На данный момент мы можем игнорировать микроинделы и хромосомные транслокации, потому что первые вносят лишь небольшое изменение в размер генома, а вторые обычно редки и в большинстве случаев чрезвычайно вредны.

Известно, что при строгом картировании CNV вызывают изменение размера генома человека на 4,8% [2] . Следует отметить, что эта информация не учитывает частоту изменений; это просто своего рода максимальный предел. Также можно отметить, что делеции вносят больший вклад в изменчивость по сравнению со вставками.

Известно, что ретротранспозоны LINE-1 весьма активны в геноме человека. На их долю приходится ~ 17% генома человека, и они являются одним из основных источников межиндивидуальной изменчивости [3] . Они особенно известны тем, что способствуют соматической гетерогенности в дифференцирующихся нейронах [4] . Поскольку LINE расширяются путем копирования и вставки, их активность коррелирует с увеличением размера генома. Активность транспозонов обычно подавляется в зародышевых клетках классом малых некодирующих РНК, называемых piRNAs [5] .

Я не нашел статьи, в которой бы точно описывалась разница в размере генома из-за LINE-1 или других мобильных элементов. Добавлю ссылку, если найду.

Интересные цифры. Если только один механизм (CNV) может вызвать изменение длины на 4,8%, а некоторые утверждают, что «с точки зрения последовательности ДНК все люди на 99,5% похожи на любых других людей» ( en.wikipedia.org/wiki/Human_genetic_variation ), то либо некоторые очень свободные определения используются или эти вариации имеют странную статистику –
@secretlyfamous Обратите внимание, что CNV не должны нарушать гомологию, то есть «сходство» между двумя геномами. Когда мы говорим о сходстве, мы обычно имеем в виду гомологию последовательностей. Представленные статистические данные относятся к верхней границе длины участков CNV. Таким образом, вариация является верхней границей, а не стандартным отклонением.
Спасибо за объяснение. Мне немного трудно согласиться с тем, что (неограниченная) вставка/делеция не меняет гомологии; но я сохраню детали для будущего вопроса.
@secretlyfamous представьте себе дупликации, он просто создает дополнительную копию геномной области, которая снова будет гомологична эталону. Также существует вероятность гомозиготных делеций. Еще один момент, который следует отметить, заключается в том, что когда люди говорят, что геном подобен на 99% (или даже когда проводится сравнение между разными видами; например, геномы шимпанзе и человека похожи на 95% (?)), то нетранскрибируемые (межгенные) геномы регионы не учитываются.

Вы никогда не насчитали бы 155 270 560 п.н. в Х-хромосоме. 7 лет назад без пробелов (со статусом завершенных) генома человека не существовало, это из GRCh37.p13. Это информация о геноме, в который были вставлены фальшивые пробелы. Но в феврале 2022 года мы, наконец, получили весь геном (включая Y-хромосому) и идеальное число — 154 259 566. Все остальные числа для других хромосом в википедии взяты отсюда. https://www.ncbi.nlm.nih.gov/assembly/GCA_009914755.4

PS Вы буквально не знали основы этого. 155 270 560 — это число со вставленными поддельными пробелами, вы можете увидеть его здесь: https://www.ncbi.nlm.nih.gov/grc/human/data?asm=GRCh37.p13 Число, которое вы хотели, было на вкладке Длины без пробелов, в то время это было 151 100 560 человек. Так что значит на момент ГРЧ37.р13 часть этого не была известна.