Эволюционная дистанция | это... Что такое Эволюционная дистанция? (original) (raw)

Эволюционная дистанция – величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена [1].

Содержание

Методы определения

Попарная дистанция

Простейшей величиной, характеризующей эволюционную дистанцию является доля несовпадающих нуклеотидов при попарном сравнении соответствующих позиций в гене. Эта величина называется «попарной дистанцией» (обычно обозначается символом p).

Например, при сравнении следующих двух участков гена

CAGACAGTCA CACACTGCCA

на 10 нуклеотидов приходится три несовпадающих, p = 0,3.

Попарная дистанция недостаточно адекватно описывает эволюционные различия между организмами:

Недостатки попарной дистанции устраняются использованием более сложных формул определения дистанции:

и другие методы.

Метод Джукса-Кантора

Метод Джукса-Кантора[2] (англ. Jukes-Cantor Method) представляет собой простейшую попытку исключить из рассмотрения случайные совпадения нуклеотидов, вероятность которых составляет 25%. Это однопараметрический метод, который в качестве параметра использует долю несовпадающих нуклеотидов (то есть попарную дистанцию p). Дистанция рассчитывается по следующей формуле

d_{JC} = - \frac{3}{4} \ln \left( 1 - \frac{4p}{3} \right).

Метод предполагает, что все четыре нуклеотида (А, Ц, Т, Г) присутствуют в ДНК в одинаковых пропорциях, а вероятность замены одного нуклеотида на другой одинакова для любой пары нуклеотидов.

Как видно из формулы при p > 0,75 выражение не имеет смысла (отрицательное выражение под знаком логарифма). Это является недостатком метода, так как ситуации с p > 0,75 (более 75 % различающихся нуклеотидов) принципиально не исключены.

Формула была предложена в 1965 году, на заре исследований в области молекулярной биологии преподавателем химического факультета Калифорнийского университета Томасом Джуксом (англ.)русск. и студентом того же факультета Чарлзом Кантором (англ.)русск.. В середине 1960-х годов биохимические технологии достигли того уровня, когда стала возможной расшифровка отдельных фрагментов ДНК и аминокислотных последовательностей белков. Это позволило путём сравнения нуклеотидных последовательностей проследить эволюционную близость различных организмов и пути эволюции отдельных видов. Джукс и Кантор входили в число пионеров в деле формализации этого метода, а Кантор стал автором одной из первых компьютерных программ для анализа нуклеотидных последовательностей[3].

В качестве примера применения формулы можно привести фрагменты генов, кодирующих α- и β-гемоглобин человека. Считается, что около 400 млн. лет назад оба гена произошли от одного предкового гена[3].

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)

Сравнение фрагмента обнаруживает 12 различий на 40 нуклеотидов (p = 0,4). Однако простой подсчёт расхождений не учитывает вероятность того, что в некоторых позициях произошли многократные мутации, в том числе приведшие к восстановлению исходного нуклеотида. Формула Джукса-Кантора даёт дистанцию

d_{JC} = - \frac{3}{4} \ln 0,467 =  0,572.

Таким образом, из формулы следует, что с учётом кратных замен в рассматриваемом фрагменте ДНК произошло 0,572·30=17 мутаций.

Метод Кимуры

Мотоо Кимура предложил метод вычисления дистанции, который получил название «двухпараметрическая дистанция Кимуры» (англ. Kimura 2-parameter distance, K2P). Модель Кимуры предполагает, что различные варианты замены нуклеотидов неравновероятны и рассматривает два типа замен:

Дистанция в модели Кимуры определяется по формуле

d_{K2P} = - \frac{1}{2} \ln (1 - 2P - Q) - \frac{1}{4} \ln (1 - 2Q),

где P — доля транзиций, Q — доля трансверсий.

Рассматривая в качестве примера эволюционную дистанцию между фрагментами генов α- и β-гемоглобина, получим:

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин) Q PPQ P QQ QPQ Q Q

P = \frac{2}{15}; ~~ Q = \frac{4}{15};

d_{K2P} = - \frac{3}{4} \ln \frac{7}{15} =  0,233.

Метод Тадзимы-Нея

В модели Тадзимы-Нея дистанция определяется следующими соотношениями[4]

d = - b \ln \left( 1 - \frac{p}{b} \right),

где

b =  \frac{1}{2} \left( 1 - \sum^{4}_{i=1} g^2_i + \frac{p^2}{c} \right);

c = \sum^{3}_{i=1} \sum^{4}_{j=i+1} \frac{x^2_{ij}}{2 g_i g_j};

x ij – относительные частоты пар нуклеотидов;

g i – относительные частоты нуклеотидов.

В качестве примера вычислим дистанцию между фрагментами генов, кодирующих α- и β-гемоглобин человека.

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)

Нуклео-тид x ij g i
A T C
A 10/60 = 0,167
T 1/30 = 0,0333 13/60 = 0,217
C 2/30 = 0,0667 3/30 = 0,100 15/60 = 0,250
G 1/30 = 0,0333 3/30 = 0,100 2/30 = 0,0667 22/60 = 0,367

![ c = \frac {0,0333}{2 \cdot 0,167 \cdot 0,217}

![ \ + \frac {0,1}{2 \cdot 0,217 \cdot 0,250}

b = 0,5 \cdot  \left( 1 - 0,167^2 - 0,217^2 - 0,250^2 - 0,367^2 + 0,4^2/0,257 \right) =  
0,622.

d = -0,622 \cdot \ln \left( 1 - \frac {0,4}{0,622} \right) =  0,641.

В некоторых источниках дистанцией Тадзимы-Нея называется расчёт по более простой формуле

d = - b \ln \left( 1 - \frac{p}{b} \right),

где

b =  1 - \sum^{4}_{i=1} g^2_i.

Для случая, когда все нуклеотиды встречаются с одинаковой частотой (g i = 0,25), эта формула совпадает с формулой Джукса-Кантора (b = 0,75).

Расчёты по этим формулам дают для того же примера

\ b = 1 - 0,167^2 - 0,217^2 - 0,250^2 - 0,367^2 = 0,728.

 d = -0,728 \cdot \ln \left( 1 - \frac {0,4}{0,728} \right) =  0,580.

Примечания

  1. Словарь терминов, используемых в молекулярной эволюции, популяционной генетике и молекулярной биологии. На сайте СНК кафедры общей химии БГМУ.
  2. T. H. Jukes, C. R. Cantor (1969) Evolution of protein molecules. In H. N. Munro, ed., Mammalian Protein Metabolism, pp. 21-132, Academic Press, New York.
  3. 1 2 Thomas H. Jukes (April 30, 1990) How Many Nudeotide Substitutions Actually Took Place? Current Contests: 33(18), p. 21.
  4. Sudhir Kumar, Koichiro Tamura, and Masatoshi Nei. 1993. MEGA: Molecular Evolutionary Genetics Analysis, version 1.01. The Pennsylvania State University, University Park, PA 16802. 4. Distance Estimation.

См. также

Ссылки