jeudi 26 février 2015

Comment vérifier le classement d'une signature ADN-mt.


Vous venez de recevoir vos résultats d'un test ADN-mt. La compagnie  FTDNA qui a procédé aux analyses indique que votre ADN-mt appartient à un haplogroupe donné.  Vous aimeriez vérifier si le classement fait par FTDNA de votre ADN-mt est le bon en comparant les mutations trouvées dans votre signature à celles qui sont requises par la classification officielle la plus récente de l'ADN mitochondrial humain qui se trouve à  www.PhyloTree.org

Au moment de construire le présent exemple, la version 16, datée du du 18 février 2014 était la plus récente.
Pour trouver la section de la taxonomie qui est pertinente à votre confirmation, il faut visiter le site de PhyloTree.org et ouvrir la classification.

L'écran équivalent à la Figure 1 devrait apparaître.



Figure 1. Écran d'arrivée à  PhyloTree.org. Ossature de la classification de l'ADN mitochondrial humain.  


Elle représente graphiquement la structure générale ou l'ossature de la classification ADN-mt chez l'humain. Il s'agit d'un arbre inversé. Tout au haut se trouve  le tronc mt-MRCA pour, en anglais, mitochondrial (mt) Most Recent Common Ancestor. Ce concept MRCA est traduit en français par ACPR pour représenter les premières lettres des mots de l'expression, *Ancêtre Commun le Plus Récent*. Il s'agit en fait de la classe d'êtres humains féminins la plus ancienne, formant le premier haplogroupe tronc, regroupant nos tout premiers ancêtres. De cet haplogroupe initial s'est différencié l'haplogroupe L0 comme une première branche. La différenciation s'est faite par l'accumulation de plusieurs mutations. Puis l'haplogroupe L1 s'est différencié à son tour de L0 par de nouvelles mutations. Puis ce fut le tour de l'haplogroupe L5, et ainsi de suite comme l'illustre la Figure 1.  La séquence de différenciations, chacune représentée par le signe de dérivation >,  se  serait donc produite en Afrique selon la théorie reçue et serait la suivante: Ève mitochondriale > L0 > L1 > L5 > L2 > L6  > L4 >  L3.

Des femmes appartenant à l'haplogroupe L3 furent les premières à sortir d'Afrique. On estime que cela s'est produit il y a environ 60-80,000 ans.  Tel que l'illustre la Figure 1, les autres haplogroupes humains dériveraient tous de l'haplogroupe ancestral L3.  L'haplogroupe H le plus commun chez les européens est dans la dérivation L3 > N > R > R0 > H.  L'haplogroupe H7a1a, concerné par le prochain exemple, constitue un sousclade dérivé de l'haplogroupe H, d'où le sentier phylogénétique complet suivant pour ce sousclade:
Ève ADN-mt > L0 > L1 > L5 > L2 > L6  > L4 > L3 > N > R > R0 > H > H7 > H7a > H7a1 > H7a1a.

Exemple 1. Haplogroupe H7a1a

Pour examiner la structure de H7 il faut choisir et cliquer l'hyperlien  R0 dans la page d'arrivée à PhyloTree.org  Une fois dans cette page, cherchons H7 (Sous WS: faire CTRL-F ou encore sous MacOS X: Cmd-F  et entrer H7 dans la fenêtre de recherche).  Notre fureteur (IE ou Chrome ou Safari) nous montre alors la section de la taxonomie qui concerne l'haplogroupe H7, tel qu'illustré à la Figure 2.

Le travail de vérification peut commencer.  Voici les mutations RSRS, placées en ordre numérique, que FTDNA a identifiées dans un ADN-mt par une séquençage complet (test FMS):

G73A, A93G, C146T, C152T, C195T, A247G, 315.1C,
A769G, A825t, A1018G, G1719A, G2706A, A2758G, C2885T, T3594C, C3613T, G4104A, T4312C, A4793G, G5417A, T7028C, G7146A, T7256C, A7521G, T8022C, T8468C, T8655C, G8701A, C9540T, G10398A, T10664C, A10688G, C10810T, C10873T, C10915T, G11016A, A11167G, A11719G, A11914G, T12705C, G13105A, G13276A, T13506C, T13650C, T13896C, T14766C,
A16129G, T16187C, C16189T, T16223C, G16230A, C16261T, T16278C, T16304C, C16311T

La tâche consiste à parcourir la section de l'haplogroupe H7 à PhyloTree.org et à vérifier si le sentier de mutations révélé par la taxonomie se trouve reproduit parmi la liste des mutations de la signature étudiée.  Sur cette figure, les mutations présentes dans la signature et qui servent de critère d'entrée dans un sousclade sont signalées par la présence d'un point rouge.  Ainsi, la présence de la mutation A4793G conditionne l'entrée en H7. Cette mutation est présente dans la signature à classer.  Il faut ensuite vérifier la présence d'une des clés du niveau hiérarchique suivant plus en aval. La mutation G1719A est présente et  elle permet d'entrer dans le sousclade H7a. Au niveau hiérarchique suivant, C16261T ouvre sur le sousclade H7a1. Puis,  les deux mutations A93G et A11167G servent de critères pour entrer dans le sousclade H7a1a.  La signature appartient donc à l’haplogroupe H7a1a. Le sentier de mutations pour H7a1a, partant de  son inclusion en H7 est donc :  [A4793G→ G1719A→ C16261T→ A93G→ A11167G ].
Un sentier de mutations est une structure phylogénétique. Les mutations s'y trouvent dans un ordre particulier, un ordre phylogénétique qui dans le présent cas suit l'ordre des mutations.  Un groupe de femmes A4793G est d'abord apparu; puis, la mutation G1719A est apparue chez une descendante de A4793G, et ainsi de suite.  Lors du classement d'un haplotype (signature), en règle générale, toutes les mutations du sentier phylogénétique doivent être retrouvées présentes dans la signature à classer. Il y a parfois des exceptions puisque certaines mutations se défont spontanément;  la taxonomie utilisera ces réversions qui seront indiquée par un point d'exclamation, ainsi par ex. T195C!

Certaines mutations, comme A4793G pour H7,  jouent le rôle de clé pour entrer dans un haplogroupe. On dit qu'elles jouent un rôle 'canonique'. Or ce rôle canonique disparaîtra si la même mutation est découverte dans un autre haplogroupe. Le véritable critère pour entrer dans un sousclade ou dans un haplogroupe c'est la satisfaction d'un sentier phylogénétiquement ordonné de mutations.



Figure 2.  Section de la taxonomie ADN-mt  rCRS qui porte sur le taxon H7. Cet extrait est emprunté à  PhyloTree.org,  Build 16, 2014.  La version RSRS est identique à ce niveau.

Exemple 2.  Haplogroupe A

Votre haplogroupe d'appartenance est A selon FTDNA qui a fait le test.  Voici les mutations identifiées en  HVR1+HVR2:
(ordre numérique des positions RSRS)
C146T, C152T, C195T, A235G, A247G, 315.1C, C544T,
A16129G, T16187C, C16189T, A16227c, G16230A, T16278C, C16290T, G16319A

Sur la Figure 1, l'haplogroupe A est un sousclade de l'haplogroupe N.  On trouvera donc le taxon dans la page N à PhyloTree.org
Puisqu'uniquement la région contrôle (HVR1 et HVR2) a été séquencée, il faudra se fier aux mutations indiquées en bleu dans la taxonomie de la page N à PhyloTree.org. Les mutations en noir proviennent de la région d'encodage (CR) qui n'a pas été séquençée dans le présent cas.

Pour repérer l'entrée de l'haplogroupe A sur la page de l'embranchement N àPhyloTree.org,  chercher la mutation A235G.  Cette mutation est présente parmi celles de la signature et la fait entrer en A.  Plus bas, l'embranchement T152C! ne peut pas être emprunté étant donné que la mutation C152T est présente dans la signature. T152C! est une réversion. On poursuit la descente par la grande ligne. Il nous est impossible de savoir si la signature peut se qualifier pour le sousclade A5. Continuons plus bas. La mutation 16242T n'est pas présente dans la signature. On poursuit la descente. Le transversion A16227c et l'absence de T16311C! permettent de faire entrer la signature en A10 puisque ces deux mutations font partie de celles de la signature. Nous sommes donc en présence d'une signature appartenant à l'haplogroupe A10.
En effet, il s'agit de la signature HVR1+HVR2 des descendants de la Fille du Roi Catherine PILLARD (épouse de Pierre CHARRON).

Exemple 3.  Haplogroupe inconnu, à trouver.

La compagnie n'a pas fourni l'haplogroupe d'appartenance mais uniquement les mutations RSRS. Il faut en découvrir l'haplogroupe.

(ordre numérique des positions en mode RSRS)
C146T, C150T, C152T, C198T, A247G, 522.1A, 522.2C, 315.1C, A769G, A825t, A1018G, T2352C, A2758G, C2885T, T3594C, G4104A, T4312C, T4823C, T6413C, A6647G, G7146A, T7256C, A7521G, T8468C, T8655C, A9667G, T10664C, A10688G, C10810T, A10819G, C10915T, A11914G, G13276A, T13506C, T13650C, T14212C, G14869A, G14905A, G15301A, A16129G, C16148T, T16187C, C16189T, C16221T, G16230A, T16278C, C16311T, C16320T

Procéder ainsi:

1) Déterminer en premier lieu si les mutations permettant de sortir d'Afrique sont présentes dans la signature. Aller à PhyloTree.org et examiner les mutations qui permettent d'entrer en M* ou N*.  Aucune de ces mutations n'est trouvée. Le généalogiste doit alors inférer que l'haplogroupe d'appartenance se trouve parmi les haplogroupes africains L.
2) Tester chacun des haplogroupes L.  Les mutations A769G  A1018G  C16311T  sont présentes dans la signature qui se qualifie pour entrer dans le sousclade L3.
3) Plus en aval, elle ne se qualifie pas pour entrer en L3a, ni en L3b, ni en L3c. Par contre,  elle possède C150T  A10819G  et entre en L3e'i'k'x,  puis en L3e grâce aux mutations  T2352C et  T14212C.  La signature possède G14905A et C16320T  et ne possède pas T195C (noté par la réversion T195C!) et se qualifie ainsi pour entrer en L3e2.  La signature présente les mutations T4823C et G14869A alors que  A13105G est absente; elle peut entrer dans le sousclade L3e2a. Puis, la mutation C198T la fait entrer en L3e2a1.  Plus en aval, elle entre en L3e2a1b avec T6413C. La signature occupe le sousclade  L3e2a1b qui une feuille terminale dans la classification courante version 16 dePhyloTree.org
Cette signature appartient à une lignée utérine africaine.

Exemple 4.  Haplogroupe T2b selon 23andMe

Vous avez fait tester votre ADN auprès de la compagnie 23andMe et cette dernière indique que votre ADN-mt appartient à l'haplogroupe H7.  La compagnie 23andMe ne procède pas par un séquençage du génome ADN-mt entier. Il ne s'agit pas d'un test FMS. Il s'agit d'un sondage à l'aide de sondes examinant l'état de certaines bases jouant un critère pour l'entrée dans certains clades.

Il est possible que l'haplogroupe fourni par 23andMe puisse être  précisé davantage si l'on soumet les résultats bruts du test au programme mtHAP développé par James LICK  [http://dna.jameslick.com/mthap/ ]

Les directives pour soumettre les données sont les suivantes:
  1. Aller dans votre compte 23andMe et cliquer sur "Account" ; choisir l'option "Browse Raw Data".
  2. Sur l'écran qui s'ouvre, cliquer sur "download raw data".
  3. Saisir votre mot-de-passe et la réponse secrète.
  4. Choisir le profil dont vous voulez obtenir les données.
  5. IMPORTANT: Choisir l'ensemble "Mitochondrial DNA."
  6. Cliquer "Download Data".
  7. Sauver le fichier zippé sur votre machine à un endroit ou vous pourrez facilement le retrouver.
  8. Ouvrir le fichier zippé et extraire le fichier texte qu'il contient.
  9. Sur la page mtHAP, cliquer sur 'Choisissez un fichier'. Choisissez le fichier .TXT sur votre machine et une fois qu'il apparaîtra cliquer sur Upload. Note: le fichier zippé ne fonctionnera pas.
Voici à quoi ressemble le début du fichier des données brutes ADN-mt



Les données sont fournies à mtHAP et le programme élabore la réponse qui suit et que je traduis .

Marqueurs trouvés (en mode rCRS):

HVR2: 73G 263G
CR: 709A 750G 930A 1438G 1888A 2706G 4216C 4769G 4917G 5147A 7028T 8557A 8697A 10463C 11251G 11719A 11812G 13368A 14233G 14766T 14861A 14905A 15326G 15452A 15607G 15928A
HVR1: 16126C 16294T 16296T (16519C)

Meilleure concordance ADN-mt au niveau de l'haplogroupe:   T2b13

Marqueurs définissant l'haplogroupe T2b13:
HVR2: 73G 263G
CR: 709A 750G 930A 1438G 1888A 2706G 4216C 4769G 4917G 5147A 7028T 8697A 8860G 10463C 11251G 11719A 11812G 13368A 14233G14766T 14861A 14905A 15326G 15452A 15607G 15928A
HVR1: 16126C 16294T (16296T) 16304C

Sentier des marqueurs partant du rCRS jusqu'à l'haplogroupe T2b13 (et marqueurs en surplus):
H2a2a1(rCRS)  263G ⇨ H2a2a  8860G 15326G ⇨ H2a2  750G ⇨ H2a  4769G ⇨ H2  1438G ⇨ H  2706G 7028T ⇨ HV  14766T ⇨ R0  73G 11719A ⇨ R  4216C ⇨ R2'JT  11251G 15452A 16126C ⇨ JT  709A 1888A 4917G 8697A 10463C13368A 14905A 15607G 15928A 16294T ⇨ T  11812G 14233G (16296T) ⇨ T2  930A 5147A 16304C ⇨ T2b  14861A ⇨ T2b13 8557A (16519C)

Concordance imparfaite. Vos résultats présentent des différences d'avec cet haplogroupe:
Concordances(30): 73G 263G 709A 750G 930A 1438G 1888A 2706G 4216C 4769G 4917G 5147A 7028T 8697A 10463C 11251G 11719A 11812G 13368A 14233G 14766T 14861A 14905A 15326G 15452A 15607G 15928A 16126C 16294T (16296T)
Extras(1): 8557A (16519C)
Non testés(2): 8860 16304

.........
Fin du listing de mtHAP


Le même ADN-mt  fut aussi entièrement séquencé par FTDNA. Les variations sont ici exprimées en mode rCRS.
Elles conduisent à l'haplogroupe T2b13, le même que celui qui avait été prédit en partie par  23andMe par sondage et complété par mtHAP. 


Figure 3.   Liste des variations rCRS pour un haplotype T2b13 selon les régions HVR1, HVR2 et d'encodage. Cette signature T2b13 est fort probablement celle de Marie FERRA, née en 1641 à Crèvecoeur-le-Grand,  Beauvais, Picardie, France (épouse de  Jacques JAHAN dit LAVIOLETTE).



Exemple 5.  S'agit-il d'une signature appartenant à l'haplogroupe H1 ou H7?

Voici une signature qui pour moi demeure d'un classement difficile. FTDNA la classe dans l'haplogroupe H1 bien qu'elle présente la mutation A4793G qui, dans l'exemple 1 plus haut,  jouait un rôle canonique, faisant entrer une signature la possédant dans l'haplogroupe H7.

Voici les mutations mises en ordre numérique (RSRS):
G73A, C146T, C152T, C195T, A247G, 522.1A, 522.2C, 309.1C, 315.1C
A769G, A825t, A1018G, G2706A, A2758G, C2885T, G3010A, T3594C, G4104A, T4312C, A4793G, T7028C, G7146A, T7256C, A7521G, T8468C, T8655C, G8701A, C9540T, G10398A, T10664C, A10688G, C10810T, C10873T, C10915T, A11719G, A11914G, T12705C, G13105A, G13276A, T13506C, T13650C, T14766C, A15874G
A16129G, T16187C, C16189T, T16223C, G16230A, T16278C, C16311T

Je vous invite à consulter PhyloTree.org en ligne pour être en mesure de suivre l'exercice de classification. 

  1. Entrée en H.  Conformément à PhyloTree.org, les mutations G2706A T7028C servent de critère double pour faire entrer cette signature en H. 
  2. Entrée en H1. La mutation G3010A permet ensuite de la faire entrer en H1. Par contre, aucune des autres mutations ne satisfait son  entrée dans un sousclade plus en aval dand l'haplogroupe H1.  
  3. Entrée en H7. Une fois en H, la mutation A4793G peut faire entrer la signature en H7.  Or,  cette signature ne possède aucune mutation qui permettrait de la classer dans un sousclade de H7. 

Le classement de cette signature demeure incertain.

Jacques P. BEAUGRAND
beaugrand.jacques@uqam.ca

Dunham, Québec
16 décembre 2014
R 5 janvier 2015
Version 1.3

Aucun commentaire:

Enregistrer un commentaire