Overblog
Suivre ce blog Administration + Créer mon blog
6 avril 2012 5 06 /04 /avril /2012 14:42

Copernic  et  origines

 

Je reviens  sur  l'ADN   mitochondrial.  Les  mitochondries  sont  de  petites  entités  (on  dit  des  « organites »)  présentes  dans chacune  de  nos  cellules  (hommes  et  femmes)  et  lieux  de  synthèses  importantes. Il  se  trouve  que  ces  mitochondries ont  un  ADN,  indépendant  de  celui  présent  dans le  noyau.  L’ADN  mitochondrial  est  distinct  de  celui  des  chromosomes.  Le  pourquoi  d’une  telle  situation  sort  du cadre  de  cet  article  mais  cet  ADN  est  transmis  d’une  génération  à  l’autre, et  ça  c’est  notre  sujet. La  taille  de  cet  ADN  est  de  16569  nucléotides,  ce  qui  est  tout  petit  par  rapport  à  la  taille du  plus  petit  de  nos  chromosome,  le chromosome Y :  53  millions  de  nucléotides.

La  transmission  mère-fille  ne  doit  surtout  pas  faire  oublier  que  les  hommes  aussi  ont  des  mitochondries  et,  donc, de  l’ADN  mitochondrial. Il  se  trouve  que  le  spermatozoïde  perd  son  flagelle  en  pénétrant  dans  l’ovule,  et  avec  le  flagelle   ses  mitochondries. Ce  sont  donc  les  mitochondries  présentes  dans l’ovule  qui  sont  transmises  aux  enfants.

Ces  rappels  étant  faits,  on  peut  ajouter  que  la  relative  petite  taille  de  l’ADN   permet  un  séquençage  total,  la  détermination  exacte   de  l’enchainement  des nucléotides  avec  des implications  médicales  car  il  y  a des  mutations  de cet  ADN  qui sont responsables  de  maladies  génétiques,  et  aussi  des  implications  génétiques  car,  en  se  transmettant  de  mère  en  fille  sans  remaniement  (les  « crossing-over »  qui  affectent  les  chromosomes)  de  rares  mutations  (un  nucléotide  modifié  en un autre, ou disparu  ou  dédoublé) se  sont accumulées  et  permettent  de  retracer  l’arbre  des  filiations.  Une  société  commerciale  spécialisée  dans les  tests  génétiques a  permis  à  de nombreux  particuliers  de  connaître leur  ADN  mitochondrial et,  par là,   ils  se situent  dans l’arbre  génétique.

 

C’est  justement  l’ensemble  de  ces  analyses  « payantes », collectées (uniquement  dans le cas   les personnes  l’acceptent -  bien  sûr)  dans  une  banque  de  données  qui  viennent de permettre  une méga  mise  à jour  en  doublant  (quasiment)  le  nombre  de séquences,  ce  qui  abouti  à  un arbre  très  détaillé  et,  un  nouveau  regard  sur  cet  ADN  qui  justifie  la  référence  à  Copernic  dans  le  titre  de  l’article  publié  (et de ce  texte) : A   Copernican reassessment of the human mitochondrial genome.  Que  vient  faire  Copernic  dans  cette galère ?   Pour dire qu’une séquence comporte une mutation il faut la comparer, il faut une référence et, au tout début de cette quête c’est la séquence d’un quidam anglais à qui avait échu ce rôle.  Il  s’est vite avéré qu’il s’agissait  d’une séquence très éloignée  de  la  racine de l’arbre  génétique  tel qu’on  pouvait  le reconstruire.  Dans l’article, le pas est franchi et sur la base notamment des  séquences  d’ADN mitochondriaux d’hommes de Neandertal ayant une position externe nécessaire pour « raciner » un arbre, une  séquence théorique,  RSRS, pour  « Reconstructed  Sapiens  Reference  Sequence »  remplit  maintenant ce rôle.

arbre-mtDNA

Sur  la  figure  ci-dessus (extraite  de l’article)  la position  de l’ancienne référence  est  rCRS  (pour « revised Cambridge  Reference  Sequence »). Une observation très utile faite à partir des résultats (mais faite par d’autres avant cet article) a été que les  substitutions, un type de mutations, en excluant par exemple les délétions et les duplications  s’accumulent  de façon quasi  linéaire avec le temps, au rythme de 7 substitutions  tous les 20000 ans ; c’est ce que les abscisses (en haut et en bas de la figure) représentent. Cette figure combine les résultats de  18843  ADN  séquencés (KYBP = Kilo Years Before Present).

Par rapport à  la  théorie  « Out of Africa » qui veut que la sortie d’Afrique se soit fait en une fois, c’est  L3 qui est à la base de tous les ADNs hors d’Afrique avec 2 branches : M  et  N ; la branche M correspond à une migration « sud » longeant les côtes vers l’Inde puis l’Océanie et, vers le nord (sans doute) le passage vers les 2 Amériques , alors que la branche N aboutit aux groupes (on dit « haplogroupes ») couvrant l’Europe et le moyen orient. Le début de la « croissance exponentielle »  figurée par le nombre de groupes, précède le néolithique et est plutôt contemporain de la conquête de l’Europe (et d’autres territoires nordiques) à partir de -50000 ans.  Tous les autres groupes L, L0 à L6  sont  spécifiques à l’Afrique, sauf pour ce qui suit sur le groupe L1b. L0 est un groupe qui est typique des populations ayant une langue à clic  (voir le film : « Les dieux sont tombés sur la tête »).

 

Il  se  trouve  que  mon attention a  été  attirée  par  un  autre  article  portant sur la présence à très basse fréquence d’haplogroupes L en Europe.  Bien entendu, il y a eu toute une série de mouvements de populations assez récents, dont la traite des esclaves, qui expliquent pour partie ces résultats inattendus. En filtrant ces cas, on trouve quelques cas, une cinquantaine à partir de la base de données non encore augmentée (9400 ADN) formant des groupes avec des mutations spécifiques (non connues en Afrique) et dispersés à travers l’Europe.

haplogroupes-L

 

Extrait de : Cerezo et al. (2012) ;  10.1101/gr.134452.111

La figure ci-dessus montre la répartition de l’ensemble des haplogroupes L en Afrique puis du sous groupe L1b, l’une des deux branches de L1  avec L1c .  Il s’agit de groupes dont l’origine est très ancienne et, même les « rameaux » comme L1b1a  sont anciens. Par rapport, toujours, à « Out of Africa » la question posée est celle de mouvements de populations, anciens, et  à l’écart des 2  branches M et N qui, selon ce modèle, sont les seuls à diffuser dans le reste du monde à partir de l’Afrique. La carte ci-dessous est un peu plus précise :

dispersion-L1

 

Ce qui est frappant, c’est la dispersion  de  l’haplogroupe L1b  (et quelques L2)  à  0.5 % ou même moins, à travers l’Europe. Ce que suggèrent ces données c’est une ancienne arrivée de L1b1a  en Europe et évolution sur place. Le groupe L1b1a8, par exemple, est inconnu sur le continent africain alors qu’il y a déjà 6  cas  distincts  connus ayant de telles différences que cela indique un ancêtre commun il y a 10000 ans (pour ce seul groupe). Si l’arrivée de ces L1b1a correspond à une seule migration elle doit être bien antérieure.

Ce que cet article veut montrer c’est que le nombre de séquences mitochondriales connues est maintenant suffisant pour permettre des observations fines. Avec le doublement de la base de données, l’article de Cerezo et al. aurait plus d’une centaine de cas à discuter. Behar et al. (auteurs de l’article  « A Copernican… »)  trouve que l’haplogroupe U, issu de R (voir la figure de l’arbre génétique) est apparu il y a 45000 ans  ce qui en fait un candidat sérieux mais j’ai voulu montrer que la génétique des populations nous réserve encore des surprises et une ancienne migration L1b1a expliquant l’une des cultures paléolithiques reste possible, égratignant au passage  « Out of Africa ». Il est quand même stupéfiant que des personnes de très lointaine origine européenne se découvrent d’un haplogroupe, jusque là considéré comme typique de l’Afrique équatoriale ;  nous sommes tous cousins !      

Pour ceux qui sont tentés : voir http://www.familytreedna.com  ; ils ne sont pas les seuls mais ils sont leaders pour le séquençage .                                                                                                            

 

Partager cet article
Repost0
7 mars 2012 3 07 /03 /mars /2012 04:34


                   

    Derrière ce titre se cache, en fait, la description de la première phase de peuplement selon le modèle « Out of Africa ». Je prends mes distances ici avec le discours dominant du moment et je me rallie aux premiers analystes dont Stephen Oppenheimer en considérant le mont Toba et son éruption il y a 73000 ans comme un élément clé pour comprendre la voie de dispersion des hommes à la conquête du monde.
      Les données de la génétique donnent de façon consistante une date autour de 70 000 ans pour la dernière vague de peuplement partie d'Afrique, dont nous hommes issus. Que trouve la génétique ?  Tous les hommes, hors d'Afrique, sont porteurs de la mutation M168  portée par le chromosome Y. C'est ce groupe porteur de cette mutation qui serait sorti d'Afrique il y a environ 70 000 ans. Ces hommes sortent par la corne de l'Afrique et une « pause » dans la péninsule arabique (alors plus verdoyante) est envisagée. De là une route costale, sans doute sur des pirogues, permet de longer les côtes de l'Inde jusqu'à l'Indonésie . (tracé rouge)

 

Oppenheimer-toba

 

MigrationMap-Oppenheimer

Le point noir sur l'image de droite représente le mont Toba, au nord de l'île de Sumatra, et le tracé bleu la zone immense sur laquelle s'est étendu le nuage de cendre et où on pense que l'éruption a eu une incidence directe. Le tracé des côtes est le tracé actuel mais, peu après le cataclysme il y a eu un refroidissement et sans doute une baisse du niveau des océans. Il est possible que cette baisse ait permis aux hommes d'atteindre l'Australie.Ce qui est important c'est qu'il semble qu'au moins un noyau de migrants ait échappé à la destruction et ait eu une descendance. L'histoire du peuplement « out of Africa » se conjugue donc ensuite au pluriel avec au moins 2 centres de diffusion : un pôle arabique et un pôle Indonésie. Jetons un œil sur l'arbre génétique des différents sous groupes connus.
A gauche l'arbre du chromosome Y , et à droite l'arbre de l'ADN mitochondrial :

Capture-arbreY-mod

 

Capture-arbre-mtDNA

 

 


C'est le haut de l'arbre Y  qui est important. La mutation M168 est sur la branche conduisant de [BT] à [CT] . A partir de [CT] le groupe [DE] est identifié par une insertion « Alu » , ici indiquée par YAP,  alors que l'ensemble [CF]  n'a pas cette insertion Alu et porte la mutation P143. Nous allons nous intéresser aux groupes D, E et C, F issus de ces 2 branches de l'arbre Y . Comme il apparaît sur l'arbre le groupe F est à l'origine de tout un ensemble de sous groupes et représente une « route nord » distincte de la migration sud analysée ici :

 

northern-tree

Il y a eu, secondairement, une migration vers le sud, notamment pour les sous-groupes S, M et H mais ce sont des groupes postérieurs à ce qui est analysé ici (l'après Toba).
Le groupe C défini par la mutation M130, est un groupe frère de F dont la répartition est tout à fait différente : ce groupe est le principal groupe des aborigènes d'Australie et on voit  un gradient de diffusion vers le nord, à travers la Chine et jusqu'en Mongolie. Il y a eu un groupe issu de C qui est arrivé en Amérique où il forme une première strate, il s'agit d'une migration ancienne. Ce groupe C a été repoussé par les sous-groupes issus de F arrivés ensuite, notamment le groupe O, porteur de la civilisation du riz. On a donc un groupe parti de l'Australie qui a diffusé vers l'Asie, y compris vers l'Inde semble-t-il, où il a formé une première strate de peuplement.
Le groupe [DE] est arrivé tel quel jusqu'au Japon mais le groupe D (fortement représenté au japon) se rencontre aussi dans la zone Tibéto Birmane. On peut penser que ce groupe avait fait souche dans la zone Tibéto Birmane où il a réussi à se maintenir puis il s'est enfoncé au nord dans les montagnes du Tibet pour fuir de nouveaux arrivants. Le même groupe avait dû dépasser la zone indonésienne et se retrouve localement dans des zones où il a pu résister au groupe O (Japon). Le groupe E, quant à lui (aussi issu de [DE]) est  uniquement à l'ouest. Ce groupe a pu naître en Arabie  d'où il est retourné vers l’Égypte où il est devenu le principal groupe. Les [DE] et D ont donc eu 3 zones probables de survie : Tibéto-Birmane et la côte vers le Japon, d'où ils ont continué jusqu'en Amérique pour [DE] et D ; zone de « départ » pour E, [DE] ne s'y est pas maintenu jusqu'à nos jours.
L'arbre de l'ADN mitochondrial montre une dichotomie M / N . Le groupe M est surtout sur la côte sud alors que le groupe N et ses nombreux dérivés (non figurés sur l'arbre ci-dessus) peuple l'intérieur de l'Eurasie. N est présent en Australie. On peut envisager que le groupe M a une diffusion liée à celle de [DE]. Le groupe N, quand à lui  a suivi aussi bien C (jusqu'en Australie) que F d'où ont divergé de nombreux sous-groupes. Il y a donc une cohérence entre les dispersions suivies par l'ADN Y et l'ADN mitochondrial.
Le mont Toba dont les géologues ont mis du temps à reconnaître qu'il s'agissait d'un énorme volcan tellement les dimensions de la caldeira sont impressionnantes est-il une « péripétie » ou un élément fondateur de l'histoire humaine ?  Les géologues restent partagés sur l'impact du nuage volcanique à l'échelle de la planète.  Au niveau du peuplement et des cultures la limite Tibéto Birmane semble correspondre aux langues tonales, même si d'autres groupes ont pris le dessus par la suite, il faudrait donc voir dans cette scission une part de l'effet Toba sur l'histoire humaine. Il paraît impossible que ce soit une coïncidence si le peuplement de la planète qui s'est imposé finalement est précisément celui qui a essuyé un tel cataclysme.

Partager cet article
Repost0
16 février 2012 4 16 /02 /février /2012 17:46

L’ADN mitochondrial est localisé dans les mitochondries. C’est un ADN circulaire de 16569 nucleotides. Hommes et femmes ont de l’ADN mitochondrial ; tout homme a le même ADN mitochondrial que sa mère, par contre, il ne transmet pas cet ADN mitochondrial à ses enfants (qui auront celui de leur mère). En effet, il n’y a pas de mitochondries dans les spermatozoides ; les mitochondries sont uniquement dans l’ovocyte. Les lignées d’ADN mitochondrial sont des lignées de mère en fille. Comme pour le chromosome Y les mutations permettent de définir des haplogroupes. Nous allons étudier l’haplogroupe le plus fréquent en Europe, l’haplogroupe H , ce qui sera un bon support pour montrer les méthodes

 et les résultats.

 Carte de l’haplogroupe H :

 

  carte-mtDNA-HCette carte appelle certains commentaires. On présente ici les résultats combinés de tous les sous-groupes connus du grand haplogroupe H.  Sur la carte ci-dessus on voit un groupe fort en Europe qui semble diffuser sur l’Asie et l’Afrique du nord. Voici ma grille de lecture de cette carte : l’haplogroupe H est absent des Amériques, absent d’extrême orient (chine, japon) et d’Océanie, et l’haplogroupe H est absent de l’Afrique noire. Je trouve remarquable que les populations sont de l’haplogroupe H presque en proportion de leur proximité au type blanc européen. Il n’y a pas d’explication mais je trouve que ce constat suffit à souligner l’intérêt de ces analyses.  
Situons maintenant l’haplogroupe H dans l’arbre schématique ci-dessous. H est l’une des branche du groupe R0, dans la grande division N. Sur cet arbre les groupes « ancestraux » L0, L1, L5, L2, L6 et L4 sont tous uniquement africains. On constate que seuls des descendants de L3 sont à l’origine de tous les haplogroupes du reste du monde (hors Afrique). C’est cette constatation qui est a l’origine de la théorie « Out of Africa » : les groupes humains se sont développés dans un premier temps en Afrique et, à partir de L3, il y a sortie d’Afrique. En fait on constate ce qui peut s’interpréter comme une double sortie d’Afrique : branches M et N. La branche M correspondrait à une « route sud », sans doute par cabotage, le long des côtes d’Arabie puis de l’Inde, vers l’Asie du sud Est, l’Océanie. La branche N aurait d’abord investi la péninsule arabique qui jouissait d’un climat plus humide, puis, de ce creuset il y aurait eu expansion vers le moyen orient, l’Europe et l’Asie.

mtDNA-dispersion

Et voici l'arbre simplifié :

 

 

arbre-simple

 

 

Les haplogroupes fréquents en Europe sont H, V, J, T K, U, plus rarement I,W, et X. Ce sont là de grandes divisions mais un haplogroupe comme H comporte plus de 10 branches d'importances inégales. Quelques cartes de sous-groupes :

 

H1


H11

 





J'ai choisi 2 sous groupes dont la dispersion est presque opposée : H1 est plus faible là où H11 est fort. H1 est, de loin, le sous groupe le plus important d'Europe de l'ouest. Voici 2 autres cartes :
Attention, les échelles de coloration ne sont pas les mêmes d'une carte à l'autre. Le groupe H7 est bien moins fréquent que le groupe H1 en France (environ 5 fois moins).

 

 

H7-copie-1

 

 

 

H5a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Arbre des sous-groupes mitochondriaux H :

 

mtDNA-H 2009OK

 

Sur cet arbre sont indiqués les mutations qui définissent les sous-groupes par leur position, entre 1 et 16569, sur l'ADN mitochondrial . Cet arbre montre la variété de l'ADN mitochondrial, rien que pour l'haplogroupe H. Ainsi, la première carte pour l'ensemble de l'haplogroupe H recouvre une réalité variée. Voici une autre carte qui permet de bien voir que la prédominance de l'haplogroupe H1 est spécifique à l'Europe :

 

mtDNA-distrib

L'haplogroupe H1 (en rouge) fait place à un « cocktail » de sous-groupes au moyen orient. On interprète ceci comme une origine probable de H au moyen orient, peut être au Caucase. Seuls certains sous-groupes, dont H1, sont « partis à la conquête de l'Europe ».
On peut reprendre les données précédentes dans un arbre plus général, re-situant l'haplogroupe H dans l'ensemble des groupes mitochondriaux avec des mutations qui structurent cet arbre :
Arbre mitochondrial :

arbre-ADNmito complet

 On a établi qu’une mutation se produit environ tous les 4000 à 5000 ans. C’est très approximatif mais ça permet de tirer un certain nombre d’informations. Les souches N et M telles que nous les connaissons aujourd’hui sont le résultat d’une longue période d’évolution ; les  mutations de la souche M pouvant correspondre à 16000 – 20000 ans et les  mutations de la souche N à 20000 – 25000 ans. Il y a donc eu une lente maturation.

La mention « rCRS » qui signifie « revised Cambridge Reference Sequence » se trouve être un ADN mitochondrial du sous groupe H2a2a, qui a été choisi au début des études comme ADN de référence. Nous allons utiliser les mutations rapportées pour montrer comment on peut schématiquement évaluer l’âge d’un groupe, ou plus exactement d’un  nœud de l’arbre, ici R . Entre rCRS et R on peut compter 11 mutations et sur la branche U il y aurait un nombre semblable de mutations jusqu’au sous-groupe U5b1b qui est un groupe Européen. L’ancêtre commun R vivait il y a 44000 – 55000 ans et avec les 20000 ans précédents on comprend comment la « sortie d’Afrique » est datée de 60000 – 70000 ans. Alors que U est un groupe qui semble avoir été européen dès le début, R0 est un groupe du moyen orient où HV, puis H et V se différencient ultérieurement. 
Les mutations en bleu sur l'arbre ci-dessus sont les mutation de la région autour de l'origine de l'ADN mitochondrial : nucléotides 16024 – 16569 (=0) et 1 – 576. Sur cette section d'environ 1000 nucléotides (par rapport à 16569 pour la taille totale) le taux de mutation est plus important (mais la zone est relativement petite). On observe que sur une durée estimée de 10000 ans 3 mutations vont se produire : 1 dans la région de contrôle (la zone de 1000 nucléotides), et 2 dans la région dite « région codante » (tout le reste de l'ADN mitochondrial).
Les analyses d'ADN mitochondrial sont arrivées à l'âge adulte depuis que toute la molécule , les 16569 nucléotides, peuvent être séquencés et analysés de façon systématique. L'ensemble des ADNs ainsi entièrement séquencés dépasse maintenant 20000 ; on n'est plus limité dans les comparaisons par le manque de données.
La limite actuelle c'est l'interprétation quand on descend au niveau des sous-groupes. L' origine de H est daté d'environ 18000 ans mais de nombreux sous groupes semblent bien plus récents. Une caractéristique de l'ADN qu'il faut garder en tête est qu'il y a un « pool » important de personnes qui sont H ou dites H* c'est à dire avec 1 mutation (sans doute familiale) supplémentaire seulement. C'est ce qui est observé et le fait qu'il y ait des branches ayant accumulé de nombreuses mutations alors qu'un ensemble important de personne conserve l'ADN H d'origine est une difficulté d'interprétation. Selon les auteurs H1 sera Magdalénien (-14000) ou Indo-Européen (premiers néolithiques -9000). On attend la bonne méthode pour analyser ces données. Pendant ce temps les données augmentent et les cartes se précisent. Pour revenir à la carte qui a servi d'introduction on peut dire que l'origine de H est sans doute vers le Caucase mais qu'il y a eu sur la longue période considérée une conquête de l'Europe et sans doute diffusion à partir de l'Europe, peut être avec les fameux Indo-Européens, vers le moyen orient, jusqu'à l'Inde. La zone nord-africaine a une répartition en sous-groupes comparable à l'Europe (sud) ce qui souligne la perméabilité géographique dans ces temps anciens.

Partager cet article
Repost0
7 février 2012 2 07 /02 /février /2012 22:02

L'indo-européen est un concept linguistique a priori irréductible à la génétique, on ne peut pas  vraiment prouver qu'une population, un groupe génétique, est le pendant du regroupement identifié par les linguistes. Il s'agit donc de pistes et non de preuves  même si la carte de répartition de l'haplogroupe  R1a vaut bien des discussions IE  (Indo-Européen):

 

300px-R1a1a distributionOn voit un groupe qui fait le pont entre l'inde et les pays slaves en passant par l'Iran. En Inde c'est le Sanskrit et les langues dérivées qui sont IE et l’idée  d'une origine unique est née de la comparaison avec, notamment, le vieux russe et les langues slaves. Ce sont des langues appartenant au même sous groupe, autrefois dites « Satem » alors que les autres langues sont du groupe « Centum ». Ces langues « Satem » sont le noyau des langues indo-européennes, alors que les langues du groupe Centum sont « satellites ».

 

260px-Centum Satem map

 

 

On constate que l'Europe de l'ouest parle des langues du groupe Centum. La division Ouest Est recoupe à peu près exactement une division génétique : à l'ouest le groupe R1b et à l'Est le groupe R1a. Voici une carte du groupe des R1b d'Europe de l'ouest qu'on doit comparer à la carte R1a ci-dessus :

 

 

Haplogroup_R1b.gif

La complémentarité saute aux yeux ainsi que le fait que l'aire des langues IE suit  le domaine R1a/ R1b. A partir de là nous allons être amenés à retracer l'histoire des R1a et R1b telle que la génétique le permet aujourd'hui. Les 2 groupes sont issus d'un même groupe R1, la séparation daterait d'environ 22 000 ans lors du dernier pic de glaciation au moment où 2 groupes de R1 se sont retrouvés séparés par les conditions climatiques et ont  évolué séparément. L'histoire, qui pourrait être simple : [R1a → Satem] et [ R1b → Centum]  se heurte à une origine génétique trop ancienne par rapport à ce qu'attend la linguistique. Il faudra donc envisager un scénario plus complexe et commencer par suivre nos 2 groupes maintenant individualisés. Ce sera en fait le prétexte d'une histoire limitée aux 2 groupes génétiques les plus fréquents en Europe.


Petit rappel : on désigne par haplogroupe un groupe génétique défini par un marqueur porté par le chromosome Y (ou l'ADN mitochondrial). Le chromosome Y n'est présent que chez les hommes et un père le transmet à son fils, un peu comme on transmet un bâton de relai. Les mutations qui ont pu se produire sont transmises et caractérisent un haplogroupe. Ainsi, les R1 (voir ci-dessus) sont identifiables par la présence de la mutation M173. Les R1a ont en plus la mutation M420 alors que les R1b ont, en plus de M173,  M343. On dira qu'un R1a est M173+, M420+ et M343- alors qu'un R1b est M173+, M420- et M343+. Comme on le constate sur ce petit exemple on garde la trace de l’origine (ici R1-M173).
D'autres mutations sont intervenues par la suite aussi bien chez les R1a que chez les R1b, et ce sont ces nouvelles mutations qui permettent de suivre les groupes dans leurs pérégrinations car on retrouve des individus (petits groupes) laissés en route, témoins de passage. La première carte est celle des mouvements R1a, les phases les plus anciennes étant, bien entendu, les moins bien établies :
On suit le tracé en brun, puis en mauve ; dernière phase en rouge.

 

Migration-R1a-copie-1.jpg

L'origine est incertaine mais il est assez bien établi que le premier groupe R1a a circulé dans la région des plateaux Iraniens, puis vers 8000 av. JC  il migre vers le Caucase et peut être l'Anatolie. Le passage dans les Balkans (Europe) se fait à cette époque. Puis, ce groupe se répand dans toute l'Europe ; on n'est qu'au tout début du néolithique et les R1a ont des concurrents. Des Balkans le groupe est poussé plus au nord vers la Pologne actuelle. Il y a de bonnes raisons d'associer les R1a à la culture  chalcolithique dite de la céramique cordée qui se développe en Europe du nord et repousse les autres peuples en progressant vers l'ouest. Cette progression vers l'ouest sera stoppée et, suite à un reflux vers l'Est il y a une  expansion jusqu'en Inde où le groupe est daté de 1500 av. JC (fin de l’âge du bronze). Plus de 60% des Brahmanes sont R1a et ce sont de proches cousins des Russes et Polonais R1a (confirmé par la génétique). En Inde les R1a sont majoritairement descendants  de la vague récente (1500 av. JC) mais on trouve aussi quelques cas  issus du premier passage au nord de l'Inde.


L’étude du groupe R1b réservait une surprise de taille. La carte ci-dessous est un peu moins précise sur les origines R1b, très discutées, mais probablement proches de R1a.

 

migration-R1b.png La présence au moyen orient des premiers R1b est bien établie, la surprise a été cette branche africaine, un rameau ancien caractérisé par une mutation spécifique (V88) ; il n’y a donc aucun doute, ce ne sont pas des descendants de colons européens.  Je vais rester un peu sur cette découverte récente (mais certaine) pour préciser ce qui a été établi jusqu’à présent et présenter d’autres cartes.

  La carte de droite schématise la scission (ancienne) au sein du groupe R1b primitif entre une branche V88 qui évolue ensuite en Afrique, mais pas seulement et on trouve des V88 dans plusieurs lignées juives (parmi les populations les plus testées). La zone en bleu est celle d’où partiront les vagues de migrations vers l’Europe. Les Arméniens ont une forte proportion de ces R1b  (marqueur L23). La carte de séparation V88 / L23  est montrée ici à titre indicatif car il va falloir préciser cette division de R1b. Reste que la zone V88 a une certaine ressemblance avec la zone de diffusion des langues Chadiques, un groupe des langues Afro-asiatiques, donc pas indo-européen.

 

 

 

R-V88

V88-L389

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Vous trouverez sur bien des sites web que R1b vient d’Anatolie. La vérité est qu’on ne sait pas si le passage vers les Balkans s’est fait via l’Anatolie ou via le Caucase mais il est certains que vers 3500 av. JC (il y a 5500 ans) une branche de R1b L23+, c'est-à-dire porteurs du marqueur L23 , apparaissent en Europe de l’Est et leur arrivée est liée semble-t-il au travail du cuivre (la génétique ne peut pas prouver le travail du cuivre, c’est l’aire de diffusion et la période qui le suggère).

 

Voici une carte de ces premiers R1b en Europe.

Busby ht35

Il y a eu une tentative d’implantation en Suisse et en Italie mais cette première vague semble avoir essuyé un blocage. La zone plus claire au dessus de la zone d’implantation de ces R1b est la zone d’expansion R1a, les 2 populations ne se mélangent pas bien ! Pourtant la zone de ces R1b correspond à la culture Yamna souvent proposée comme origine des Indo-européens. J’insiste, on peut focaliser sur ces premiers R1b européens grâce à des marqueurs spécifiques qui permettent de filtrer les européens de l’ouest correspondants à des phases de peuplement ultérieurs.
Je vais faire court sur la dernière phase de  « conquête » R1b. Elle correspond à la culture des vases Campaniformes qui se développe à partir de l’ouest de l’Europe dès 2800 av. JC au Portugal. Les R1b ont trouvé un moyen de contourner et d’aborder l’Europe par l’ouest. Un passage possible est : Italie du nord, Corse, Sardaigne, côte d’Afrique du nord puis sud de la péninsule ibérique par petites embarcations.

Soit les R1b parlaient une langue proche du Basque actuel et l’IE est venu des populations en place influencées par les R1a, soit la culture Yamna a acquis l’IE par un contact suivi avec leurs voisins cordés et la différence centum/ satem vient de ce que les nouveaux locuteurs ont introduit une prononciation altérée. Cette dernière approche qui semble la plus probable. Même si le détail n’est pas maîtrisé on aboutit à une description assez cohérente  de la linguistique, de la génétique.

Partager cet article
Repost0
29 janvier 2012 7 29 /01 /janvier /2012 22:54

Le point important de cet article c'est le lien entre une destinée particulière et un contexte historique. Je remercie Walt Gabennesch d'avoir attiré mon attention sur ses trouvailles. A la suite d'un travail pointu en généalogie une hypothèse se profilait mais la génétique a révélé un imprévu qui fait tout l'intérêt du cas.

La généalogie classique avait permis à Michael Gabennesch de retracer ses origines européennes jusqu'à la petite ville de Schruns de la vallée de Montafon dans le Vorarlberg Autrichien, la partie de l'Autriche proche du Liechtenstein ; voir cartes :

Schruns-Montafon

 

Nous sommes dans le pays des Rhètes, dont l'ancien territoire est rappelé ci-dessous. Aujourd'hui c'est un pays de langue alémanique (comme en Suisse) qui a donc une spécificité en Autriche. liechtenstein-map

   L'ancienne langue Rhète, qu'on croit apparentée à l’Étrusque, a tout à fait disparu mais il reste des noms particuliers à cette région. A ce stade il semblait qu'une origine Rhète était l'aboutissement.

Un test génétique du chromosome Y a profondément modifié la vision qu'on peut se faire des origines des Gabennesch / Gavanesch . Le nom parait d'origine Rhète, même si on ne sait pas décrypter cette langue mais le test a montré que cette lignée se rattache par son chromosome Y à l'haplogroupe E-U209 dont l'expansion semble associée à celle des Bantou. Ce peuple d'Afrique noire dont l'origine semble se situer vers la côte d'Ivoire est reconnu comme un des principaux peuples ayant exporté le travail du fer, la métallurgie, à travers toute l'Afrique, jusqu'en Afrique du sud. Ainsi Desmond Tutu, dont le génome a été séquencé est lui aussi du groupe E-U209 ; un lointain cousin (par les hommes) .

carte-RAETIA

Distribution of haplogroup e1b1a in Rosa 2007 On peut comprendre cette expansion qui va bien au delà de la zone Bantou proprement dite en considérant que les forgerons dans bien des ethnies ont été des Bantous, une sorte de caste de forgerons.

Il est quand même étonnant de retrouver une lignée de E-U209 dans les Alpes. On doit d'abord s'interroger sur la date cet évènement et les haplotypes connus peuvent nous aider. Malheureusement, les personnes qui font des tests sont rares en Afrique noire et il y a peu de E-U209 dans les bases de données pour des comparaisons.

Qu'est-ce que cet E-U209 ? Le grand haplogroupe E a 2 composantes principales : les E1b1a et les E1b1b , ces derniers occupent la partie non occupée sur la carte de l'Afrique ci contre ; l’Afrique du nord et de l'est (Égypte) et plus au nord au proche orient. Les E1b1a quant à eux , dont l'arbre est présenté ci-dessous sont les noirs africains qui, dans leur expansion ont repoussé les Pygmées et les Boshimans ; les peuples aborigènes de l'Afrique.

 

arbreE1b1a

 

 

Les études qui ont permis de dresser cet arbre n'ont malheureusement pas fourni les haplotypes qui seraient nécessaires pour une comparaison. Il a donc fallu se tourner vers les tests faits par des gens qui font ces tests en tant que particuliers ; ils se nomment « hobbyists » en anglais.

 

Voici un tableau pour 4 haplotypes :

 

 tab4hap

 

 

Seuls 12 marqueurs sont montrés ici. On peut constater que ces 4 haplotypes forment un groupe. La comparaison sur 37 marqueurs permet de se convaincre que l'origine commune est assez récente. Il faut quand même préciser que la comparaison sur un nombre d'haplotypes aussi réduit laisse une grande incertitude sur le résultat. Dans le cas présent le calcul donne une estimation de 800 ans depuis l'ancêtre commun. L'hypothèse la plus simple est que le nom de famille Gavanesch (et autres variantes) s'est établit vers l'an 1200 et qu'une seule lignée a pris ce nom. A part les Gavanesch les haplotypes sur 37 marqueurs testés E-U209 sont rares. Il n' y a que 2 cas dans les banques de données publiques qui puissent servir de comparaison. Le résultat est imprécis mais on aurait un groupe avec une origine en Europe il y a 1400 ans, soit en 600 mais une arrivée 200 ou 300 ans plus tôt est envisageable.

L'équipée d'Hannibal Barca en 218 av. JC est le genre de mouvement de soldats ayant pu être à l'origine de l'arrivée d'un africain dans les Alpes mais, plus récemment, les romains, ayant investi la région qu'ils nommaient Raetia prima ont maintenu là des troupes pour que les Germains soient contenus. Parmi les auxiliaires il y auraient eu au moins un soldat d'origine Bantou.

La génétique peut elle fournir davantage de pistes ? La réponse est oui. Ce qui va manquer ce sont de bons éléments de comparaison car les africains sont peu testés mais, avec le temps de nouveaux marqueurs SNPs vont pouvoir être comparer. Des sous groupes de E-U209 ont été identifiés et on va savoir , par exemple si les SNPs L609 et L611 trouvés en analysant l'ADN de Walt sont portés aussi par Fletcher (par exemple – voir tableau) ce qui permettrait d'aller plus loin que le groupe des porteurs d'un nom de type Gavanesch / Gabennesch. On peut souligner ici comment les particuliers impliqués dans ces analyses font progresser la connaissance sur les haplogroupes.

 

Pour résumer et conclure, la génétique a permis d'identifier sur toute une lignée bien caractérisée en généalogie classique (un remarquable travail de fond ayant permis de remonter jusqu'en 1477 réalisé par Michael Gabennesch) un haplogroupe de type africain. La comparaison des haplotypes de plusieurs Gavanesch / Gabennesch montre qu'ils appartiennent tous à une seule lignée, on peut en déduire que nous n'avons jusqu’à' à présent qu'une seule origine du nom, stabilisé vers 1200. Plus anciennement 1 ou 2 haplotypes avec des noms différents indiquent une origine du groupe européen vers 600 mais avec une grande incertitude. On peut considérer que ce résultat conforte l'hypothèse d'un soldat romain d'origine Bantou en garnison dans l'ancienne Raetia prima. D'autres tests sont en cours pour cerner de plus près cette improbable ascendance.

 

 

PS : Je dois revenir sur les échanges fructueux que j'ai eu tout au long de la rédaction de cet article avec Walt Gabennesch. Il m'indique que l'expansion Bantou pourrait être plus ancienne que ce qu'on pensait (au moins 1000 av. JC) et pas seulement liée à la métallurgie mais aussi à l'exploitation de la Banane et de l'Igname entre autres cultures.

Partager cet article
Repost0
25 janvier 2012 3 25 /01 /janvier /2012 11:28

oetzi

 

 

 

L'ADN  d' Ötzi, ce corps momifié retrouvé en 1991, a été  séquencé  (en partie) et on a pu déterminer l'haplogroupe du chromosome Y.  Cet  homme  s'avère  être  de  l'haplogroupe  G2a2b  défini par le marqueur SNP L91. Qu'est-ce que cela nous apprend ?

Ce  n'est  pas  la  première  fois  que  la  paléogénétique  identifie un européen  paléolithique comme  étant  de  l'haplogroupe G . La  plupart  des  squelettes  néolithiques analysés à ce jour ont été trouvés de cet haplogroupe G . La situation est surprenante car cet haplogroupe G  est tout à fait minoritaire en Europe aujourd’hui, sauf en quelques localisations comme en Corse du sud et en Sardaigne qui peuvent apparaître comme des zones refuges – voir carte :

 

 haplogroup G


 

 

Sans rentrer dans trop de détails il faut quand même préciser qu’une carte globale pour G mêle 2 branches bien distinctes G1 et G2 . Les G1 sont extérieurs à l’Europe et occupent aujourd’hui les hauts plateaux d’Iran, mais la concentration visible au Portugal représente le lègue Avares et peut être en quelques autres localisations. La zone qui nous occupe concerne les Alpes ; on peut penser que les plus hautes densités visibles là et en Italie centrale ont formé un seul domaine qui fut ensuite disjoint. Il faut insister sur les densités en général assez basses, en moyenne environ 3% de la population.

Cet article veut, à la fois se pencher sur les origines d’ Ötzi  et faire le point sur les hypothèses concernant ce groupe G et le peuplement de l’Europe.  On aura noté les fortes densités visibles dans le Caucase, notamment chez les Ossètes.  Certains ont voulu y voir  l’origine de vagues de migrations. Ces migrations ont eu lieu aussi vers le sous continent Indien où on retrouve d’assez proches cousins des populations européennes. Néanmoins, une analyse plus poussée montre que la majorité des Européens G2  sont G2a3b1a2-L497, un groupe spécifique de l’Europe. Voici un tableau pour situer les groupes et les relations :

 

 Arbre G2a


 

 

Le groupe G2a2b  auquel appartient Ötzi  est actuellement inconnu sur le continent et on ne le trouve qu’en Sardaigne. La concentration G en Grèce (voir carte – ci-dessus) est G2a3a alors que le groupe principal en Europe est dérivé de G2a3b1 (marqueur P303). Ce sont des G2a3b1 qu’on trouve aussi en Inde (et aussi, pour partie, dans le Caucase). L’évolution en G2a3b1a1 (marqueur U1) et G2a3b1a2 (marqueur L497) semble particulière à l’Europe mais des cas isolés ont été identifiés hors  Europe. Les groupes de type G2a1 sont Circassiens pour l’essentiel.

 

Dans le cas d’ Ötzi nous disposons d’une datation indépendante des estimations de la génétique et on nous dit qu’ Ötzi a vécu il y a 5400 ans (3400 avant JC). Pour situer, les premières traces de travail du cuivre en Europe (justement dans les Alpes) sont datées de 3700 avant JC. C’est nettement postérieur aux artefacts connus au moyen orient mais cela correspond à une seconde phase de la métallurgie du Cuivre, à la technologie améliorée qui annonce les débuts du bronze. Vous trouverez souvent que la métallurgie est nettement postérieure en Europe à ce qui s’est fait au moyen orient. A partir de cette phase, ce n’est vrai que pour l’extension, les zones sont restreintes en Europe et ne s’étendent que difficilement jusqu’à l’avènement du bronze. Si j’ai insisté sur le cuivre c’est que, justement, Ötzi était porteur d’une hache en cuivre ; la lame est en cuivre, une vraie rareté  à l’époque, et son assaillant ne lui a pas pris cette hache.

Que dit la génétique, concernant la datation des groupes G en Europe ? L’analyse des G2a3b1a qui forment, de loin, le groupe le plus important, les densités  dans les Alpes et en Italie étant largement attribuables à ces G2a3b1a, montre un groupe sans doute ancien mais les densités plus importantes s’expliquent par une phase d’expansion environ 1200 av JC, précédée d’une autre phase d’expansion vers  3800 av JC. En fait, ces dates semblent légèrement biaisées ; des dates plus récentes de 300 ans dans la marge d’erreur donnent une image plus cohérente. Pour faire court, on aurait eu un groupe néolithique dont un sous groupe a acquis très anciennement pour l’Europe la métallurgie (cuivre) vers 3400 av. JC, un prolongement de ce groupe donnera la culture de Villanova (à partir de 1100 av. JC), elle-même à l’origine des Etrusques. L’extension romaine a véhiculé en partie ce groupe  G en Europe.

Le groupe antagoniste qui expliquerait l’absence de G dans la plaine du Pô est sans doute le groupe dit de Remedello, célèbre pour ses poignards en Cuivre. Il y aurait eu conflit entre  2 cultures du Chalcolithique. 

 

Pour revenir  à notre  Ötzi,  il décède  dans la première phase d’expansion. L’historique qui précède suggère que le groupe avait des voisins peu enclins au développement de ces fondeurs de cuivre. Le groupe G2a2b n’a pas survécu, semble-t-il dans cette région. Impossible de dire si les  G2a3b1a rescapés ont fait partie des rivaux. L’ADN mitochondrial, qui suit la lignée par les femmes a aussi été séquencé et Ötzi est de l’haplogroupe mitochondrial K1, connu par 3 lignées  dans les Alpes mais la lignée particulière d’ Ötzi est inconnue par ailleurs. Les débuts du cuivre en Europe ont donc été chaotiques. Ce sont surtout les Campaniformes qui vont diffuser plus tard leurs poignards en cuivre et cette diffusion (très discutée) semble partir du Portugal, un peu comme si la piste Italienne avait été une tentative sans lendemain, en tous cas sans progression continue. On peut considérer le développement ultérieur de G en Italie comme une spécificité issue, sans doute, d’une culture cousine de celle d’ Ötzi.

 

C’est un cas de remplacement de populations. Nous avons suivi des populations G mais déjà la culture de Remedello, et plus tard celle des Campaniformes, représente, sans doute, les débuts du groupe R1b dont descendent aujourd’hui plus de la moitié des hommes d’Europe de l’ouest.

 

Partager cet article
Repost0
19 janvier 2012 4 19 /01 /janvier /2012 21:53
  

 

 

Cet article aborde la nouvelle vision de l'histoire de l'Europe telle qu'elle se dégage de l'analyse génétique du chromosome Y. Il y a d'autres blogs bien documentés sur le sujet et, en particulier, on pourra consulter le blog de Bernard Secher, bien pourvu en références. [1] Je prendrai ici une perspective simplificatrice afin de pointer ce que je considère comme radicalement novateur et les conséquences que cela peut avoir dans la compréhension de l'histoire des 10 000 ans qui nous ont précédés.

[1] http://bsecher.pagesperso-orange.fr/Genetique.htm

 

arbre-R1b

 

 

 

Le principe de l'utilisation de marqueurs du chromosome Y est que les populations en place (comprendre : la position des ancêtres connus ; en général au moins le 19èmesiècle) reflètent une histoire qu'il s'agit de décrypter. La première simplification est que nous n'allons nous intéresser ici qu'au groupe majoritaire dit R1b qui est défini par tout une série de marqueurs dont M343 ; tous les  R1b ont porteurs de la mutation M343 et d'autres mutations. M269, par exemple, définit la branche, désignée R1b1a2  ; les R1b de l'Europe en sont issus. Ici, on se contentera de savoir qu'il s'agit de mutations ponctuelles qui ne se produisent que très rarement. On nomme ces marqueurs SNP ; qui signifie « Single Nucleotide Polymorphism ». Les R1b de l'Europe de l'ouest peuvent être analysés par une longue série de marqueurs. Dans le tableau ci-dessus il faut comprendre que les R1b1a2 portent les mutations suivantes : M343, L278, M415, P25, P297, L320, L265, M269, S17, M520, S3, S10, S13. J'insiste sur le nombre de mutations car il souligne l'histoire commune que cela sous-tend. Ce groupe est notre point de départ et quelques mutations ultérieures, permettent le suivi de ce qu'on peut voir comme « une conquête de l'Europe », dont l'histoire n'a pas conservé de trace sauf celle qui apparaît avec les nouveaux outils de génétique.

 

Les principaux groupes :

 

 

Maintenant que le groupe R1b1a2 a été introduit nous allons, en quelque sorte, remonter le temps, et commencer par établir les principaux sous groupes de R1b1a2 .

 

 

Le groupe R-U106 :

 

Busby U106Myers-U106

 

 

Les 2 cartes ci-dessus proviennent de 2 études récentes. L'échantillonnage et le logiciel de traitement des données pour tracer les cartes sont différents. Le groupe R-U106 est très présent en Hollande. En Angleterre, l'expansion U106 reflète assez bien la progression des Saxons. Difficile de dire, si, en France, il y a une quelconque analogie avec le pouvoir Franc même si c'est une hypothèse séduisante. C'est un groupe plus Germanique que Celtique qui a pu connaître une expansion assez récente, par exemple, celle des Saxons.

L'analyse SNP montre qu'il y a une dichotomie du groupe R1b1a2 en Europe de l'ouest, avec d'une part le groupe U106, dont on connaît maintenant de nombreuses divisions, et par ailleurs tous les autres sous groupes qui se rassemblent comme groupe R-P312. 3 branches de R-P312 sont connues : U152, L21, et Z196 mais il y a encore environ 15% des R-P312 qui n'appartiennent à aucun de ces 3 sous groupes. L'histoire du groupe R-P312 paraît donc plus dispersée que celle de R-U106. En Angleterre et en Allemagne les R-U106 et R-P312 sont mélangés mais en Hollande il y a peu de R-P312 et une étude en Brabant a montré une sorte de frontière nord – sud avec les R-U106 au nord et les R-P312 au sud. J'insiste sur ces limites pour indiquer que, sans doute, les R-P312, qu'on peut voir comme « pré-celtiques », ne se sont mélangés aux R-U106 qu' à une période assez récente.

 

 

Le groupe R-U102 :

 

Busby U152

 

 

Ce groupe, selon la carte, semble particulièrement important en Italie. En fait, on pense que les invasions Germaniques ont repoussé ces populations Celtiques et que les R-U152 ont été plus importants en Allemagne du sud, là où la toponymie a montré une ancienne présence de populations Celtes. Il y aurait eu expansion, par l'Est, vers la France et un peu au delà. Donc ce sont, non seulement des U152 mais aussi des P312 qui est le groupe parent, équivalent à R-U106 vu ci-dessus.

 

Je ne montre pas de cartes pour les 2 autres sous groupes qui ont été identifiés récemment ; pour le groupe R-L21 ont pourra se reporter au blog de B. Secher qui est R-L21 ; ce groupe est principalement dans les îles britanniques mais aussi en Bretagne et, plus largement sans doute autour de la Bretagne. Il est possible que le groupe R-L21 ait été répandu sur une plus vaste zone puis repoussé par l'expansion des R-U152. On connaît maintenant de nombreux sous groupe de R-L21 mais l'échantillonnage en France reste insuffisant.

Le groupe Z196 a surtout été connu par l'un de ses sous-goupes , R-SRY2627, un groupe de l'Espagne du nord et du sud ouest de la France. Ils pourraient être les Aquitains de l'antiquité romaine.

On aurait donc une sorte de partitionnement géographique avec les U152 initialement à l'Est et les R-L21 au nord ouest, alors que les Z196 sont plus présent au sud ouest.

L'ensemble des R-U106 et des R-P312 de tous poils se retrouve comme R-L11, dont voici la carte de répartition :

 

Busby RL11Myers-L11

 

 

Ce sont les cartes de R-L11 des 2 mêmes études. Il s'agit de l'ensemble des U106 et P312, plus quelques R-L11* n'ayant ni la mutation U106, ni la mutation P312 (d'où l'étoile). C'est le groupe principal de l'Europe de l'ouest , représentant de l'ordre de 60% des hommes.

 

L'ancienne division ht15 / ht35 :

 

Busby ht35

 

 

La carte ci-dessus montre des « R1b » dont on notera la quasi absence en Europe de l'ouest, là où les R-L11 sont presque entièrement rassemblés. L'existence de ces 2 sortes fut identifiée très tôt par les premières études utilisant la sonde p49a,f dans une approche RFLP avec l'enzyme de restriction Taq1. Je ne détaille pas, mais les premières cartes montraient la division ci-dessus : les ht15 à l'ouest et les ht35 à l'Est. En fait, la carte ci-dessus montre les groupes parents de R-L11, à savoir ceux qui portent la mutation L23 et ceux qui ont en plus la mutation L51.

Depuis le groupe R1b1a2 on a la succession : L23 → L51 → L11

Difficile alors d'échapper à la conclusion que des R-L11, partis de l'Est de l'Europe, région Pontique, en particulier, ont connus un grand développement en Europe de l'ouest. La zone plus claire, au nord de la zone Pontique, correspondant en gros à la Pologne et à la Russie a vu le développement dans la même période du groupe Slave (R1a). La répartition actuelle a sans doute été influencée par cette expansion Slave.

On peut comparer la carte R-L23 + R-L51 à cette autre carte limitée au groupe R-L23 :

 

Myers-L23

 

 

La localisation est encore plus à l'Est, à l'exception de cas Suisses mal compris. On notera au sud caucase la zone Arménienne . Les Arméniens se révèlent, en effet, avoir une fraction de 30% de R-L23 environ. On peut donc interpréter les cartes comme l'arrivée et le succès d'un groupe semblable à ces Arméniens en Europe de l'ouest avec sans doute une étape dans la zone Pontique et les Balkans.

Reste à savoir QUAND une telle migration a eu lieu et comment expliquer l'énorme succès en Europe de l'ouest. La génétique peut répondre en partie à la question du « quand » car la variance des marqueurs de type STR dans un groupe est une mesure de son âge. Il n'y a pas plein accord sur les taux de mutations ; les résultats qui suivent ne font donc pas l'unanimité mais ils fournissent une trame cohérente et c'est un point important.

La surprise est, en effet, que l'ensemble R-L11 de l'Europe de l'ouest, donc tous les U106 et P312 confondus, forment un groupe remarquablement cohérent dont l'âge ne dépasse pas les 5000 ans (donc 3000 avant JC ). On est donc conduit à admettre qu'un groupe sans doute de petite taille a réussi à s'imposer aux populations néolithiques en place.

Que se passe-t-il en Europe de l'ouest vers 3000 avant JC (en se rappelant que les dates sont approximatives) ? C'est le tout début de petits objets en cuivre dans quelques localisations. C'est aussi le début des monuments mégalithiques. Les recherches ont montré qu'un groupe amené à prendre de l'extension , le groupe des Campaniformes, qui tirent leur nom de leurs céramiques (poteries) en forme de cloche renversée, produit les plus anciennes poteries dites campaniformes au Portugal vers 2900 avant JC.

La génétique ne prouve pas le lien avec les Campaniformes mais elle renouvelle le débat. Il est certain que , pour reprendre l'ancienne classification bien pratique, les ht35 de l'Est sont antérieurs aux ht15 de l'ouest ; l'examen des SNPs le prouve puisque les ht35 n'ont que L23 et L51 alors que les ht15 ont L23 et L51 et différents autres SNPs dont L11. On aurait donc un groupe arrivant de l'Est de l'Europe et qui s'impose à l'ouest précisément à une période où des changements notables ont eu lieu. Les R1bs seraient arrivés avec la métallurgie à ses débuts (en Europe), ce qui correspond aussi dans le domaine agricole au travail à l'araire et dans le domaine minier à l'utilisation de char à roues ; ces 2 progrès supposent une traction animale et, justement, on découvre que le cheval fait son apparition en Europe de l'ouest . Il me semble que le succès découle de ces éléments.

Si on accepte le lien avec les Campaniformes, reste à décrypter la raison de l'existence de 2 branches principales, U106 et P312 et les voies de pénétration. Il y a une thèse qui propose que les R1bs auraient fait le tour par l'Afrique du nord et seraient remontés par le Portugal et la péninsule Ibérique (thèse de A. Klyosov). Si on suit la métallurgie du cuivre en Europe on constate que la zone géographique (actuelle) des ht35 correspond à la diffusion d'une phase préliminaire. Une sorte de « second âge du cuivre » se développe ensuite vers la Corse sans doute via l'Italie du nord où plusieurs centres précoces de métallurgie du cuivre sont connus puis atteint le Portugal. Il est possible qu'à partir de la Corse une phase maritime cabotant le long de l'Afrique du nord et du sud de l'Espagne ait permis d'atteindre le Portugal. Ce n'est que 500 ans plus tard avec les premiers bronze à l'arsenic, puis les bronzes à l'étain que les Campaniformes connaissent une grande expansion.

 

Partager cet article
Repost0
17 janvier 2012 2 17 /01 /janvier /2012 22:50

p { margin-bottom: 0.21cm; }a:link { }

Cet article rend compte des résultats d'une étude publiée  sur la génétique du chromosome Y du descendant de Jérôme Bonaparte, frère de l'empereur Napoleon, ainsi que de tests réalisés sur des cheveux de l'empereur. C'est, à mon sens, un bon exemple de l'utilisation de ces nouvelles techniques de généalogie génétique. Deux types de tests sont pratiqués. Les tests SNPs établissent la position dans l'arbre Y et dans le cas présent établissent que l'haplogroupe est E , et plus précisément qu'il s'agit du groupe défini par la mutation M34. On dit que ces personnes sont M34+ et on note E-M34 ce sous groupe du grand (haplo)groupe E . Le second type de test concerne les marqueurs dits STR, acronyme pour « Short Tandem Repeat » ; ce sont les « empreintes génétiques » . On repère un nombre de répétitions (en tandem) qui, justement, varie assez fréquemment et permet un tableau de valeurs caractéristique d'un individu mais aussi d'une lignée ; et donc de faire des comparaisons et de chercher des parents proches. Pour info, c'est ce second type de test qui est particulièrement visé par la loi française actuelle.

 

Tableau  des  haplotypes :

 

http://sd-4.archive-host.com/membres/images/90261920431217746/Tableau-Napoleon.png

 

p { margin-bottom: 0.21cm; }a:link { }

Le tableau de valeur ci-dessus est donné pour 21 marqueurs mais la comparaison a été faite sur 37 marqueurs et davantage de tests seraient possibles. Il ne s'agit pas ici de discuter dans le détail de la variance au sein de ce groupe de M34+ . On remarquera que pour le marqueur DYS454 l'haplotype (nom donné à l'ensemble des valeurs ) du descendant des Bonapartes présente une nette différence. Ce genre de variation est assez rare et si un jour on retrouvait cette caractéristique on aurait une bonne piste sur l'origine géographique des Bonapartes. La dispersion géographique est importante . L'article a été publié avant que le marqueur L792 soit mis en évidence. Ce marqueur SNP permet de préciser que le groupe d'origine pour les Bonapartes est sans doute le sous-groupe des L792+ qui ne concerne qu'une petite fraction des M34+. L'ADN Bonaparte n'a pas encore été testé pour L792 mais c'est une piste solide.

 

J'ai voulu commencer par présenter des résultats bruts. On voit que la comparaison avec les résultats « Savard » fait apparaître des correspondances. Il s'agit là d'une lignée aujourd'hui canadienne , la principale source d'information sur les origines françaises. On peut regretter le manque de données françaises, même si l'origine italienne, à Sarzane, des Bonapartes est établie.

L'haplogroupe E est un groupe dont l'origine, encore discutée, est vers le sud de l’Égypte et ceci sans référence immédiate au fameux « out of Africa ». Il y a 3 branches importantes qui partent du tronc principal :

  •  
    • la branche E-M81 est importante chez les Berbères d'Afrique du nord

    • la branche E-M78 suit les conquêtes arabes (et donc se surimpose aux E-M81)

    • la branche E-M123 que nous allons envisager ici.

 

Globalement, la branche E-M123 est davantage présente au proche orient, et plus au nord, dans les Balkans et au nord de la mer noire, ainsi que sur les côtes nords de la méditerranée, Espagne, France, Italie et Grèce. Il y a 3 sous groupes de E-M123 connus. E-M34 est le plus important et c'est justement celui de la lignée Bonaparte. Le marqueur M34 a été identifié en 2004, date de la première étude. Il s'agit donc de découvertes relativement récentes ; les groupes concernés étaient insoupçonnés des archéologues. En comparant les haplotypes (les valeurs comme celles du tableau ci dessus) on peut faire une estimation de l'âge des groupes et on aboutit à un âge d'environ 7000 ans pour le groupe E-M34 (5000 av. JC). Les endroits où on a trouvé des fortes concentrations de E-M34 sont les alentours de la mer morte. C'est sans doute à partir du proche orient que des migrations ont eu lieu dans les pays du pourtour nord de la méditerranée. Toute la question est donc : depuis quand cette présence en Europe de colonies E-M34 ?

Il y a une marge de progression car on a maintenant identifié un nouveau marqueur, L792, et la lignée Savard est porteuse de ce marqueur L792. Si on détermine que la lignée Bonaparte est aussi membre de ce sous groupe de E-M34 on aura une piste bien plus précise. Il faut ici remarquer le rôle déterminant des particuliers dans cette approche, puisque ce sont des tests privés qui ont abouti à la découverte de L792 et les comparaisons ci-dessus se font avec des résultats de particuliers mis sur une banque de données publique. Un monde mal connu dans ce pays puisque régulièrement fustigé. Plutôt que de savoir si Bonaparte est bien caucasien je préfère savoir qu'elle est la répartition des E-M34 et, plus précisément, des E-L792. L'article discuté ici est donc une porte ouverte vers l'identification d'un groupe qui n'a pas laissé de trace archéologique mais dont un représentant place sous les feux de la rampe l'un de ces petits groupes (des commerçants?) qui ont aussi fait l'histoire de l'Europe.

 

 

 

 

Remerciements à Denis Savard pour la communication des résultats en cours et pour d'utiles discussions.

Partager cet article
Repost0
6 janvier 2012 5 06 /01 /janvier /2012 00:24

<!-- @page { margin: 2cm } P { margin-bottom: 0.21cm } -->


 

 

 

Cet article vise à actualiser ce qu'on peut trouver, en français, concernant l'origine du chien. Il se trouve que 2 articles scientifiques récents mettent le point final à une querelle de plus de 10 ans. Il restera des points à éclaircir mais l'essentiel semble acquis. L'équipe dirigée par Peter Savolainen aura eu raison. L'un des 2 articles mentionnés est le dernier article d'une série commencée en 2002 : « Origins of Domestic Dogs in Southern East Asia is supported by analysis of Y-Chromosome DNA » Zing et al. (2011). Le titre rappelle le point principal soutenu par Peter Savlainen : le chien est originaire de l'Asie du sud Est, c'est à dire la Chine du sud (sud du fleuve Yangtse). Je vais revenir sur les étapes de cette démonstration. L'autre article est une confirmation par une autre équipe : « Phylogenetic Distinctiveness of Middle Eastern and Southeast Asian Village Dog Y Chromosomes Illuminates Dog Origins » (2011) S.K. Brown et al.

Le séquençage du génome du chien a été publié en 2005. Avant cette date il n'était donc pas possible de travailler avec le chromosome Y puisqu'on ne connaissait ni SNPs ni STRs. Seul l'ADN mitochondrial pouvait permettre d'identifier des haplogroupes. Plusieurs thèses vont s'affronter car la collecte des échantillons, en particulier en Chine, n'a pas été facile. Il fallait des loups de différentes origines et des chiens d'origines les plus variées possibles. L'équipe de Savolainen a fait le bon choix en collaborant avec des scientifiques chinois . En 2002 sort l'article : « Genetic evidence for an East Asian origin of dogs » (2002) Savolainen P. et al. Il est établi que les chiens se regroupent en 6 groupes (haplogroupes) dont 3 seulement ont une réelle extension et ce n'est qu 'en Asie du sud Est qu'on trouve tous les groupes. Cette étude ne portait que sur 526 chiens et seule la région de l'ADN mitochondrial proche l'origine de réplcation et connue pour avoir un taux élevé de mutation, dite « région de contrôle », était étudiée. Un autre article plus complet fut publié en 2009 avec 1543 chiens étudiés dont 169 séquençages complets, ce qui permet une bien meilleure précision. L'étude confirme en tous points ce qui avait été publié en 2002 et précise que l'origine est au sud du fleuve Yangtse . Ces résultats étaient obtenus par l'ADN mitochondrial et donc la lignée femelle ; il restait la possibilité de croisements répétés ultérieurs avec des loups d'autres origines. Les analyses Y viennent de confirmer qu'on trouve de même que les chiens appartiennent à 5 haplogroupes et qu'on ne trouve les 5 groupes Y qu'en Asie du Sud Est.

Le chien est une domestication du loup. Les travaux décrits ci-dessus montrent que presque tous les chiens actuels descendent d'une domestication ayant eu lieu en Chine du sud. Il y a la possibilité que des domestications ultérieures aient eu lieu ; c'est ainsi que sont interprétés les groupes mineurs trouvés par Savolainen. Environ 98% des chiens sont originaires du sud Est asiatique. Il reste la possibilité que certains chiens soient issus d'autres événements de domestications. Les sites archéologiques ont révélés des restes anciens de canidés mais il est difficile de différencier loup et chien. J'insiste ici sur le fait qu'il est possible qu'il y ait eu des chiens issue d'une domestication séparée en Europe mais aucune des races conservées par les éleveurs du 19ème siècle (et avant) n'en descend . Il est possible que cette situation soit le pendant de ce qui semble s'être passé pour les humains : les agriculteurs sont venus avec leurs chiens et de même que les descendants de ces agriculteurs du moyen orient ont pris le pas sur les populations indigènes d'Europe (Cro Magnon) les chiens asiatiques ont pris le pas sur leurs analogues européens. Ceci dit, la migration depuis la Chine du sud reste un mystère car il n'y a pas de migration de groupes (haplogroupes) humains répertoriée de l'Asie du Sud Est vers le moyen orient puis l'Europe.

Savolainen, par des arguments de statistique, arrive à la conclusion que la domestication du loup en Asie du sud Est n'a pas concerné un seul couple mais une centaine de fondateurs, ce qui implique une véritable culture où les loups ont été apprivoisés. Par ailleurs, une datation approximative de cet événement aboutit à une date d'environ 15000 ans, ce qui, avec l'erreur importante liée à une telle estimation fait des domesticateurs de probables agriculteurs ou au moins des pasteurs. Les chiens obtenus à partir des loups de Chine du sud peuvent avoir eu des avantages, qui expliqueraient la rapide diffusion aux autres régions du monde.

 

 

Post Scriptum :

L'article Savolainen est de Z. Ding at al. et voici un lien :

http://www.nature.com/hdy/journal/vaop/ncurrent/full/hdy2011114a.html

 

Les auteurs suggèrent que les chiens ont été domestiqués en partie comme source de nourriture ; en période de disette les chiens pouvaient être tués et remplacés ensuite (à partir de loups locaux). Ceci pourrait expliquer pourquoi les groupes qui ont diffusé les chiens ailleurs dans le monde n'ont PAS continué à consommer les chiens ; il n'était pas possible de les remplacer et c'était sans doute un objet d'échange assez précieux. Le groupe humain responsable de cette diiffusion pourrait être le groupe Y  Q1, connu pour avoir largement colonisé les amériques et qui est aussi trouvé en Turque et en Inde (donc sur une très large étendue). Ce groupe n'est cependant pas de la Chine du sud. Le groupe Q1 pourrait donc avoir joué un rôle important dans la diffusion mais l'origine de la domestication revient sans doute à un autre groupe.

 

Partager cet article
Repost0
28 décembre 2011 3 28 /12 /décembre /2011 22:30

Le mot est lancé : tests génétiques . Déjà , on sait que les discussions seront âpres. C'est une tribune postée en octobre dernier et que je viens de trouver en faisant un tour d'horizon "google" des mots clé : "généalogie génétique" ( une façon de prendre le poul de ce qui s'écrit fin 2011) qui m'incite à faire cet article en vue d'une discussion plus large. La tribune postée ici :

http://www.rfgenealogie.com/s-informer/infos/nouveautes/loi-bioethique-revisee-rien-de-nouveau-sous-le-soleil-genealogique

a le mérite d'être bien pourvue en liens et de cibler le côté légal. Je vais donc suivre cette piste en prenant  le taureau par les cornes et en faisant le point des techniques et des enjeux.

Le législateur en France fait mine de considérer le cas des tests génétiques comme bien réglé et la modification de la loi sur la bioéthique sans évolution des textes sur les tests génétiques a été une façon  de revalider un texte obsolète sans en parler. Que dit la loi française ? Voici quelques liens utiles :

http://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000023711923&cidTexte=LEGITEXT000006070721

http://www.net-iris.fr/veille-juridique/actualite/27795/la-loi-bioethique-de-2011-adapte-aux-evolutions-de-la-societe-francaise.php

Je retiens 2 points de la loi : premièrement le texte de 2004 met en avant les "empreintes génétiques" , ensuite la loi bioéthique de 2011 fait mine d'avoir dépoussiéré en labelisant 2011 un texte qui n'est toujours pas plus précis et qui continue à cibler les dites empreintes sans mieux les définir.

 Il faut dès lors que je me lance dans une tentative d'explication de texte. En 2004, on pouvait comprendre sans trop d'ambiguités que le texte faisait référence à une avancée récente (en 2004) de nos connaissances du génôme. On a trouvé chez tous les organismes supérieurs, dont l'homme, des sites (nombreux) où l'ADN présente une  organisation répétée en tandem du type AGTCAGTCAGTCAGTCAGTC qui se lit (ici) [AGTC]5x. Il s'agit d'un exemple. Ces zones sont l'objet de mutations beaucoup plus fréquentes par perte ou gain d'un motif répété. Donc, il ne s'agit pas d'une mutation ponctuelle de l'ADN mais d'un "begaiement" de notre génétique. Il n'y a pas de fonction connue et il n'y a aucun gène touché : c'est tout à fait neutre vis à vis de nos fonctions vitales , dans notre compréhension actuelle. Ce sont ces mutations, mal comprises mais bien décrites, qui sont utilisées et nommées "empreintes génétiques". Présentes sur TOUS nos chromosomes elles permettent de faire des sortes de codes barres où chacun est repérable et où les filiations peuvent être prouvées (ou non). En 2004 c'était ça et seulement ça qui était visé. Cette méthode d'investigation est comme on le sait très utilisée par la police car on peut la pratiquer sur des traces infimes en amplifiant, préalablement à l'analyse, l'ADN des échantillons. En une dizaine d'années l'ADN est devnu incontournable ; on pouvait comprendre un certain émoi il y a encore 5 ou 6 ans et qu'il ait été relativement facile d'effrayer le badaud.

Où en sommes nous en 2011 ? Premier point, les évolutions dont je vais parler se font sans les compagnies et labos français qui sont en quelque sorte sur la touche . Il se trouve qu'en parallèle du développement des tests basés sur les "empreintes génétiques" on n'a pas vu venir les progrès du séquençage ADN . Aujourd'hui le projet "1000 genomes" a passé le cap des 2000 genômes (humains) entièrement séquencés :

voir : http://www.1000genomes.org/

 Je ne veux pas ergoter mais il me paraît impossible de lire sous "empreintes génétiques" la séquence complète d'un individu ! Or, des compagnies proposent déjà de tels séquençages car la technique avance à grand pas (pas en France encore une fois) et les tarifs chûtent. je renonce à mettre en ligne ici un lien mais il n'y a que le coût encore prohibitif pour un quidam moyen qui fasse barrage. L'automatisation a été un facteur déterminant et aujourd'hui il est possible à ceux qui ont les derniers robots de séquencer 1000 génomes par mois. je donne ces informations uniquement pour montrer une évolution rapide en marche. C'est dans ce contexte qu'on veut nous présenter un dépoussiérage sur l'air de "tout va très bien madame la marquise" ; d'où ce billet d'humeur. En gros, on va vers un séquençage complet pour une somme d'environ 5000 euros et une qualité acceptable. Ce n'est pas donné mais ça devient accessible à pas mal de revenus quand même ; non ?

 Sans aller jusqu'au séquençage total il est possible aujourd'hui pour 300 euros d'obtenir la séquence complète de son ADN mitochondrial. Je ne vois pas comment une personne qui se soit fait faire un tel séquençage total pourraît tomber sous le coup de la loi précitée sauf à torturer les mots et à leur faire dire n'importe quoi. L'un des points de cet article est de combattre l'idée reçue que toutes les analyses ADN sont interdites en France aux particuliers ; et le faire savoir.

 Une autre technique est née en 2008, plus exactement, elle est devenue accessible aux particuliers : l'analyse par puce ADN. le principe de la puce ADN est bien plus ancien mais l'application à l'analyse des gènes  par une compagnie dans un but de prédiction de risques est récente. le succès a été au rendez-vous au plan international, sous les quolibets des mêmes qui avaient empêché les tests génétiques en france. On cible des polymorphismes connus et ce qui fait débat c'est la qualité prédictive. Sans surprendre, je pense qu'on peut dire que si la qualité en 2008 était encore faible la situation change. Cette méthode d'analyse est clairement entrée dans la pratique grace à son coût durablement plus faible que le séquençage total. La puce proposée aujourd'hui teste 1 million de polymorphismes (pour environ 150 euros) et bientôt ce seront 2 millions de polymorphismes et une meilleure compréhension et analyse des résultats. Au passage, ces tests analysent le chromosome Y et l'ADN mitochondrial pour une analyse, non pas des empreintes génétiques mais des mutations ponctuelles qui ont jalonné les dernières 100 ou 200 générations et qui permettent aux scientifiques de définir des "haplogroupes" du chromosome Y (quand on suit les mutations apparues sur le chromosome Y) ainsi que les haplogroupes mitochondriaux. Ces tests par puce ADN ont permis, lorsqu'une banque de données suffisament importante existe d'identifier des parentés lointaines (cas de juifs, ou d'arméniens, par exemple).

 Peut être qu'en 2004 on pouvait douter et penser que le point de vue français aurait la vertu de modérer les tests et qu'on empêchait ainsi des débordements de la technique. J'accuse les promoteurs de ces dispositions d'avoir freiné tout développement sur l'ADN au niveau des laboratoires d'analyse ; je parle d'une activité de services et pas de 3 ou 4 labos pointus nécessaires aux analyses juridiques et policières. On ne peut pas continuer comme ça.






Poster un message



SPIP 2.0

Partager cet article
Repost0