Introduction à la phylogénie
Si l'on réfléchit quelques minutes à cet aphorisme célèbre, on réalise immédiatement que l'objet de base en biologie n'est ni la cellule, ni l'organisme, mais bel et bien l'Arbre, l'Arbre des espèces reliées entre elles par l'intermédiaire de leur ancêtre commun. Et la construction et la compréhension de cet arbre est un enjeu majeur de la biologie moderne.
Le but de la phylogénie est de classifier les êtres vivants. Cette classification est basée sur les liens de parentés entre espèces, seul critère réellement scientifique et utile d'un point de vue biologique.
La méthode traditionnelle de classification phylogénétique s'appelle la cladistique. Elle est fondée sur la notion de caractères homologues. Un caractère est "un attribut observable d'un organisme". Classiquement, la cladistique repose sur la classification de groupes frères, à partir d'une liste de caractères. Elle commence par la définition d'un extragroupe (out group en Anglais), animal dont on est sûr qu'il est extérieur au groupe d'étude. Cet animal permettra en particulier de définir une liste de caractères primitifs.
Le cas d'école est de considérer trois espèces à classer (au hasard l'homme, le chat, et l'aigle) et un outgroupe (par exemple la truite). La classification revient à savoir quelles sont les deux espèces les plus proches en regard de la troisième. On construit alors tous les arbres phylogénétiques possibles. A partir des caractères sélectionnés, on choisit l'arbre "correct" suivant le principe de parcimonie. L'idée simple est que si deux caractères sont communs entre deux espèces, il est plus plausible a priori que ce caractère dérive de leur ancêtre commun plutôt qu'il soit apparu indépendamment : on identifie donc les modifications de caractères d'une espèce à l'autre et on choisit l'arbre qui minimise le nombre de mutations. Par exemple, le chat et l'homme sont tous deux des mammifères, contrairement aux oiseaux et à la truite qui pondent des oeufs : ils sont donc plus proches l'un de l'autre qu'ils ne le sont de l'aigle. Cela paraît simple a priori, mais l'exercice demande en fait beaucoup de données biologiques pour des phylogénies plus fines, à l'intérieur d'un même grand sous-groupe. Il faut que le nombre de caractères soit suffisamment élevés pour déterminer l'arbre sans amibiguité.
L'un des intérêts du séquençage des génomes est évidemment qu'il devient possible de considérer les séquences génétiques comme des caractères à part entière, et donc d'appliquer la cladistique aux séquences de protéines. L'approche bioinformatique a dans un premier temps confirmé les résultats d'analyses cladistiques traditionnelles, avant de réorganiser certaines phylogénies de façon plus surprenante. Chez les bactéries, on peut par exemple suivre les transferts "horizontaux" d'une espèce à l'autre : les bactéries peuvent en effet s'échanger de l'information génétique entre espèces, si bien que les branches de l'arbre peuvent se rejoindre, fusionner, se séparer de nouveau. Plus près de nous (toutes proportions gardées), on s'est aperçu que certains nématodes (les vers) ont évolué très rapidement et ont divergé très vite des autres animaux alors qu'ils sont en fait phylogénétiquement proches des insectes. Ces réorganisations de l'arbre du vivant posent des questions incroyablement profondes d'un point de vue de l'évolution, car si la cladistique traditionnelle basée sur la simple observation s'est trompée, cela signifie que certains caractères ou mécanismes de développement apparemment non homologues sont beaucoup plus proches qu'on ne le croit...
Références :
Illustration : "L'arbre de la vie" de Klimt, qui sert de logo à la société européenne d'evo-devo
Un très beau site : l'arbre de la vie
Classification phylogénétique du vivant, de Guillaume Lecointre et Hervé Le Guyader, un très bon bouquin très accessible qui explique en langage clair les principes de classification et propose la classification la plus récente.