Informatics Educational Institutions & Programs
Sommaire
En biologie moléculaire, les séquences homologues sont deux ou plusieurs séquences nucléotidiques partageant une origine évolutive commune, c'est-à-dire présentant une homologie au sens de l'évolution moléculaire. Deux segments d'ADN distincts sont susceptibles d'avoir une origine commune à la suite d'une spéciation (orthologie), d'une duplication (paralogie) ou d'un transfert horizontal de gènes[1]. L'homologie de l'ADN, de l'ARN et des protéines est généralement déduite de similitudes de la séquence des acides nucléiques ou des peptides traduits : de fortes similitudes entre séquences sont l'indication d'une origine commune. Les techniques d'alignement de séquences multiples permettent de préciser quelles régions de chaque séquence sont homologues.
Identité, similitude, conservation
L'homologie de séquences est une notion distincte de leur degré d'identité ou de similitude. Ainsi, on parle parfois de « pourcentage d'homologie » pour signifier « similitude de séquence », en utilisant le pourcentage de résidus identiques (dit pourcentage d'identité) ou le pourcentage de conservation des propriétés physicochimiques des résidus (leucine et isoleucine par exemple, dit pourcentage de similitude) pour quantifier un « degré d'homologie entre séquences », ce qui est une terminologie erronée : si des séquences peuvent être plus ou moins semblables, elles sont en revanche ou bien homologues, ou bien non homologues, mais ne peuvent être partiellement homologues — elles peuvent en revanche être partiellement semblables. Plus précisément, on parlera d'homologie partielle lorsqu'une séquence présente des segments homologues qui ne s'étendent pas sur toute la longueur de la séquence, ce qui peut résulter d'une fusion de gènes (en).
L'homologie de séquences est également distincte de la conservation de certains résidus d'acides aminés jouant un rôle spécifique dans une protéine, qui restent identiques ou sont remplacés par des résidus aux propriétés physicochimiques semblables dans toutes les protéines de même fonction. À l'instar des traits morphologiques et anatomiques, des séquences peuvent en effet présenter des similitudes sous l'effet d'une convergence évolutive, voire simplement par hasard, notamment pour les courts segments, ce qui signifie qu'elles ne sont pas homologues, bien qu'elles soient semblables.
Typologie des séquences homologues
Orthologie
Des séquences homologues sont orthologues si on pense qu'elles ont divergé à partir d'une séquence ancestrale commune à la suite d'une spéciation : lorsqu'une espèce se scinde en deux espèces, les copies du gène d'origine dans chacune des deux nouvelles espèces sont dites orthologues. Ce terme a été introduit en 1970 par le spécialiste en évolution moléculaire Walter M. Fitch (en)[2].
L'orthologie est strictement définie par l'existence d'un ancêtre commun. Dans la mesure où il est difficile d'établir l'ascendance exacte des gènes en raison des duplications et des réarrangements de génomes qui surviennent au cours des générations, la preuve que deux gènes sont orthologues provient généralement d'études phylogénétiques reprenant les lignées de gènes. Les protéines orthologues partagent le plus souvent — mais pas toujours — la même fonction physiologique dans les cellules[3].
Paralogie
Des séquences homologues sont paralogues si on pense qu'elles ont divergé à la suite d'une duplication de gènes. Deux gènes paralogues peuvent être présents dans plusieurs endroits du génome d'une même espèce ou entre plusieurs espèces. Ainsi, l'hémoglobine humaine et la myoglobine du chimpanzé sont paralogues.
Les gènes paralogues peuvent structurer des génomes entiers et ainsi expliquer largement l'évolution des génomes. C'est par exemple le cas des boîtes homéotiques comme les gènes Hox chez les animaux. Ces gènes n'ont pas seulement connu des duplications sur leur chromosome mais également à travers l'ensemble du génome, raison pour laquelle ils se retrouvent sur de nombreux chromosomes chez les vertébrés, les clusters HoxA-D étant les plus étudiés[4].
On dit souvent que les orthologues présentent davantage de similitudes fonctionnelles que les paralogues à similitude séquentielle comparable, mais plusieurs publications remettent en cause cette conception[5],[6].
Notes et références
- (en) Eugene V. Koonin, « Orthologs, Paralogs, and Evolutionary Genomics », Annual Reviews of Genetics, vol. 39, , p. 309-338 (PMID 16285863, DOI 10.1146/annurev.genet.39.073003.114725, lire en ligne)
- (en) Walter M. Fitch, « Distinguishing Homologous from Analogous Proteins », Systematic Biology, vol. 19, no 2, , p. 99-113 (PMID 5449325, DOI 10.2307/2412448, lire en ligne)
- (en) Gang Fang, Nitin Bhardwaj, Rebecca Robilotto et Mark B. Gerstein, « Getting Started in Gene Orthology and Functional Analysis », PLoS Computational Biology, vol. 6, no 3, , article no e1000703 (PMID 20361041, PMCID 2845645, DOI 10.1371/journal.pcbi.1000703, lire en ligne)
- (en) Jozsef Zakany et Denis Duboule, « The role of Hox genes during vertebrate limb development », Current Opinion in Genetics & Development, vol. 17, no 4, , p. 359-366 (PMID 17644373, DOI 10.1016/j.gde.2007.05.011, lire en ligne)
- (en) Romain A. Studer et Marc Robinson-Rechavi, « How confident can we be that orthologs are similar, but paralogs differ? », Trends in Genetics, vol. 25, no 5, , p. 210-216 (PMID 19368988, DOI 10.1016/j.tig.2009.03.004, lire en ligne)
- (en) Nathan L. Nehrt, Wyatt T. Clark, Predrag Radivojac et Matthew W. Hahn, « Testing the Ortholog Conjecture with Comparative Functional Genomic Data from Mammals », PLoS Computational Biology, vol. 7, no 6, , article no e1002073 (PMID 21695233, DOI 10.1371/journal.pcbi.1002073, Bibcode 3111532, lire en ligne)