Javascript must be enabled to continue!
Recherche automatisée de motifs dans les arbres phylogénétiques
View through CrossRef
La phylogénie permet de reconstituer l'histoire évolutive de séquences ainsi que des espèces qui les portent. Les récents progrès des méthodes de séquençage ont permis une inflation du nombre de séquences disponibles et donc du nombre d'arbres de gènes qu'il est possible de construire. La question qui se pose est alors d'optimiser la recherche d'informations dans ces arbres. Cette recherche doit être à la fois exhaustive et efficace. Pour ce faire, mon travail de thèse a consisté en l'écriture puis en l'utilisation d'un ensemble de programmes capables de parcourir et d'annoter les arbres phylogénétiques. Cet ensemble de programmes porte le nom de TPMS (Tree Pattern Matching Suite). Le premier de ces programmes (tpms_query) permet d'effectuer l'interrogation de collections à l'aide d'un formalisme dédie. Les possibilités qu'il offre sont : La détection de transferts horizontaux : Si un arbre de gènes présente une espèce branchée dans un arbre au milieu d'un groupe monophylétique d'espèces avec lesquelles elle n'est pas apparentée, on peut supposer qu'il s'agit d'un transfert horizontal, si ces organismes sont des procaryotes ou des eucaryotes unicellulaires. La détection d'orthologie : Si une partie d'un arbre de gènes correspond exactement à l'arbre des espèces, on peut alors supposer que ces gènes sont un ensemble de gènes d'orthologues. La validation de phylogénies connues : Quand l'arbre des espèces donne lieu à des débats, il peut est possible d'interroger une large collection d'arbres de gènes pour voir combien de familles de gènes correspondent à chaque hypothèse. Un autre programme, tpms_computations, permet d'effectuer des opérations en parallèle sur tous les arbres, et propose notamment l'enracinement automatique des arbres via différents critères, ainsi que l'extraction de sous arbres d'orthologues (séquence unique par espèce). Il propose aussi une méthode de détection automatique d'incongruences. La thèse présente le contexte, les différents algorithmes à la base de ces programmes, ainsi que plusieurs utilisations qui en ont été faites
Title: Recherche automatisée de motifs dans les arbres phylogénétiques
Description:
La phylogénie permet de reconstituer l'histoire évolutive de séquences ainsi que des espèces qui les portent.
Les récents progrès des méthodes de séquençage ont permis une inflation du nombre de séquences disponibles et donc du nombre d'arbres de gènes qu'il est possible de construire.
La question qui se pose est alors d'optimiser la recherche d'informations dans ces arbres.
Cette recherche doit être à la fois exhaustive et efficace.
Pour ce faire, mon travail de thèse a consisté en l'écriture puis en l'utilisation d'un ensemble de programmes capables de parcourir et d'annoter les arbres phylogénétiques.
Cet ensemble de programmes porte le nom de TPMS (Tree Pattern Matching Suite).
Le premier de ces programmes (tpms_query) permet d'effectuer l'interrogation de collections à l'aide d'un formalisme dédie.
Les possibilités qu'il offre sont : La détection de transferts horizontaux : Si un arbre de gènes présente une espèce branchée dans un arbre au milieu d'un groupe monophylétique d'espèces avec lesquelles elle n'est pas apparentée, on peut supposer qu'il s'agit d'un transfert horizontal, si ces organismes sont des procaryotes ou des eucaryotes unicellulaires.
La détection d'orthologie : Si une partie d'un arbre de gènes correspond exactement à l'arbre des espèces, on peut alors supposer que ces gènes sont un ensemble de gènes d'orthologues.
La validation de phylogénies connues : Quand l'arbre des espèces donne lieu à des débats, il peut est possible d'interroger une large collection d'arbres de gènes pour voir combien de familles de gènes correspondent à chaque hypothèse.
Un autre programme, tpms_computations, permet d'effectuer des opérations en parallèle sur tous les arbres, et propose notamment l'enracinement automatique des arbres via différents critères, ainsi que l'extraction de sous arbres d'orthologues (séquence unique par espèce).
Il propose aussi une méthode de détection automatique d'incongruences.
La thèse présente le contexte, les différents algorithmes à la base de ces programmes, ainsi que plusieurs utilisations qui en ont été faites.
Related Results
Combinatorics of trees under increasing labellings : asymptotics, bijections and algorithms
Combinatorics of trees under increasing labellings : asymptotics, bijections and algorithms
Combinatoire des arbres sous étiquetages croissants : Asymptotiques, bijections et algorithmes
Dans cette thèse nous étudions des classes d’arbres étiquetés selon d...
Adaptive Learning and Mining for Data Streams and Frequent Patterns
Adaptive Learning and Mining for Data Streams and Frequent Patterns
Aquesta tesi està dedicada al disseny d'algorismes de mineria de dades per fluxos de dades que evolucionen en el temps i per l'extracció d'arbres freqüents tancats. Primer ens ocu...
Towards a chronology of life using Lateral Gene Transfers
Towards a chronology of life using Lateral Gene Transfers
Utilisation des transferts horizontaux de gènes pour dater des phylogénies
Le fait d'avoir une généalogie datée des organismes vivants est l'un des principaux objec...
Numéro 49 - janvier 2007
Numéro 49 - janvier 2007
La mise en place du nouveau plan d’accompagnement et de suivi des chômeurs en juillet 2004 fut l’objet de controverse. Ce plan a été abondamment débattu lors de son introduction pa...
Combinatoire algébrique des arbres
Combinatoire algébrique des arbres
Cette thèse se situe dans le domaine de la combinatoire algébrique et porte sur la construction de plusieurs structures combinatoires et algébriques sur différentes espèces d'arbre...
Reaction wood formation in Poplar (populus Spp.) at cell wall level
Reaction wood formation in Poplar (populus Spp.) at cell wall level
Formation du bois de tension de peuplier (populus Spp.) à l'échelle pariétale
Les arbres sont capables de contrôler leur forme et de résister à la gravité grâce à l...
Ancestral Reconstruction and Investigations of Genomics Recombination on Chloroplasts Genomes
Ancestral Reconstruction and Investigations of Genomics Recombination on Chloroplasts Genomes
Reconstruction ancestrale et investigation de recombinaison génomique sur chloroplastes génomes
La théorie de l’évolution repose sur la biologie moderne. Toutes les...
Sequential Pattern Generalization for Mining Multi-source Data
Sequential Pattern Generalization for Mining Multi-source Data
Généralisation de motifs séquentiels pour la fouille de données multi-sources
La digitalisation de notre monde est souvent associée à une production de grandes quan...

