Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Computational methods for de novo assembly of next-generation genome sequencing data

View through CrossRef
Méthodes de calcul pour assemblage de novo de nouvelle génération des techniques de séquençage du génome Dans cette thèse, nous présentons des méthodes de calcul (modèles théoriques et algorithmiques) pour effectuer la reconstruction de séquences d'ADN. Il s'agit de l'assemblage de novo de génome à partir de lectures (courte séquences ADN) produites par des séquenceurs à haut débit. Ce problème est difficile, aussi bien en théorie qu'en pratique. Du point de vue théorique, les génomes sont structurellement complexes. Chaque instance d'assemblage de novo doit faire face à des ambiguïtés de reconstruction. Les lectures peuvent conduire à un nombre exponentiel de reconstructions possibles, une seule étant correcte. Comme il est impossible de déterminer laquelle, une approximation fragmentée du génome est retournée. Du point de vue pratique, les séquenceurs produisent un énorme volume de lectures, avec une redondance élevée. Une puissance de calcul importante est nécessaire pour traiter ces lectures. Le séquençage ADN évolue désormais vers des génomes et méta-génomes de plus en plus grands. Ceci renforce la nécessité de méthodes efficaces pour l'assemblage de novo. Cette thèse présente de nouvelles contributions en informatique autour de l'assemblage de génomes. Ces contributions visent à incorporer plus d'information pour améliorer la qualité des résultats, et à traiter efficacement les données de séquençage afin de réduire la complexité du calcul. Plus précisément, nous proposons un nouvel algorithme pour quantifier la couverture maximale d'un génome atteignable par le séquençage, et nous appliquons cet algorithme à plusieurs génomes modèles. Nous formulons un ensemble de problèmes informatiques pour incorporer l'information des lectures pairées dans l'assemblage, et nous étudions leur complexité. Cette thèse introduit la notion d'assemblage localisé, qui consiste à construire et parcourir un graphe d'assemblage partiel. Pour économiser l'utilisation de la mémoire, nous utilisons des structures de données optimisées spécifiquement pour la tâche d'assemblage. Ces notions sont implémentées dans un nouvel assembleur de novo, Monument. Enfin, le dernier chapitre de cette thèse est consacré à des concepts d'assemblage dépassant l'assemblage de novo classique.
Agence Bibliographique de l'Enseignement Supérieur
Title: Computational methods for de novo assembly of next-generation genome sequencing data
Description:
Méthodes de calcul pour assemblage de novo de nouvelle génération des techniques de séquençage du génome Dans cette thèse, nous présentons des méthodes de calcul (modèles théoriques et algorithmiques) pour effectuer la reconstruction de séquences d'ADN.
Il s'agit de l'assemblage de novo de génome à partir de lectures (courte séquences ADN) produites par des séquenceurs à haut débit.
Ce problème est difficile, aussi bien en théorie qu'en pratique.
Du point de vue théorique, les génomes sont structurellement complexes.
Chaque instance d'assemblage de novo doit faire face à des ambiguïtés de reconstruction.
Les lectures peuvent conduire à un nombre exponentiel de reconstructions possibles, une seule étant correcte.
Comme il est impossible de déterminer laquelle, une approximation fragmentée du génome est retournée.
Du point de vue pratique, les séquenceurs produisent un énorme volume de lectures, avec une redondance élevée.
Une puissance de calcul importante est nécessaire pour traiter ces lectures.
Le séquençage ADN évolue désormais vers des génomes et méta-génomes de plus en plus grands.
Ceci renforce la nécessité de méthodes efficaces pour l'assemblage de novo.
Cette thèse présente de nouvelles contributions en informatique autour de l'assemblage de génomes.
Ces contributions visent à incorporer plus d'information pour améliorer la qualité des résultats, et à traiter efficacement les données de séquençage afin de réduire la complexité du calcul.
Plus précisément, nous proposons un nouvel algorithme pour quantifier la couverture maximale d'un génome atteignable par le séquençage, et nous appliquons cet algorithme à plusieurs génomes modèles.
Nous formulons un ensemble de problèmes informatiques pour incorporer l'information des lectures pairées dans l'assemblage, et nous étudions leur complexité.
Cette thèse introduit la notion d'assemblage localisé, qui consiste à construire et parcourir un graphe d'assemblage partiel.
Pour économiser l'utilisation de la mémoire, nous utilisons des structures de données optimisées spécifiquement pour la tâche d'assemblage.
Ces notions sont implémentées dans un nouvel assembleur de novo, Monument.
Enfin, le dernier chapitre de cette thèse est consacré à des concepts d'assemblage dépassant l'assemblage de novo classique.

Related Results

Next Generation Sequencing Technologies and Their Applications
Next Generation Sequencing Technologies and Their Applications
Abstract The advances in next generation sequencing (NGS) technologies have tremendous impacts on the studies of structural and f...
Whole Genome Resequencing and 1000 Genomes Project
Whole Genome Resequencing and 1000 Genomes Project
Abstract The recent advances in sequencing technologies have enabled the whole human genome to be sequenced within weeks. To date, several human...
Abstract 1658: Performance evaluation of assembly based structural variation discovery in paired tumor normal samples
Abstract 1658: Performance evaluation of assembly based structural variation discovery in paired tumor normal samples
Abstract Structural variations (SVs) are well known to contribute to genetic diversity of human populations, affect biological functions, and cause various human ...
DengueSeq: A pan-serotype whole genome amplicon sequencing protocol for dengue virus v1
DengueSeq: A pan-serotype whole genome amplicon sequencing protocol for dengue virus v1
Background Amplicon-based sequencing (PrimalSeq) was developed in response to the Zika virus epidemic due to difficulties generating complete genomes using metagenomic approaches [...
A High-Quality De novo Genome Assembly from a Single Mosquito Using PacBio Sequencing
A High-Quality De novo Genome Assembly from a Single Mosquito Using PacBio Sequencing
A high-quality reference genome is a fundamental resource for functional genetics, comparative genomics, and population genomics, and is increasingly important for conservation bio...
A High-Quality De Novo Genome Assembly from a Single Mosquito using PacBio Sequencing
A High-Quality De Novo Genome Assembly from a Single Mosquito using PacBio Sequencing
AbstractA high-quality reference genome is a fundamental resource for functional genetics, comparative genomics, and population genomics, and is increasingly important for conserva...
The Annotation of De Novo Genome Assembly of the Silkworm, Bombyx mori Linn., Strain Nang Tui as Thai reference genome
The Annotation of De Novo Genome Assembly of the Silkworm, Bombyx mori Linn., Strain Nang Tui as Thai reference genome
Thailand is one of the most famous silk production regions, where silkworms (Bombyx mori Linn.) have been reared for sericulture for a long time. Thai silk holds the cultural impor...
Next-generation sequencing with emphasis on Illumina and Ion torrent platforms.
Next-generation sequencing with emphasis on Illumina and Ion torrent platforms.
Abstract Background: Next-generation sequencing is a type of deep sequencing. In comparison to the previously used Sanger's method, ...

Back to Top