Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Event extraction from facsimiles of ancient documents for history studies

View through CrossRef
Extraction d'événements à partir de fac-similés de documents anciens pour les études en histoire À l'heure de la numérisation massive des sources historiques, l'extraction automatique des événements est une étape cruciale dans le traitement des textes historiques. Le traitement des événements est un domaine de recherche actif dans la communauté du traitement automatique du langage naturel, mais les ressources et les systèmes sont principalement développés pour le traitement des textes contemporains.Dans ce contexte, cette thèse vise à extraire automatiquement des événements à partir de documents historiques.Cette thèse propose des échanges pluridisciplinaires afin d'adapter les ontologies récentes à des fins de recherche en histoire.Au-delà des besoins spécifiques des humanités numériques, les documents historiques OCRisés datant de plus d'un siècle sont loin de ce que les approches contemporaines ont l'habitude de traiter. Que ce soit au niveau de la diachronie, de la qualité et de l'adaptation au domaine, le traitement de ce type de document pose des problèmes majeurs en TAL. Nous proposons alors des techniques d'adaptation au domaine combinant l'utilisation d'architectures spécialisées récentes et des étapes de prétraitement, permettant de réduire l'impact de ces difficultés tout en tirant parti des ressources contemporaines.Enfin, sur la base d'un paradigme récent consistant à traduire des tâches comme un problème de questions-réponses, nous proposons un pipeline d'extraction d'événement adapté au traitement de documents historiques. De l'extraction d'un mot déclenchant un événement dans une phrase à la représentation de plus d'un siècle d'événements sous forme de graphes, nous proposons une exploration ciblée d'une grande quantité de sources historiques.
Agence Bibliographique de l'Enseignement Supérieur
Title: Event extraction from facsimiles of ancient documents for history studies
Description:
Extraction d'événements à partir de fac-similés de documents anciens pour les études en histoire À l'heure de la numérisation massive des sources historiques, l'extraction automatique des événements est une étape cruciale dans le traitement des textes historiques.
Le traitement des événements est un domaine de recherche actif dans la communauté du traitement automatique du langage naturel, mais les ressources et les systèmes sont principalement développés pour le traitement des textes contemporains.
Dans ce contexte, cette thèse vise à extraire automatiquement des événements à partir de documents historiques.
Cette thèse propose des échanges pluridisciplinaires afin d'adapter les ontologies récentes à des fins de recherche en histoire.
Au-delà des besoins spécifiques des humanités numériques, les documents historiques OCRisés datant de plus d'un siècle sont loin de ce que les approches contemporaines ont l'habitude de traiter.
Que ce soit au niveau de la diachronie, de la qualité et de l'adaptation au domaine, le traitement de ce type de document pose des problèmes majeurs en TAL.
Nous proposons alors des techniques d'adaptation au domaine combinant l'utilisation d'architectures spécialisées récentes et des étapes de prétraitement, permettant de réduire l'impact de ces difficultés tout en tirant parti des ressources contemporaines.
Enfin, sur la base d'un paradigme récent consistant à traduire des tâches comme un problème de questions-réponses, nous proposons un pipeline d'extraction d'événement adapté au traitement de documents historiques.
De l'extraction d'un mot déclenchant un événement dans une phrase à la représentation de plus d'un siècle d'événements sous forme de graphes, nous proposons une exploration ciblée d'une grande quantité de sources historiques.

Related Results

Event Management Bandung Sneaker Season
Event Management Bandung Sneaker Season
Abstract. Bandung Sneaker Season is the first sneakers and streetwear event to be held in Bandung, an annual event that was first created in 2018 by Maks.co Event Organizer. At the...
Museums, Do you Copy?: Standards on the Care and Handling of Facsimiles Exhibited in Museums
Museums, Do you Copy?: Standards on the Care and Handling of Facsimiles Exhibited in Museums
This project aims to analyze the current practices of the care and handling of facsimiles in museums in the United States. Once exhibited in the museum, facsimiles become part of t...
Strategi Komunikasi Pemasaran Melalui Event
Strategi Komunikasi Pemasaran Melalui Event
Abstract. PT Amerta Indah Otsuka held an event to improve and maintain its products. The event organized by PT Amerta Indah Otsuka is the Pocari Sweat Run 2024 event, which is a ma...
Facsimiles and the History of Shakespeare Editing
Facsimiles and the History of Shakespeare Editing
Is a facsimile an edition? In answering this question in relation to Shakespeare, and to early modern writing in general, the author explores the interrelationship between the begi...
Utilizing Large Language Models for Geoscience Literature Information Extraction
Utilizing Large Language Models for Geoscience Literature Information Extraction
Extracting information from unstructured and semi-structured geoscience literature is a crucial step in conducting geological research. The traditional machine learning extraction ...
Event management evaluation indicators in enterprise management
Event management evaluation indicators in enterprise management
The article develops a set of indicators that will make it possible to evaluate event management in enterprise management as fully as possible. During the research, directions for ...
Trends in web data extraction using machine learning
Trends in web data extraction using machine learning
Web data extraction has seen significant development in the last decade since its inception in the early nineties. It has evolved from a simple manual way of extracting data from w...

Back to Top