Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Analyse en corpus de chaînes de coréférence : la coréférence non-stricte à l'épreuve de la linguistique outillée

View through CrossRef
Une chaîne de coréférence désigne l'ensemble des expressions linguistiques qui réfèrent à la même entité. La relation de coréférence entre les « maillons » d'une chaîne implique que le référent doit être strictement le même pour chaque expression qui la compose. Cependant, il arrive que le référent d'une expression soit difficile à identifier et que la relation de coréférence entre plusieurs expressions ne soit pas stricte de manière certaine. Pour un lecteur, ce manque de précision ne pose pas nécessairement de difficultés. En revanche, lors de l'annotation d'un corpus en coréférences, il est question d'indiquer clairement le référent de chaque expression. Les phénomènes de coréférence non stricte peuvent donc causer des difficultés d'annotation. Cette thèse a débuté au sein du projet ANR Democrat, avec une tâche d'annotation qui a permis de faire émerger des difficultés d'annotation théoriques et techniques liées à la coréférence non stricte. Nous proposons donc de passer en revue les phénomènes linguistiques impliqués dans la coréférence non stricte, notamment le flou (co)référentiel ainsi que les cas typiques relevés en corpus. Dans un second temps, nous proposons une étude de l'annotation de ces phénomènes dans un sous-corpus de Democrat. Cette étude révèle une grande variabilité d'annotation de ces phénomènes dont nous tirons une classification. Pour éviter les difficultés d'annotation liées à ces phénomènes, nous proposons un cadre plus précis pour l'annotation de la coréférence floue. Cela implique des précisions à ajouter au manuel d'annotation ainsi qu'un schéma d'annotation adapté, prenant en compte la coréférence floue.
Agence Bibliographique de l'Enseignement Supérieur
Title: Analyse en corpus de chaînes de coréférence : la coréférence non-stricte à l'épreuve de la linguistique outillée
Description:
Une chaîne de coréférence désigne l'ensemble des expressions linguistiques qui réfèrent à la même entité.
La relation de coréférence entre les « maillons » d'une chaîne implique que le référent doit être strictement le même pour chaque expression qui la compose.
Cependant, il arrive que le référent d'une expression soit difficile à identifier et que la relation de coréférence entre plusieurs expressions ne soit pas stricte de manière certaine.
Pour un lecteur, ce manque de précision ne pose pas nécessairement de difficultés.
En revanche, lors de l'annotation d'un corpus en coréférences, il est question d'indiquer clairement le référent de chaque expression.
Les phénomènes de coréférence non stricte peuvent donc causer des difficultés d'annotation.
Cette thèse a débuté au sein du projet ANR Democrat, avec une tâche d'annotation qui a permis de faire émerger des difficultés d'annotation théoriques et techniques liées à la coréférence non stricte.
Nous proposons donc de passer en revue les phénomènes linguistiques impliqués dans la coréférence non stricte, notamment le flou (co)référentiel ainsi que les cas typiques relevés en corpus.
Dans un second temps, nous proposons une étude de l'annotation de ces phénomènes dans un sous-corpus de Democrat.
Cette étude révèle une grande variabilité d'annotation de ces phénomènes dont nous tirons une classification.
Pour éviter les difficultés d'annotation liées à ces phénomènes, nous proposons un cadre plus précis pour l'annotation de la coréférence floue.
Cela implique des précisions à ajouter au manuel d'annotation ainsi qu'un schéma d'annotation adapté, prenant en compte la coréférence floue.

Related Results

Coreference Resolution for Amharic Text using Bidirectional Encoder Representation from Transformer (BERT)
Coreference Resolution for Amharic Text using Bidirectional Encoder Representation from Transformer (BERT)
Abstract Coreference resolution is the process of finding an entity which is refers to the same entity in a text. In coreference resolution similar entities are men...
La coréférence floue dans les chaînes du corpus DEMOCRAT
La coréférence floue dans les chaînes du corpus DEMOCRAT
Les expressions référentielles qui désignent exactement le même référent constituent les maillons d’une chaîne de coréférence. Il arrive que le référent d’une expression soit diffi...
Within-Document Arabic Event Coreference: Challenges, Datasets, Approaches and Future Direction
Within-Document Arabic Event Coreference: Challenges, Datasets, Approaches and Future Direction
Event coreference resolution is a crucial component in Natural Language Processing (NLP) applications as it directly affects text summarization, machine translation, classification...
Žanrovska analiza pomorskopravnih tekstova i ostvarenje prijevodnih univerzalija u njihovim prijevodima s engleskoga jezika
Žanrovska analiza pomorskopravnih tekstova i ostvarenje prijevodnih univerzalija u njihovim prijevodima s engleskoga jezika
Genre implies formal and stylistic conventions of a particular text type, which inevitably affects the translation process. This „force of genre bias“ (Prieto Ramos, 2014) has been...
Unsupervised Event Coreference Resolution
Unsupervised Event Coreference Resolution
The task of event coreference resolution plays a critical role in many natural language processing applications such as information extraction, question answering, and topic detect...
Langue et culture
Langue et culture
La vaste littérature (linguistique, psycholinguistique, ethnolinguistique, etc.) des XXe et XXIe siècles sur la relation entre langue et culture montre d'importantes variations dan...
Concept-based and relation-based corpus navigation : applications of natural language processing in digital humanities
Concept-based and relation-based corpus navigation : applications of natural language processing in digital humanities
Navigation en corpus fondée sur les concepts et les relations : applications du traitement automatique des langues aux humanités numériques La recherche en Sciences...
Risk management in supply chains : a simulation and model-based approach
Risk management in supply chains : a simulation and model-based approach
Maîtrise des risques dans les chaînes logistiques : une approche par la simulation et l’ingénierie basée sur les modèles La maîtrise des risques est un enjeu majeur...

Back to Top