Javascript must be enabled to continue!
Linked data quality : completeness and conciseness
View through CrossRef
Qualité du web des données : complétude et concision
La large diffusion des technologies du Web Sémantique telles que le Resource Description Framework (RDF) permet aux individus de construire leurs bases de données sur le Web, d'écrire des vocabulaires et de définir des règles pour organiser et expliquer les relations entre les données selon les principes des données liées. En conséquence, une grande quantité de données structurées et interconnectées est générée quotidiennement. Un examen attentif de la qualité de ces données pourrait s'avérer très critique, surtout si d'importantes recherches et décisions professionnelles en dépendent. La qualité des données liées est un aspect important pour indiquer leur aptitude à être utilisées dans des applications. Plusieurs dimensions permettant d'évaluer la qualité des données liées sont identifiées, telles que la précision, la complétude, la provenance et la concision. Cette thèse se concentre sur l'évaluation de la complétude et l'amélioration de la concision des données liées. En particulier, nous avons d'abord proposé une approche de calcul de complétude fondée sur un schéma généré. En effet, comme un schéma de référence est nécessaire pour évaluer la complétude, nous avons proposé une approche fondée sur la fouille de données pour obtenir un schéma approprié (c.-à-d. un ensemble de propriétés) à partir des données. Cette approche permet de distinguer les propriétés essentielles des propriétés marginales pour générer, pour un ensemble de données, un schéma conceptuel qui répond aux attentes de l'utilisateur quant aux contraintes de complétude des données. Nous avons implémenté un prototype appelé "LOD-CM" pour illustrer le processus de dérivation d'un schéma conceptuel d'un ensemble de données fondé sur les besoins de l'utilisateur. Nous avons également proposé une approche pour découvrir des prédicats équivalents afin d'améliorer la concision des données liées. Cette approche s'appuie, en plus d'une analyse statistique, sur une analyse sémantique approfondie des données et sur des algorithmes d'apprentissage. Nous soutenons que l'étude de la signification des prédicats peut aider à améliorer l'exactitude des résultats. Enfin, un ensemble d'expériences a été mené sur des ensembles de données réelles afin d'évaluer les approches que nous proposons.
Title: Linked data quality : completeness and conciseness
Description:
Qualité du web des données : complétude et concision
La large diffusion des technologies du Web Sémantique telles que le Resource Description Framework (RDF) permet aux individus de construire leurs bases de données sur le Web, d'écrire des vocabulaires et de définir des règles pour organiser et expliquer les relations entre les données selon les principes des données liées.
En conséquence, une grande quantité de données structurées et interconnectées est générée quotidiennement.
Un examen attentif de la qualité de ces données pourrait s'avérer très critique, surtout si d'importantes recherches et décisions professionnelles en dépendent.
La qualité des données liées est un aspect important pour indiquer leur aptitude à être utilisées dans des applications.
Plusieurs dimensions permettant d'évaluer la qualité des données liées sont identifiées, telles que la précision, la complétude, la provenance et la concision.
Cette thèse se concentre sur l'évaluation de la complétude et l'amélioration de la concision des données liées.
En particulier, nous avons d'abord proposé une approche de calcul de complétude fondée sur un schéma généré.
En effet, comme un schéma de référence est nécessaire pour évaluer la complétude, nous avons proposé une approche fondée sur la fouille de données pour obtenir un schéma approprié (c.
-à-d.
un ensemble de propriétés) à partir des données.
Cette approche permet de distinguer les propriétés essentielles des propriétés marginales pour générer, pour un ensemble de données, un schéma conceptuel qui répond aux attentes de l'utilisateur quant aux contraintes de complétude des données.
Nous avons implémenté un prototype appelé "LOD-CM" pour illustrer le processus de dérivation d'un schéma conceptuel d'un ensemble de données fondé sur les besoins de l'utilisateur.
Nous avons également proposé une approche pour découvrir des prédicats équivalents afin d'améliorer la concision des données liées.
Cette approche s'appuie, en plus d'une analyse statistique, sur une analyse sémantique approfondie des données et sur des algorithmes d'apprentissage.
Nous soutenons que l'étude de la signification des prédicats peut aider à améliorer l'exactitude des résultats.
Enfin, un ensemble d'expériences a été mené sur des ensembles de données réelles afin d'évaluer les approches que nous proposons.
Related Results
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions
Background
Large language models (LLMs), such as ChatGPT (Open AI), are increasingly used in medicine and supplement standard search engines as information sour...
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions (Preprint)
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions (Preprint)
BACKGROUND
Large language models (LLMs), such as ChatGPT (Open AI), are increasingly used in medicine and supplement standard search engines as information ...
Kredibilitas Pemberitaan Distribusi Vaksin Covid-19 di Indonesia
Kredibilitas Pemberitaan Distribusi Vaksin Covid-19 di Indonesia
Abstract. Since March 2020, news about the Covid-19 pandemic has increasingly dominated media content considering that the virus has begun to enter this country. This study focuses...
Factors associated with completeness of basic immunization for babies at Simpangkatis health center in 2023
Factors associated with completeness of basic immunization for babies at Simpangkatis health center in 2023
The Simpangkatis Health Center is located in Simpangkatis Village, Simpangkatis District, Central Bangka Regency, Bangka Belitung. Immunization is very important for children's dev...
Are Cervical Ribs Indicators of Childhood Cancer? A Narrative Review
Are Cervical Ribs Indicators of Childhood Cancer? A Narrative Review
Abstract
A cervical rib (CR), also known as a supernumerary or extra rib, is an additional rib that forms above the first rib, resulting from the overgrowth of the transverse proce...
A Generic Method to Monitor Completeness and Speed of Medical Documentation Processes
A Generic Method to Monitor Completeness and Speed of Medical Documentation Processes
SummaryBackground: Physicians dedicate approximately a quarter of daily work to documentation. Completeness and speed of medical documentation processes are important parameters, b...
Hubungan Tingkat Pengetahuan Ibu terhadap Kelengkapan Imunisasi pada Anak di Wilayah Puskesmas Payung Sekaki
Hubungan Tingkat Pengetahuan Ibu terhadap Kelengkapan Imunisasi pada Anak di Wilayah Puskesmas Payung Sekaki
Immunization is an effective preventive measure that protects children from various infectious diseases that can be prevented by immunization. However, the completeness of immuniza...
Make a Match Type Cooperative Model: An Effort to Improve Student Learning Outcomes in Qur'an Hadith Learning
Make a Match Type Cooperative Model: An Effort to Improve Student Learning Outcomes in Qur'an Hadith Learning
This research is motivated by the low learning outcomes of the Al-Qur'an Hadith on the material of the law of reading idhar and ikhfa' of class IV Unggul MIN 1 East Aceh. The purpo...

