Javascript must be enabled to continue!
Linked data quality : completeness and conciseness
View through CrossRef
Qualité du web des données : complétude et concision
La large diffusion des technologies du Web Sémantique telles que le Resource Description Framework (RDF) permet aux individus de construire leurs bases de données sur le Web, d'écrire des vocabulaires et de définir des règles pour organiser et expliquer les relations entre les données selon les principes des données liées. En conséquence, une grande quantité de données structurées et interconnectées est générée quotidiennement. Un examen attentif de la qualité de ces données pourrait s'avérer très critique, surtout si d'importantes recherches et décisions professionnelles en dépendent. La qualité des données liées est un aspect important pour indiquer leur aptitude à être utilisées dans des applications. Plusieurs dimensions permettant d'évaluer la qualité des données liées sont identifiées, telles que la précision, la complétude, la provenance et la concision. Cette thèse se concentre sur l'évaluation de la complétude et l'amélioration de la concision des données liées. En particulier, nous avons d'abord proposé une approche de calcul de complétude fondée sur un schéma généré. En effet, comme un schéma de référence est nécessaire pour évaluer la complétude, nous avons proposé une approche fondée sur la fouille de données pour obtenir un schéma approprié (c.-à-d. un ensemble de propriétés) à partir des données. Cette approche permet de distinguer les propriétés essentielles des propriétés marginales pour générer, pour un ensemble de données, un schéma conceptuel qui répond aux attentes de l'utilisateur quant aux contraintes de complétude des données. Nous avons implémenté un prototype appelé "LOD-CM" pour illustrer le processus de dérivation d'un schéma conceptuel d'un ensemble de données fondé sur les besoins de l'utilisateur. Nous avons également proposé une approche pour découvrir des prédicats équivalents afin d'améliorer la concision des données liées. Cette approche s'appuie, en plus d'une analyse statistique, sur une analyse sémantique approfondie des données et sur des algorithmes d'apprentissage. Nous soutenons que l'étude de la signification des prédicats peut aider à améliorer l'exactitude des résultats. Enfin, un ensemble d'expériences a été mené sur des ensembles de données réelles afin d'évaluer les approches que nous proposons.
Title: Linked data quality : completeness and conciseness
Description:
Qualité du web des données : complétude et concision
La large diffusion des technologies du Web Sémantique telles que le Resource Description Framework (RDF) permet aux individus de construire leurs bases de données sur le Web, d'écrire des vocabulaires et de définir des règles pour organiser et expliquer les relations entre les données selon les principes des données liées.
En conséquence, une grande quantité de données structurées et interconnectées est générée quotidiennement.
Un examen attentif de la qualité de ces données pourrait s'avérer très critique, surtout si d'importantes recherches et décisions professionnelles en dépendent.
La qualité des données liées est un aspect important pour indiquer leur aptitude à être utilisées dans des applications.
Plusieurs dimensions permettant d'évaluer la qualité des données liées sont identifiées, telles que la précision, la complétude, la provenance et la concision.
Cette thèse se concentre sur l'évaluation de la complétude et l'amélioration de la concision des données liées.
En particulier, nous avons d'abord proposé une approche de calcul de complétude fondée sur un schéma généré.
En effet, comme un schéma de référence est nécessaire pour évaluer la complétude, nous avons proposé une approche fondée sur la fouille de données pour obtenir un schéma approprié (c.
-à-d.
un ensemble de propriétés) à partir des données.
Cette approche permet de distinguer les propriétés essentielles des propriétés marginales pour générer, pour un ensemble de données, un schéma conceptuel qui répond aux attentes de l'utilisateur quant aux contraintes de complétude des données.
Nous avons implémenté un prototype appelé "LOD-CM" pour illustrer le processus de dérivation d'un schéma conceptuel d'un ensemble de données fondé sur les besoins de l'utilisateur.
Nous avons également proposé une approche pour découvrir des prédicats équivalents afin d'améliorer la concision des données liées.
Cette approche s'appuie, en plus d'une analyse statistique, sur une analyse sémantique approfondie des données et sur des algorithmes d'apprentissage.
Nous soutenons que l'étude de la signification des prédicats peut aider à améliorer l'exactitude des résultats.
Enfin, un ensemble d'expériences a été mené sur des ensembles de données réelles afin d'évaluer les approches que nous proposons.
Related Results
Skeletal and soft tissue completeness of the acanthodian fossil record
Skeletal and soft tissue completeness of the acanthodian fossil record
AbstractAcanthodians are a poorly understood paraphyletic grade of extinct Palaeozoic fishes. They play an increasingly prominent role in our understanding of vertebrate evolution ...
Completeness of spontaneously reported adverse drug reactions in 4 databases
Completeness of spontaneously reported adverse drug reactions in 4 databases
Aims
To assess the completeness of information provided in adverse drug reaction (ADR) reports in 4 spontaneous report databases.
...
Faktor-Faktor Yang Berhubungan dengan Kelengkapan Imunisasi Dasar pada Bayi di Puskesmas Ulee Kareng
Faktor-Faktor Yang Berhubungan dengan Kelengkapan Imunisasi Dasar pada Bayi di Puskesmas Ulee Kareng
Factors Associated with Completeness of Basic Immunization for Infants at Ulee Kareng Health Center. Basic immunization is a program carried out to protect a person's body from dis...
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions
Background
Large language models (LLMs), such as ChatGPT (Open AI), are increasingly used in medicine and supplement standard search engines as information sour...
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions (Preprint)
ChatGPT Versus Consultants: Blinded Evaluation on Answering Otorhinolaryngology Case–Based Questions (Preprint)
BACKGROUND
Large language models (LLMs), such as ChatGPT (Open AI), are increasingly used in medicine and supplement standard search engines as information ...
Quality of primary total knee arthroplasty operative reports in a tertiary teaching hospital
Quality of primary total knee arthroplasty operative reports in a tertiary teaching hospital
BACKGROUND
Operative reports (OP-Rs) are essential for communication among healthcare providers. They require accuracy and completeness to serve as a quality indicator of...
Kredibilitas Pemberitaan Distribusi Vaksin Covid-19 di Indonesia
Kredibilitas Pemberitaan Distribusi Vaksin Covid-19 di Indonesia
Abstract. Since March 2020, news about the Covid-19 pandemic has increasingly dominated media content considering that the virus has begun to enter this country. This study focuses...
Analisis Kualitatif Kelengkapan dan Kekonsistensian Diagnosis di Rumah Sakit Patria IKKT
Analisis Kualitatif Kelengkapan dan Kekonsistensian Diagnosis di Rumah Sakit Patria IKKT
Qualitative analysis is a review of filling in medical records related to the consistency of the contents of medical records. A good medical record must contain complete medical re...

