Javascript must be enabled to continue!
Vers une normalisation RDF
View through CrossRef
Depuis ces dernières décennies, des millions d'internautes produisent et échangent des données sur le Web. Ces informations peuvent être structurées, semi-structurées et/ou non-structurées, tels que les blogs, les commentaires, les pages Web, les contenus multimédias, etc. Afin de faciliter la publication ainsi que l'échange de données, le World Wide Web Consortium (ou W3C) a défini en 1999 le standard RDF. Ce standard est un modèle qui permet notamment de structurer une information sous la forme d'un réseau de données dans lequel il est possible d'y attacher des descriptions sémantiques. Ce modèle permet donc d'améliorer l'interopérabilité entre différentes applications exploitant des données diverses et variées présentes sur le Web.Actuellement, une grande quantité de descriptions RDF est disponible en ligne, notamment grâce à des projets de recherche qui traitent du Web de données liées, comme par exemple DBpedia et LinkedGeoData. De plus, de nombreux fournisseurs de données ont adopté les technologies issues de cette communauté du Web de données en partageant, connectant, enrichissant et publiant leurs informations à l'aide du standard RDF, comme les gouvernements (France, Canada, Grande-Bretagne, etc.), les universités (par exemple Open University) ainsi que les entreprises (BBC, CNN, etc.). Il en résulte que de nombreux acteurs actuels (particuliers ou organisations) produisent des quantités gigantesques de descriptions RDF qui sont échangées selon différents formats (RDF/XML, Turtle, N-Triple, etc.). Néanmoins, ces descriptions RDF sont souvent verbeuses et peuvent également contenir de la redondance d'information. Ceci peut concerner à la fois leur structure ou bien leur sérialisation (ou le format) qui en plus souffre de multiples variations d'écritures possibles au sein d'un même format. Tous ces problèmes induisent des pertes de performance pour le stockage, le traitement ou encore le chargement de ce type de descriptions. Dans cette thèse, nous proposons de nettoyer les descriptions RDF en éliminant les données redondantes ou inutiles. Ce processus est nommé « normalisation » de descriptions RDF et il est une étape essentielle pour de nombreuses applications, telles que la similarité entre descriptions, l'alignement, l'intégration, le traitement des versions, la classification, l'échantillonnage, etc. Pour ce faire, nous proposons une approche intitulée R2NR qui à partir de différentes descriptions relatives à une même information produise une et une seule description normalisée qui est optimisée en fonction de multiples paramètres liés à une application cible. Notre approche est illustrée en décrivant plusieurs cas d'étude (simple pour la compréhension mais aussi plus réaliste pour montrer le passage à l'échelle) nécessitant l'étape de normalisation. La contribution de cette thèse peut être synthétisée selon les points suivants :i. Produire une description RDF normalisée (en sortie) qui préserve les informations d'une description source (en entrée),ii. Éliminer les redondances et optimiser l'encodage d'une description normalisée,iii. Engendrer une description RDF optimisée en fonction d'une application cible (chargement rapide, stockage optimisée...),iv. Définir de manière complète et formelle le processus de normalisation à l'aide de fonctions, d'opérateurs, de règles et de propriétés bien fondées, etc.v. Fournir un prototype RDF2NormRDF (avec deux versions : en ligne et hors ligne) permettant de tester et de valider l'efficacité de notre approche.Afin de valider notre proposition, le prototype RDF2NormRDF a été utilisé avec une batterie de tests. Nos résultats expérimentaux ont montré des mesures très encourageantes par rapport aux approches existantes, notamment vis-à-vis du temps de chargement ou bien du stockage d'une description normalisée, tout en préservant le maximum d'informations.
Title: Vers une normalisation RDF
Description:
Depuis ces dernières décennies, des millions d'internautes produisent et échangent des données sur le Web.
Ces informations peuvent être structurées, semi-structurées et/ou non-structurées, tels que les blogs, les commentaires, les pages Web, les contenus multimédias, etc.
Afin de faciliter la publication ainsi que l'échange de données, le World Wide Web Consortium (ou W3C) a défini en 1999 le standard RDF.
Ce standard est un modèle qui permet notamment de structurer une information sous la forme d'un réseau de données dans lequel il est possible d'y attacher des descriptions sémantiques.
Ce modèle permet donc d'améliorer l'interopérabilité entre différentes applications exploitant des données diverses et variées présentes sur le Web.
Actuellement, une grande quantité de descriptions RDF est disponible en ligne, notamment grâce à des projets de recherche qui traitent du Web de données liées, comme par exemple DBpedia et LinkedGeoData.
De plus, de nombreux fournisseurs de données ont adopté les technologies issues de cette communauté du Web de données en partageant, connectant, enrichissant et publiant leurs informations à l'aide du standard RDF, comme les gouvernements (France, Canada, Grande-Bretagne, etc.
), les universités (par exemple Open University) ainsi que les entreprises (BBC, CNN, etc.
).
Il en résulte que de nombreux acteurs actuels (particuliers ou organisations) produisent des quantités gigantesques de descriptions RDF qui sont échangées selon différents formats (RDF/XML, Turtle, N-Triple, etc.
).
Néanmoins, ces descriptions RDF sont souvent verbeuses et peuvent également contenir de la redondance d'information.
Ceci peut concerner à la fois leur structure ou bien leur sérialisation (ou le format) qui en plus souffre de multiples variations d'écritures possibles au sein d'un même format.
Tous ces problèmes induisent des pertes de performance pour le stockage, le traitement ou encore le chargement de ce type de descriptions.
Dans cette thèse, nous proposons de nettoyer les descriptions RDF en éliminant les données redondantes ou inutiles.
Ce processus est nommé « normalisation » de descriptions RDF et il est une étape essentielle pour de nombreuses applications, telles que la similarité entre descriptions, l'alignement, l'intégration, le traitement des versions, la classification, l'échantillonnage, etc.
Pour ce faire, nous proposons une approche intitulée R2NR qui à partir de différentes descriptions relatives à une même information produise une et une seule description normalisée qui est optimisée en fonction de multiples paramètres liés à une application cible.
Notre approche est illustrée en décrivant plusieurs cas d'étude (simple pour la compréhension mais aussi plus réaliste pour montrer le passage à l'échelle) nécessitant l'étape de normalisation.
La contribution de cette thèse peut être synthétisée selon les points suivants :i.
Produire une description RDF normalisée (en sortie) qui préserve les informations d'une description source (en entrée),ii.
Éliminer les redondances et optimiser l'encodage d'une description normalisée,iii.
Engendrer une description RDF optimisée en fonction d'une application cible (chargement rapide, stockage optimisée.
),iv.
Définir de manière complète et formelle le processus de normalisation à l'aide de fonctions, d'opérateurs, de règles et de propriétés bien fondées, etc.
v.
Fournir un prototype RDF2NormRDF (avec deux versions : en ligne et hors ligne) permettant de tester et de valider l'efficacité de notre approche.
Afin de valider notre proposition, le prototype RDF2NormRDF a été utilisé avec une batterie de tests.
Nos résultats expérimentaux ont montré des mesures très encourageantes par rapport aux approches existantes, notamment vis-à-vis du temps de chargement ou bien du stockage d'une description normalisée, tout en préservant le maximum d'informations.
Related Results
Effect of nutrient management modules on soil properties, yield and quality of wheat (Triticum aestivum)
Effect of nutrient management modules on soil properties, yield and quality of wheat (Triticum aestivum)
A field experiment was conducted to study the effect of nutrient management modules on wheat (Triticum aestivum L.)-(NW 1014) yield and quality at students instructional farm, Nare...
Effect of Integrated Nutrient Management Practices on Available Nutrient Status of Soil under Rice-Sorghum Cropping System in Clay Loamy Soils
Effect of Integrated Nutrient Management Practices on Available Nutrient Status of Soil under Rice-Sorghum Cropping System in Clay Loamy Soils
A field experiment was conducted for two consecutive years 2020-2021 and 2021-2022 on clay loam soil at Agricultural College Farm, Bapatla to study the direct and residual effect o...
Effect of Foliar Application of Nano fertilizers on Soil Properties of Rice (Oryza sativa L.) Under Western UP, India
Effect of Foliar Application of Nano fertilizers on Soil Properties of Rice (Oryza sativa L.) Under Western UP, India
An experiment was conducted during kharif 2022 and 2023 at the Sardar Vallabhbhai Patel University of Agriculture and Technology, Meerut, Uttar Pradesh, to study the Effect of Foli...
Data-Based Natural Language Generation : Evaluation and Explainability
Data-Based Natural Language Generation : Evaluation and Explainability
Génération de texte en langue naturelle à partir de données : évaluation et explicabilité
Les modèles de génération de langage naturel (NLG) ont récemment atteint d...
Effect of Seed Priming, Beejamrit, Jeevamrit and Micronutrients on Symbiotic Traits, Growth Attributes, Dehydrogenase Activity, Leghaemoglobin Content, Protein Content and Grain Yield of Chickpea
Effect of Seed Priming, Beejamrit, Jeevamrit and Micronutrients on Symbiotic Traits, Growth Attributes, Dehydrogenase Activity, Leghaemoglobin Content, Protein Content and Grain Yield of Chickpea
A field experiment was conducted at Research Farm area of R.A.K. (Rafi Ahmad Kidwai) College of Agriculture, Sehore, Madhya Pradesh during rabi season 2023-24 to study the effect o...
VES: An Alternative to Biopolymers in Reservoir Drill-In Fluids
VES: An Alternative to Biopolymers in Reservoir Drill-In Fluids
Abstract
A novel reservoir drill-in fluid (RDF) has been developed that utilizes viscoelastic surfactants (VES) as the primary viscosifier and as a consequence, elim...
Influence of seed rate and fertilizer levels on agro physiological parameters and yield of dual purpose wheat (Triticum aestivum)
Influence of seed rate and fertilizer levels on agro physiological parameters and yield of dual purpose wheat (Triticum aestivum)
The experiment was conducted at Research Farm of Agronomy, CCS HAU, Hisar during rabi season of the year 2017-18 and 2018-19 to study the influence of seed rate and fertilizer leve...
Effect of integrated nutrient management on productivity and economics of wheat (Triticum aestivum)
Effect of integrated nutrient management on productivity and economics of wheat (Triticum aestivum)
A field experiment was conducted during the winter (rabi) seasons of 2013–14 and 2014–15 at Kanpur, Uttar Pradesh, to evaluate the effect of recommended dose of fertilizer (RDF), a...

