Rajhi, Hela (2023) Modélisation de bases de données NoSQL : processus d'extraction des schémas logique et conceptuel. École doctorale Mathématiques, Informatique et Télécommunications (Toulouse).

[thumbnail of RajhiHela2023.pdf]
Preview
Text
Download (5MB) | Preview

Abstract

Nos travaux de recherche s'inscrivent dans le cadre d'une application médicale décisionnelle utilisant des bases de données complexes NoSQL. La plupart des systèmes NoSQL sont caractérisés par la propriété « Schemaless » qui signifie qu'un schéma n'est pas défini au moment de la création de la base de données. L'absence de schéma de données rend difficile d'une part la compréhension de la sémantique des données et d'autre part la rédaction des requêtes. Pour des décideurs, cette difficulté représente un obstacle majeur pour manipuler des objets à structure complexe. Nos travaux portent sur l'extraction de schémas à partir d'une BD NoSQL « Schemaless ». Nous proposons un processus qui permet de générer automatiquement, à partir d'une base de données NoSQL, deux schémas de données : • un schéma logique contenant la description technique des données stockées dans la BD telles que les collections et les relations entre ces collections ; ce schéma permet d'écrire des requêtes. • un schéma conceptuel décrivant des classes d'objets exemptes des aspects techniques et permettant de comprendre la sémantique des données. Pour manipuler une base NoSQL, les décideurs disposent donc d'un double schéma dont les deux facettes (logique et conceptuelle) peuvent être consultées de façon concomitante. Le processus que nous proposons est basé sur la plateforme EMF qui supporte l'architecture dirigée par les modèles (MDA). Cette technique de développement nous a permis de modéliser une base de données NoSQL ainsi que les schémas logique et conceptuel. L'application d'une suite de règles de transformations écrites dans un langage formel (QVT) assure le passage entre les modèles et permet de générer le double schéma.

,

Our research work is part of a medical decision-making application using complex NoSQL databases. Most NoSQL systems are characterized by the schemaless property, which means that a schema is not defined when the database is created. The absence of a data schema makes it difficult to understand data semantics and to write queries. For decision-makers, this difficulty represents a major obstacle to manipulating objects with complex structures. Our work focuses on extracting schemas from a schemaless NoSQL database. We propose a process that automatically generates two data schemas from a NoSQL database: • a logical schema containing the technical description of the data stored in the database such as the collections and the relationships between these collections; this schema allows to write queries. • a conceptual schema describing classes of objects free from technical aspects and allowing to understand the semantics of the data. To manipulate a NoSQL database, decision-makers therefore have a dual schema, with both facets (logical and conceptual) that can be consulted simultaneously. The process we propose is based on the EMF platform which supports model driven architecture (MDA). This development technique allowed us to model a NoSQL database as well as the logical and conceptual diagrams. The application of a series of transformation rules written in a formal language (QVT) ensures the transition between the models and allows to generate the double schema.

Item Type: Thesis (UNSPECIFIED)
Other titles: NoSQL database modeling : logical and conceptual schema extraction process
Language: French
Date: 14 December 2023
Keywords (French): NoSQL, Données massives -- Prise de décision
Subjects: H- INFORMATIQUE
Divisions: Institut de Recherche en Informatique de Toulouse
Ecole doctorale: École doctorale Mathématiques, Informatique et Télécommunications (Toulouse)
Site: UT1
Date Deposited: 23 Sep 2024 08:15
Last Modified: 23 Sep 2024 08:15
URI: https://publications.ut-capitole.fr/id/eprint/49716
View Item

Downloads

Downloads per month over past year