Approche de construction d'entrepôts de documents XML

Ben Messaoud, Ines (2014) Approche de construction d'entrepôts de documents XML. École doctorale Mathématiques, Informatique et Télécommunications (Toulouse).

[img]
Preview
Text
Download (4MB) | Preview
Official URL: http://www.theses.fr/2014TOU10037

Abstract

Les documents constituent une capitalisation importante des connaissances. Généralement, ces documents sont caractérisés par un contenu peu structuré et il est alors difficile de les intégrer dans les systèmes d’information décisionnels. En conséquence, les décideurs ne peuvent pas tirer profit de ces documents. Pour répondre à cette problématique, nous proposons une approche de construction du schéma de l’entrepôt de documents XML. Cette approche se compose de deux méthodes : une méthode d’unification des structures des documents XML et une méthode de modélisation multidimensionnelle de ces documents. La méthode d’unification permet de définir une structure commune pour décrire les documents XML hétérogènes et appartenant au même domaine. Pour valider cette méthode, un outil logiciel baptisé USD (Unification of Structures of XML Documents) est développé. La méthode de modélisation multidimensionnelle a pour but de concevoir semi-automatiquement le schéma du magasin de documents, selon le modèle multidimensionnel en galaxie, à partir d’une structure XML unifiée. Afin de valider cette méthode, un outil nommé Galaxy-Gen (Galaxy Generation) est développé.

,

Documents represent an important knowledge capitalization. In general, these documents are characterized by unstructured content, and therefore it is difficult to integrate them in the decision information systems. As a result, decision-makers are unable to exploit these documents easily and efficiently. To alleviate this problem, we propose an approach to build the schema of the XML documents warehouse. This approach consists of two methods: a method for unification of the structures of XML documents and a method for multidimensional modeling of these documents. The unification method defines a common structure to describe heterogeneous XML documents belonging to the same domain. To validate this method, a software tool called USD (Unification of Structures of XML Documents) is developed. While the method of multidimensional modeling builds semi-automatically the schema of the documents mart as a galaxy model. To validate this method, the tool called Galaxy-Gen (Galaxy Generation) is developed.

Item Type: Thesis (UNSPECIFIED)
Other titles: An approach to build XML documents warehouses
Language: French
Date: 19 December 2014
Keywords (French): Entrepôts de données - Thèses et écrits académiques, XML (langage de balisage) - Thèses et écrits académiques, Analyse multivariée - Thèses et écrits académiques
Subjects: H- INFORMATIQUE
Divisions: Institut de Recherche en Informatique de Toulouse
Ecole doctorale: École doctorale Mathématiques, Informatique et Télécommunications (Toulouse)
Site: UT1
Date Deposited: 29 Jan 2015 10:23
Last Modified: 29 Oct 2018 13:17
OAI ID: 2014TOU10037
URI: http://publications.ut-capitole.fr/id/eprint/16361

Actions (login required)

View Item View Item

Downloads

Downloads per month over past year