@article{publications26851, volume = {vol. 20}, number = {n? 1}, author = {Max Chevalier and Mohammed El Malki and Arlind Kopliku and Olivier Teste and Ronan Tournier}, title = {Entrep{\^o}ts de donn{\'e}es orient{\'e}s documents cubo{\"i}des {\'e}tendus. Mod{\`e}les et cubo{\"i}des NoSQL orient{\'e}s documents}, publisher = {Lavoisier}, journal = {Document Num{\'e}rique}, pages = {9--38}, year = {2017}, url = {https://publications.ut-capitole.fr/id/eprint/26851/}, abstract = {Avec l?essor ces derni{\`e}res ann{\'e}es des grandes plateformes Web (par exemple, Google, Facebook, Twitter, Amazon), ont {\'e}t{\'e} d{\'e}velopp{\'e}es des solutions de gestion des m{\'e}gadonn{\'e}es (big data) bas{\'e}es sur des approches d{\'e}centralis{\'e}es permettant la gestion et le stockage de gigantesques masses de donn{\'e}es. Cette approche d{\'e}centralis{\'e}e repose sur le principe de la scalabilit{\'e}, c?est-{\`a}-dire l?ajustement d?une mani{\`e}re progressive et continue du stockage et des traitements au volume des donn{\'e}es. Ce type d?architecture distribu{\'e}e a connu r{\'e}cemment le d{\'e}veloppement de syst{\`e}mes de gestion de ?chiers massivement distribu{\'e}s et de nouvelles techniques de parall{\'e}lisation massive des traitements. Adoss{\'e}s {\`a} ce contexte de distribution massive, diff{\'e}rents syst{\`e}mes de stockage sont apparus ces derni{\`e}res ann{\'e}es. Ces syst{\`e}mes, quali?{\'e}s de syst{\`e}mes not-only-SQL (ou NoSQL), relaxent les fondements de l?approche relationnelle pour pouvoir supporter les masses de donn{\'e}es distribu{\'e}es. De ce fait, il est envisageable de construire des entrep{\^o}ts de donn{\'e}es massives reposant sur ce principe de scalabilit{\'e} de l?espace de stockage. Dans ce papier, nous {\'e}tudions l?instanciation d?entrep{\^o}ts de donn{\'e}es avec les syst{\`e}mes orient{\'e}s documents. Dans un premier temps, nous {\'e}tudions les enjeux primaires des entrep{\^o}ts tels que la mod{\'e}lisation, l?interrogation, le chargement des donn{\'e}es et les cubes OLAP. Dans un deuxi{\`e}me temps, nous proposons des am{\'e}liorations qui sont sp{\'e}ci?ques aux syst{\`e}mes orient{\'e}s documents. En particulier, nous proposons des versions {\'e}tendues des cubes OLAP qui exploitent l?imbrication. Nous montrons que ces cubes r{\'e}pondent plus rapidement {\`a} des charges de travail compos{\'e}es de requ{\^e}tes OLAP de type ?drill-down?.} }