Témoignage


"Nous avons choisi Logimethods pour élaborer et développer une nouvelle passerelle pour la chaîne d’approvisionnement de Staples, afin de remplacer plusieurs applications traditionnelles, vitales pour l’entreprise, par une solution plus stable, évolutive et basée sur des normes ouvertes. Grâce à son accélérateur d’implantation et à sa collaboration efficace avec l’équipe de Staples, Logimethods a fourni une solution robuste et une aide précieuse pour assurer l’intégration continue du nouveau système. Nous avons vraiment pris la bonne décision en choisissant Logimethods."


Jane Lilley, Director IT - EIS
Staples US

Leadership éclairé :
Entrepôt de données hybride

Le défi auquel la plupart des entreprises font face lors de la création d’un entrepôt de données est de satisfaire tous les besoins en recherche d’informations et en informatique décisionnelle (BI) à l’aide d’une seule et même base de données. Bill Inmon précurseur de l’entrepôt de données a introduit le concept de Corporate Information Factory (CIF), qui comprend un entrepôt de données d’entreprise (EDW), des bases de données opérationnelles (ODS) ainsi que des magasins et entrepôts de données d’exploration gèrent le traitement analytique en ligne (OLAP) et l’exploration de données.


Les changements aux données provenant d’applications sources sont saisis, organisés, puis soumis à un processus « extraire, transformer et charger » (ETL) qui décontamine, applique et transforme les données sources en structures de données dans l’EDW et l’ODS.


Un processus ETL supplémentaire est requis pour transférer les données de l’EDW aux magasins de données.

 

 

ODS et EDW


L’ODS sert aux demandes d’information opérationnelle et à la transmission de données. Il emmagasine des données pour quelques mois à un an. En général, il est normalisé, mais peut aussi contenir des tableaux dénormalisés pour répondre à des demandes précises. L’EDW contient la mémoire à long terme de l’entreprise qui est normalisée et n’est généralement pas utilisée pour gérer les demandes ad hoc. Les magasins de données sont habituellement multidimensionnels et sont structurés en fonction des besoins en OLAP d’utilisateurs déterminés. Plusieurs structures et bases de données sont nécessaires, car elles servent des fins différentes. Toutefois, l’élaboration de multiples ensembles de processus ETL engendre des coûts importants. En effet, on estime que l’ETL représente 60 à 70 % du coût total d’élaboration d’un entrepôt de données.


page_features_2


Une approche différente conçue par Ralph Kimball, généralement reconnu comme un des architectes à l’origine du concept d’entrepôt de données, soutient que la conception de l’entrepôt de données doit être compréhensible et rapide. Sa méthodologie, connue sous le nom de modélisation dimensionnelle ou architecture en bus, est devenue de fait l’un des principaux standards de modélisation pour l’aide à la décision en temps réel. Le schéma en étoile de Kimball relie les dimensions aux faits, qui sont des transactions atomiques emmagasinées. Une dimension correspond aux concepts de temps, emplacement, ligne de produits, etc.

La structure hybride

L’entrepôt de données hybride gère aussi bien l’EDW que les applications de magasins de données avec la même base de données. Il peut contenir une quantité importante de données historiques se trouvant habituellement dans l’EDW, tout en répondant adéquatement aux requêtes OLAP habituellement traitées dans les magasins de données. La structure hybride comprend à la fois des flocons de neige normalisés et des schémas en étoile dénormalisés. Le contrôle de redondance inhérent à ce concept fournit des temps de réponse adéquats à différents types de demandes d’information.


Le modèle hybride réduit les coûts de développement des processus ETL parce qu’il n’y a qu’un schéma de banque de données à produire. Des mises à jour en temps réel (ou quasi réel) sont rendues possibles en déplaçant immédiatement les mises à jour de données du système opérationnel vers l’entrepôt de données hybride ou en connectant le moteur ETL à un bus de services d’entreprise (ESB).

Le modèle hybride a servi à l’élaboration d’une des plus grandes bases de données au Canada qui comprend 34 dimensions de jeu de rôles avec plusieurs hiérarchies, possède plus de 1500 attributs, et traite 40 millions de transactions par jour en quasi-temps réel, ce qui correspond à un milliard de lignes par mois.


Le modèle hybride ne suffit pas à lui seul à répondre entièrement au besoin d’ODS pour les temps de réponse inférieurs à la seconde. Par contre, il peut offrir une solution unique pour les entreprises qui possèdent un très grand volume de données et qui cherchent un moyen rentable d’appuyer plusieurs de leurs besoins en informatique décisionnelle.