Mise en place d’un système d’information décisionnel dans une entreprise

Systèmes d'information

Mise en place d’un système d’information décisionnel dans une entreprise

Le système d'information décisionnel - enjeux et structure standard

Le SID a pour objectif de fournir des indicateurs sur la vie de l’entreprise. Pour cela, il exploite une richesse déjà à sa disposition : l’ensemble des données qu’une entreprise génère dans le cadre de son activité. Reste que, si la donnée unitaire est sa matière première, elle n’a que peu d’intérêt en tant que telle2. Elle ne prend tout son sens que lorsque, regroupée avec d’autres données unitaires, elle forme un indicateur utile. Ainsi, sur un plan stratégique, il n’est en soi pas très intéressant de savoir que la vente n° 9856 a été réalisée dans un magasin de Dijon le 26 février 2011 et que le produit vendu est une chaise noire en chêne. En revanche, il est intéressant de sommer toutes les ventes de tous les magasins de France pour savoir quel est le chiffre d’affaires par magasin ou le chiffre d’affaires réalisé grâce à la vente de chaises noires en chêne en février 2011, puis de comparer la valeur de ces indicateurs aux objectifs fixés.
Un SID doit donc être capable de transformer un ensemble de données brutes et éparpillées en un système organisé permettant de fournir, de manière optimisée, les données nécessaires à la prise de décision. En fonction de la taille de l’entreprise, ces données peuvent être réparties dans une ou plusieurs bases de données, sous une ou plusieurs formes (base de données Oracle, DB2, autres SGBD3, fichiers bureautiques construits manuellement, etc.) et avec des critères de normalisation qui ne sont pas toujours homogènes (c’est le cas par exemple lorsqu’un même client est identifié avec une codification différente dans les services « commercial » et « contrôle de gestion » d’une même entreprise).

Le schéma n° 1 présente l’architecture standard d’un SID.

L’entrepôt unique de données ou datawarehouse centralise toutes les données de l’entreprise. Il est structuré pour contenir une volumétrie importante, les volumes de données à collecter étant de plus en plus conséquents et ne cessant d’augmenter. Ces données sont issues de sources hétérogènes. Elles peuvent être internes (progiciels (ERP4, CRM5, etc.), bases de données, mainframes, fichiers, services Web, etc.), externes (clients, fournisseurs, etc.) ou encore non informatisées (lettres, notes de service, compte-rendu de réunions, etc.). L’entrepôt de données incorpore toujours des données datées, hiérarchisées par thèmes et non volatiles (c’est-à-dire destinées à ne pas être supprimées).

Les magasins de données ou datamarts puisent leurs données dans l’entrepôt de données. Ce sont des bases de données métier (finance, marketing, etc.) dont la mise en place par le maître d’œuvre répond à des contraintes également très importantes (en premier lieu desquelles une contrainte de mise à disposition des données dans des temps optimisés) et fait l’objet, à l’instar de l’entrepôt de données, d’une analyse très poussée permettant, par exemple, d’identifier tous les croisements de données nécessaires aux utilisateurs. L’intérêt de ces magasins de données réside dans le fait qu’ils sont structurés pour répondre rapidement aux sollicitations des utilisateurs. À l’inverse d’un entrepôt de données qui peut être très volumineux (plusieurs centaines de Go) et qui ne permet pas une utilisation appropriée (temps de réponse trop longs), ils ont en effet moins de données à gérer (souvent moins de 50 Go) ce qui permet d’améliorer considérablement les temps de réponse. Un magasin de données est conçu pour répondre à un besoin précis, en fonction de ce que l’utilisateur souhaite obtenir. Il existe autant de magasins de données que de besoins différents.

Schéma n° 2 – Architecture d’un système d’information décisionnel

schéma n° 2 – architecture d’un système d’information décisionnel

----------- : flux de données gérés par des outils ETL (extraction – transformation – chargement) qui permettent de récupérer les données dans une source, d’effectuer les transformations nécessaires et de les charger dans une cible.

Pour être traduit en sous-ensembles, en magasins de données, les informations déduites de l’agrégation des données brutes de l’entrepôt de données doivent être interprétables selon différents points de vue (ou différents axes d’analyse). En ce sens, il peut être intéressant de construire l’entrepôt de données selon une approche multidimensionnelle6. Au lieu d’organiser les données en tables comme le font les bases de données relationnelles7, le moteur de la base de données multidimensionnelle les agence alors en hypercubes (cubes à plus de trois dimensions), chacune des dimensions représentant un axe d’analyse possible. Par la suite et selon les besoins de l’utilisateur, cela offre le choix des axes pertinents permettant de créer des indicateurs utiles en exécutant des fonctions d’agrégation de données le long des axes d’analyse retenus. Ainsi, le chiffre d’affaires par catégorie de clients sur un produit donné se décline selon trois axes : chiffre d’affaires (axe 1), la catégorie de clients (axe 2) et le produit (axe 3). Mais d’autres axes peuvent être définis : la zone géographique, le prix, le commercial en charge de la vente, etc. de sorte que plusieurs cubes à 3 dimensions peuvent être construits.

Schéma n° 3 – Représentation de cubes de données

schéma n° 3 – représentation de cubes de données

Les flux d’alimentation de données sont réalisés sur des outils ETL (extraction – transformation – chargement), par exemple IBM Datastage ou Talend en open source, qui assurent le transfert et la mise en forme des données entre les systèmes sources et l’entrepôt de données afin d’incorporer des données nettoyées mais également entre l’entrepôt et les magasins de données.

Les outils de reporting, par exemple Business Objects, assurent l’extraction et la mise en forme des données sous forme de rapports mis à disposition de l’utilisateur. Ils répondent au besoin principal des décideurs, à savoir produire des rapports et des tableaux de bords. Les données entreposées peuvent également faire l’objet d’un travail plus spécifique d’analyse (forage de données ou data mining) et même d’analyse prédictive.
 

2 : Cette information est importante uniquement à un niveau opérationnel, i.e. pour le SIO (système d’information opérationnel) qui a précisément pour fonction de faire circuler les données entre les différents organes de l’entreprise afin d’assurer son bon fonctionnement. Il devient en effet très important de savoir qu’une chaise noire en chêne a été vendue le 26 février 2011 dans le magasin de Dijon, car cela signifie qu’il est nécessaire dans la nuit du 26 au 27 février de prévoir l’expédition d’une chaise bleue à ce magasin pour reconstituer le stock.

3 : SGBD : Système de Gestion de Bases de Données

4 : ERP : Enterprise Resource Planning

5 : CRM : Customer Relationship Management

6 : La modélisation multidimensionnelle n’est pas systématique. Ainsi, beaucoup de magasins de données sont conçus selon un modèle relationnel en étoile ou en flocon, avec Business Object comme outil de restitution. Tout dépend de la nature des projets et des outils qui ont été choisis au départ.

7 : Si SQL est un langage de requête pour les bases de données bidimensionnelles ou relationnelles, MDX (MultiDimensional eXpression) est le langage de requêtes pour les bases de données multidimensionnelles. Une base multidimensionnelle est contenue dans un seul ‘ensemble’, chaque cellule, ou fait, étant caractérisée par une dimension (contexte du fait : type, date, lieu, groupe) et une mesure (quantité descriptive).