Actualités

[08/09/2017] Breaking news ! Smile décroche le label Happy Trainees 2018

Après le label HappyAtWork, Smile s’offre celui décerné par ses stagiaires et alternants !

[21/07/2017] Smile lance les premiers vélos solaires connectés à l’occasion du Sun Trip Tour 2017

Smile, leader des solutions IoT et open source, confirme sa solide expertise sur le marché de l’embarqué en participant activement à la course de vélos solaires du Sun Trip Tour.

[03/07/2017] Smile remporte le Drupagora d'Or 2017 du meilleur site e-commerce

Le vendredi 30 juin, la 3ème édition des Drupagora d'Or s'est déroulée à Paris.

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Le Master Data Management

Le Master Data Management (MDM), ou Gestion des Données de Références, permet à un organisme de gérer le référentiel des informations partagées par tous les services et applications.

Cela permet tout d'abord une interopérabilité des systèmes, dont les données de référence sont toutes en cohérence entre elles et avec le référentiel. Cela permet ensuite de les gérer dans le temps, avec des versions de données de références, et de suivi d'impact d'une modification de structure. Chaque sous-système devient de plus esclave du MDM du point de vue des données, le rendant plus facilement interchangeable dans une architecture SOA.

Gérer des données de référence passe tout d’abord par la définition des modèles qui définissent des objets et regroupés dans un domaine métier. On leur associe ensuite des règles de gestion (transformations, déclencheurs, validations, droits d’accès…). L’administration des données de références se fait enfin sur des enregistrements basés sur le modèle.

Il existe plusieurs solutions de MDM dans le monde open source, comme Mural de Sun ou encore MetaMatrix de Redhat ..., mais c'est la solution MDM de Talend, couplée à l'ETL Talend, qui nous semble porter le plus d'intérêt et d'avenir. Talend MDM est constitué d'un 'studio' destiné aux administrateurs pour la création du modèle et des règles, et d'un serveur sur lequel est publié le modèle, avec une console web de gestion des données des modèles aux utilisateurs finaux. L'ETL Talend sait nativement lire et écrire dans le MDM, ce qui simplifie grandement le travail de déploiement.

Nous vous proposons de suivre pas à pas les premières taches d'implémentation d'un projet MDM avec Talend ...

La première tâche d’un projet d’implémentation MDM avec Talend est la modélisation. Penchons nous donc d’abord sur le Studio.

  1. Création le modèle de données « catalogue »

Dans ce catalogue, le concept de « produit » sera déclaré (nous pourrions en imaginer d’autres comme la marque ou la catégorie, une liste de prix).

Le « produit » est défini comme un type de données complexe car nous allons lui associer divers attributs : sku, nom, prix et catégorie.

La catégorie sera à la fois un objet et un attribut. Nous sommes dans un contexte international donc le nom du produit est internationalisé.

Il faut ensuite associer ce modèle à un ou plusieurs conteneurs. Ces derniers serviront de référentiels : ils stockent les données.

2. Il faut ensuite associer ce modèle à un ou plusieurs conteneurs. Ces derniers serviront de référentiels : ils stockent les données.

3. Enfin, la création d’au moins une vue (la liste des produits) sera nécessaire donner à l’utilisateur un moyen de manipuler les données.

A partir de cette étape notre catalogue (référentiel de données « produit ») est utilisable. Des connecteurs Talend Integration Suite permettent l’alimentation d’une part et surtout la diffusion sous forme de propagation ou par interrogation.

Deux autres étapes seront nécessaires pour disposer d’un référentiel pertinent :

  • La définition des déclencheurs sur événement (modification) et sur un objet (l’attribut prix de l’entité produit)
  • L’implémentation des règles de gestion ou de processus (validation puis lancement d’un job d’intégration de données pour propager l’information)

Allons voir ensuite l’interface de gestion.

Cette interface est une application web classique ne nécessitant l’ajout d’aucun plugin.
Le serveur met en relation le modèle et le conteneur de façon à pouvoir de manipuler les données :

  • Recherche et affichage des entités

  • Rapport sur le conteneur : affichage des modèles et des entités

Nous pouvons voir ici un concept central du MDM : l’historisation. En effet, tout changement effectué sur les données est conservé.

  • Création ou modification des données.

Les attributs peuvent être simples (entier, texte, date…) ou complexes (dérivés d’une autre entité). Des règles de gestion complexes peuvent être imposées à un attribut ou une entité.

Quelle utilité dans la BI ?

L’élément central d’un SI décisionnel est naturellement l’entrepôt de données. Dans la plupart des cas, ce dernier est conçu sous forme d’étoile, c'est-à-dire une table de faits regroupant les indicateurs et plusieurs tables de dimensions. La base de données décisionnelle est donc alimentée de deux façons, création des nouveaux faits et mises à jour des dimensions ; l’ensemble des informations proviennent du SI opérationnel. L’intérêt de disposer d’un outil de MDM devient alors évident car il facilite la mise à jour des dimensions, données de référence provenant maintenant d’un système unique et non du SI opérationnel par nature hétérogène.

Un autre avantage certain du MDM pour la BI a été évoqué dans la première partie : les données de références seront les mêmes quelque soit la provenance des informations. Une direction financière ou stratégique d’un groupe international pourra donc disposer d’indicateurs plus globaux et plus fiables et les croiser sans règle de gestion complexe.


Annexes :

• La version de Talend MDM utilisée est la Community Edition 3.2.
• Description de Talend MDM par Talend

Laury Magne
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire