Actualités

[22/05/2017] Des Smiliens récompensés lors du Hackathon Carrefour !

Notre équipe, composée en partie de Smiliens, a remporté le Prix du Code et celui de l'Incubation lors du Hackathon Carrefour, organisé ce week-end à Paris !

[18/05/2017] OpenShift, le nouveau livre blanc Smile !

Smile publie aujourd'hui un livre blanc dédié à OpenShift, le PaaS open source orienté DevOps. A télécharger dès maintenant !

[15/05/2017] Smile décroche le label HappyAtWork 2017 !

Pour la 2ème année consécutive, Smile obtient le label HappyAtWork for Starters qui récompense les entreprises où il fait bon débuter sa carrière !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Analyse dynamique depuis MongoDB avec PDI et Pentaho Business Analytics

PDI (Pentaho Data Integration) est un outil ETL puissant qui fait partie de la suite décisionnelle Pentaho Business Analytics. Outre les fonctionnalités classiques que l'on peut attendre d'un ETL, sa compatibilité avec les autres modules de la suite Pentaho permet des utilisations moins classiques.

pdi_mongodb

Le but ici est de remplacer une SGBD classique comme source de données pour des analyses OLAP par une transformation PDI.

Cet article décrit comment réaliser ce type d'analyse permettant de croiser des données MongoDB avec une base de donnée relationnelle :

  1. Développement d'une transformation PDI qui manipulera des données hétérogènes pour créer un set de données cohérent. Les données seront récupérées en autres, d'une base de données SQL Postgresql, d'une base de données NoSQL MongoDb orientée document.
  2. Il suffit ensuite, dans les paramètres de la transformation, de créer un Data Services dans l'onglet correspondant en définissant notamment le composant de la transformation portant le set de données voulu.

    pdi_mongodb2

  3. Une fois la transformation développée, configurer un serveur Carte pour son exécution à distance, en définissant dans son fichier de configuration le Data Services créé auparavant

    pdi_mongodb3

  4. Définir la source de données dans la plateforme BI, définir le schéma Mondrian à utiliser pour l'analyse OLAP.

Dès lors, les données sont analysables directement sur l'interface web sous la forme d'un tableau ou encore sous la forme d'un graphique voire même d'une Geo Map

pdi_mongodb4

Comme prévu, les données sont chargées depuis notre transformation PDI à chaque rafraîchissement des données.

pdi_mongodb5

A noter que la possibilité d'utiliser une transformation comme source de données concerne toutes les applications Java étant donné que la fédération de données se base sur un driver JDBC nommé kettle thin Driver, en pointant sur la base « kettle ».

Laury Girondin
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire