Actualités

[21/07/2017] Smile lance les premiers vélos solaires connectés à l’occasion du Sun Trip Tour 2017

Smile, leader des solutions IoT et open source, confirme sa solide expertise sur le marché de l’embarqué en participant activement à la course de vélos solaires du Sun Trip Tour.

[03/07/2017] Smile remporte le Drupagora d'Or 2017 du meilleur site e-commerce

Le vendredi 30 juin, la 3ème édition des Drupagora d'Or s'est déroulée à Paris.

[30/06/2017] Découvrez les projets de nos équipes au Hackathon Data Énergie

Les 29 et 30 juin, le Hackathon Data Énergie s'est déroulé au Liberté Living Lab à Paris.

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Analyse dynamique depuis MongoDB avec PDI et Pentaho Business Analytics

PDI (Pentaho Data Integration) est un outil ETL puissant qui fait partie de la suite décisionnelle Pentaho Business Analytics. Outre les fonctionnalités classiques que l'on peut attendre d'un ETL, sa compatibilité avec les autres modules de la suite Pentaho permet des utilisations moins classiques.

pdi_mongodb

Le but ici est de remplacer une SGBD classique comme source de données pour des analyses OLAP par une transformation PDI.

Cet article décrit comment réaliser ce type d'analyse permettant de croiser des données MongoDB avec une base de donnée relationnelle :

  1. Développement d'une transformation PDI qui manipulera des données hétérogènes pour créer un set de données cohérent. Les données seront récupérées en autres, d'une base de données SQL Postgresql, d'une base de données NoSQL MongoDb orientée document.
  2. Il suffit ensuite, dans les paramètres de la transformation, de créer un Data Services dans l'onglet correspondant en définissant notamment le composant de la transformation portant le set de données voulu.

    pdi_mongodb2

  3. Une fois la transformation développée, configurer un serveur Carte pour son exécution à distance, en définissant dans son fichier de configuration le Data Services créé auparavant

    pdi_mongodb3

  4. Définir la source de données dans la plateforme BI, définir le schéma Mondrian à utiliser pour l'analyse OLAP.

Dès lors, les données sont analysables directement sur l'interface web sous la forme d'un tableau ou encore sous la forme d'un graphique voire même d'une Geo Map

pdi_mongodb4

Comme prévu, les données sont chargées depuis notre transformation PDI à chaque rafraîchissement des données.

pdi_mongodb5

A noter que la possibilité d'utiliser une transformation comme source de données concerne toutes les applications Java étant donné que la fédération de données se base sur un driver JDBC nommé kettle thin Driver, en pointant sur la base « kettle ».

Laury Girondin
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire