Actualités

[28/04/2017] Smile annonce son plan stratégique Open Arrow 2021 et accueille à son capital EURAZEO PME, nouvel actionnaire de référence qui succède à Keensight Capital

Smile, leader de l’intégration et l’infogérance de solutions open source, choisit son nouvel actionnaire majoritaire et s’offre de nouveaux moyens lui permettant le déploiement de son plan stratégique OPEN ARROW 2021 visant à créer un nouveau champion européen de l’IT de plus de 200M€ de chiffre d’affaires.

[25/04/2017] Smile est à nouveau Strategic Partner Alfresco !

Pour la quatrième année consécutive, Smile est Strategic partner Alfresco, le plus haut niveau de partenariat !

[12/04/2017] Smile décroche le statut de Partenaire Global Elite Magento !

Smile est très heureux d'annoncer que nous devenons Partenaire Global Elite Magento - un statut accordé à seulement 5 entreprises dans le monde !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Hive et iReport / Hive et Pentaho Report Designer

Quelle est le terme à la mode aujourd’hui en BI… ? Big Data !

Derrière ces deux mots ce cache beaucoup de concept, de problématiques et même de métier.
A cause de cela et pour le décisionnel uniquement, nous avons voulu tenter une approche pragmatique en testant l’utilisation des outils de reporting d’entreprise classique (PRD et iReports) avec les « bases big data » aujourd’hui disponibles.

Ci-dessous, quelques retours avec Hadoop Hive

Apache Hive est une sur-couche à Hadoop qui permet le requêtage, l'analyse de gros volumes de données. Ce projet a été initié par Facebook. Aujourd'hui, ce projet est sponsorisé par Microsoft, Yahoo!, Google et bien d'autres géans de l'internet.

hive

>>Ireport

Ireport inclut les plugins permettant d'utiliser les données provenant d'une base de données basé Hive. La définition de la chaine de connexion est identique à une base « classique ».

Une fois cela effectuée, on peut créer notre rapport s’appuyant sur un dataset fournit par les données stocké dans Hive. Le langage utilisé est le HiveSQL1.Le HiveSQL est un langage qui se rapproche beaucoup du langage SQL. Il possède globalement les mêmes mots clés : SELECT, WHERE, GROUP BY...

Une fois la requête finalisée, on peut commencer à créer le rapport de la même manière qu’un rapport sur basé sur des données provenant de Mysql.

>>Pentaho Report Designer

PRD possède un plugin qui permet d'effectuer des rapports à la manière d'Ireport. Contrairement aux autres bases (Cassandra et Hbase), il n’est pas nécessaire d’utiliser au préalable l'ETL PDI.

Une fois la connexion effectuée et la requête définie, le rapport se fait aussi de la même manière que tout autre rapport.

>>Conclusion

A l’aide de son langage proche du SQL (compétences plus communes) et la simplicité de connexion avec PRD, on donne aujourd’hui l’avantage à Hive.

Il reste cependant d’autres problématiques peut être plus centrales qui nécessitent une étude : la performance et les connecteurs ETL. Il y a aussi les sujets systèmes (installation et maintenance de ces bases) doivent également être pris en compte.

1https://cwiki.apache.org/confluence/display/Hive/LanguageManual

Suivez nous sur Twitter

Jonathan Framery
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire