Actualités

[21/06/2017] Smile dans le top 10 des entreprises où il fait bon travailler !

Smile entre dans le classement très fermé des entreprises où il fait bon débuter sa carrière. Un palmarès publié dans Les échos et réalisé par Meilleures-entreprises.com.

[20/06/2017] Smile classé 1er hébergeur en haute disponibilité depuis 3 mois

Depuis début mars, soit 3 mois consécutifs, Smile est à la tête du Classement des Hébergeurs en haute disponibilité, réalisé par ip-label et le Groupe NextRadio TV (01net, BFM, RMC).

[20/06/2017] Smile remporte l'Extending eZ Award !

Lors de l'eZ Conference 2017 qui s'est tenue du 6 au 8 juin, Smile a remporté l'Extending eZ Award.

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Hive et iReport / Hive et Pentaho Report Designer

Quelle est le terme à la mode aujourd’hui en BI… ? Big Data !

Derrière ces deux mots ce cache beaucoup de concept, de problématiques et même de métier.
A cause de cela et pour le décisionnel uniquement, nous avons voulu tenter une approche pragmatique en testant l’utilisation des outils de reporting d’entreprise classique (PRD et iReports) avec les « bases big data » aujourd’hui disponibles.

Ci-dessous, quelques retours avec Hadoop Hive

Apache Hive est une sur-couche à Hadoop qui permet le requêtage, l'analyse de gros volumes de données. Ce projet a été initié par Facebook. Aujourd'hui, ce projet est sponsorisé par Microsoft, Yahoo!, Google et bien d'autres géans de l'internet.

hive

>>Ireport

Ireport inclut les plugins permettant d'utiliser les données provenant d'une base de données basé Hive. La définition de la chaine de connexion est identique à une base « classique ».

Une fois cela effectuée, on peut créer notre rapport s’appuyant sur un dataset fournit par les données stocké dans Hive. Le langage utilisé est le HiveSQL1.Le HiveSQL est un langage qui se rapproche beaucoup du langage SQL. Il possède globalement les mêmes mots clés : SELECT, WHERE, GROUP BY...

Une fois la requête finalisée, on peut commencer à créer le rapport de la même manière qu’un rapport sur basé sur des données provenant de Mysql.

>>Pentaho Report Designer

PRD possède un plugin qui permet d'effectuer des rapports à la manière d'Ireport. Contrairement aux autres bases (Cassandra et Hbase), il n’est pas nécessaire d’utiliser au préalable l'ETL PDI.

Une fois la connexion effectuée et la requête définie, le rapport se fait aussi de la même manière que tout autre rapport.

>>Conclusion

A l’aide de son langage proche du SQL (compétences plus communes) et la simplicité de connexion avec PRD, on donne aujourd’hui l’avantage à Hive.

Il reste cependant d’autres problématiques peut être plus centrales qui nécessitent une étude : la performance et les connecteurs ETL. Il y a aussi les sujets systèmes (installation et maintenance de ces bases) doivent également être pris en compte.

1https://cwiki.apache.org/confluence/display/Hive/LanguageManual

Suivez nous sur Twitter

Jonathan Framery
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire