Actualités

[28/04/2017] Smile annonce son plan stratégique Open Arrow 2021 et accueille à son capital EURAZEO PME, nouvel actionnaire de référence qui succède à Keensight Capital

Smile, leader de l’intégration et l’infogérance de solutions open source, choisit son nouvel actionnaire majoritaire et s’offre de nouveaux moyens lui permettant le déploiement de son plan stratégique OPEN ARROW 2021 visant à créer un nouveau champion européen de l’IT de plus de 200M€ de chiffre d’affaires.

[25/04/2017] Smile est à nouveau Strategic Partner Alfresco !

Pour la quatrième année consécutive, Smile est Strategic partner Alfresco, le plus haut niveau de partenariat !

[12/04/2017] Smile décroche le statut de Partenaire Global Elite Magento !

Smile est très heureux d'annoncer que nous devenons Partenaire Global Elite Magento - un statut accordé à seulement 5 entreprises dans le monde !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Cassandra et iReport / Cassandra et Pentaho Report Designer

Quel est le terme à la mode aujourd’hui en BI… ? Big Data ! Derrière ces deux mots se cachent plusieurs concepts et problématiques. Pour le décisionnel, nous avons voulu tenter une approche pragmatique en testant l’utilisation des outils de reporting d’entreprise classiques (iReport et Pentaho Report Designer) avec quelques « bases Big Data » en vue aujourd’hui : Cassandra, Hadoop Hbase et Hadoop Hive.

Ci-dessous, quelques retours d’expériences avec Cassandra.

Ireport :

Un plugin iReport, permettant d'utiliser les données provenant d'une base de données Cassandra, est disponible sur JasperForge.

L’utilisation d’iReport reste classique : la création d’un rapport et l’exploitation des données à partir d’un dataset (elles s’utilisent simplement et sont parfaitement restituées en utilisant les objets fournis par iReport).

Les changements s'opèrent :

  • au niveau de la définition de la connexion JDBC vers le système Cassandra, sous la forme : jdbc:cassandra://HOST:port/KEYSPACE. (La notion de keyspace se rapproche de celle d’une database pour faire une analogie avec un SGBD relationnel classique.)
  • à l’élaboration de la requête  qui fournit le dataset. Le langage utilisé est le CQL (Cassandra Query Language) qui montre des limitations par rapport au SQL : pas de jointure, ni agrégation (GROUP BY), ni tri (ORDER BY) par exemple.

A noter que la publication du rapport sur le portail JasperServer nécessite l'installation d’un plugin Cassandra sur le serveur, également disponible sur JasperForge.

Pentaho Report Designer (PRD) :

PRD possède également un plugin qui permet la connexion vers une base Cassandra.

En revanche, il faut obligatoirement passer par Pentaho Data Integration (l’ETL de Pentaho) pour pouvoir travailler les données en provenance de Cassandra car il n’existe pas de connecteurs natifs directement dans PRD.

Cela dit, le procédé fonctionne très bien et nécessite un seul composant de sortie avec un tri sur les lignes.

 

La problématique est ensuite totalement similaire à celle de iReport : la requête est limitée dans ses possibilités mais les composants fonctionnent.

Conclusion :

Le langage CQL est actuellement assez limité pour alimenter des tableaux de bords.

Une partie de ces limites peuvent être palliées via des traitements au niveau de la base de données Cassandra ou en aval de la requête, dans la logique embarquée dans le rapport (ce qui peut s’avérer coûteux en termes de ressources, les volumes de données étant conséquents).

Adrien Futschik
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire