Actualités

[21/07/2017] Smile lance les premiers vélos solaires connectés à l’occasion du Sun Trip Tour 2017

Smile, leader des solutions IoT et open source, confirme sa solide expertise sur le marché de l’embarqué en participant activement à la course de vélos solaires du Sun Trip Tour.

[03/07/2017] Smile remporte le Drupagora d'Or 2017 du meilleur site e-commerce

Le vendredi 30 juin, la 3ème édition des Drupagora d'Or s'est déroulée à Paris.

[30/06/2017] Découvrez les projets de nos équipes au Hackathon Data Énergie

Les 29 et 30 juin, le Hackathon Data Énergie s'est déroulé au Liberté Living Lab à Paris.

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Cassandra et iReport / Cassandra et Pentaho Report Designer

Quel est le terme à la mode aujourd’hui en BI… ? Big Data ! Derrière ces deux mots se cachent plusieurs concepts et problématiques. Pour le décisionnel, nous avons voulu tenter une approche pragmatique en testant l’utilisation des outils de reporting d’entreprise classiques (iReport et Pentaho Report Designer) avec quelques « bases Big Data » en vue aujourd’hui : Cassandra, Hadoop Hbase et Hadoop Hive.

Ci-dessous, quelques retours d’expériences avec Cassandra.

Ireport :

Un plugin iReport, permettant d'utiliser les données provenant d'une base de données Cassandra, est disponible sur JasperForge.

L’utilisation d’iReport reste classique : la création d’un rapport et l’exploitation des données à partir d’un dataset (elles s’utilisent simplement et sont parfaitement restituées en utilisant les objets fournis par iReport).

Les changements s'opèrent :

  • au niveau de la définition de la connexion JDBC vers le système Cassandra, sous la forme : jdbc:cassandra://HOST:port/KEYSPACE. (La notion de keyspace se rapproche de celle d’une database pour faire une analogie avec un SGBD relationnel classique.)
  • à l’élaboration de la requête  qui fournit le dataset. Le langage utilisé est le CQL (Cassandra Query Language) qui montre des limitations par rapport au SQL : pas de jointure, ni agrégation (GROUP BY), ni tri (ORDER BY) par exemple.

A noter que la publication du rapport sur le portail JasperServer nécessite l'installation d’un plugin Cassandra sur le serveur, également disponible sur JasperForge.

Pentaho Report Designer (PRD) :

PRD possède également un plugin qui permet la connexion vers une base Cassandra.

En revanche, il faut obligatoirement passer par Pentaho Data Integration (l’ETL de Pentaho) pour pouvoir travailler les données en provenance de Cassandra car il n’existe pas de connecteurs natifs directement dans PRD.

Cela dit, le procédé fonctionne très bien et nécessite un seul composant de sortie avec un tri sur les lignes.

 

La problématique est ensuite totalement similaire à celle de iReport : la requête est limitée dans ses possibilités mais les composants fonctionnent.

Conclusion :

Le langage CQL est actuellement assez limité pour alimenter des tableaux de bords.

Une partie de ces limites peuvent être palliées via des traitements au niveau de la base de données Cassandra ou en aval de la requête, dans la logique embarquée dans le rapport (ce qui peut s’avérer coûteux en termes de ressources, les volumes de données étant conséquents).

Adrien Futschik
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire