Actualités

[26/06/2017] Smile acquiert Hypertexte, expert en référencement naturel (SEO) et en contenus optimisés

Smile annonce l’acquisition de l’agence Hypertexte, spécialiste du référencement naturel, de la conception et de la réalisation de contenus pensés pour le SEO.

[21/06/2017] Smile dans le top 10 des entreprises où il fait bon travailler !

Smile entre dans le classement très fermé des entreprises où il fait bon débuter sa carrière. Un palmarès publié dans Les échos et réalisé par Meilleures-entreprises.com.

[20/06/2017] Smile classé 1er hébergeur en haute disponibilité depuis 3 mois

Depuis début mars, soit 3 mois consécutifs, Smile est à la tête du Classement des Hébergeurs en haute disponibilité, réalisé par ip-label et le Groupe NextRadio TV (01net, BFM, RMC).

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Cassandra et iReport / Cassandra et Pentaho Report Designer

Quel est le terme à la mode aujourd’hui en BI… ? Big Data ! Derrière ces deux mots se cachent plusieurs concepts et problématiques. Pour le décisionnel, nous avons voulu tenter une approche pragmatique en testant l’utilisation des outils de reporting d’entreprise classiques (iReport et Pentaho Report Designer) avec quelques « bases Big Data » en vue aujourd’hui : Cassandra, Hadoop Hbase et Hadoop Hive.

Ci-dessous, quelques retours d’expériences avec Cassandra.

Ireport :

Un plugin iReport, permettant d'utiliser les données provenant d'une base de données Cassandra, est disponible sur JasperForge.

L’utilisation d’iReport reste classique : la création d’un rapport et l’exploitation des données à partir d’un dataset (elles s’utilisent simplement et sont parfaitement restituées en utilisant les objets fournis par iReport).

Les changements s'opèrent :

  • au niveau de la définition de la connexion JDBC vers le système Cassandra, sous la forme : jdbc:cassandra://HOST:port/KEYSPACE. (La notion de keyspace se rapproche de celle d’une database pour faire une analogie avec un SGBD relationnel classique.)
  • à l’élaboration de la requête  qui fournit le dataset. Le langage utilisé est le CQL (Cassandra Query Language) qui montre des limitations par rapport au SQL : pas de jointure, ni agrégation (GROUP BY), ni tri (ORDER BY) par exemple.

A noter que la publication du rapport sur le portail JasperServer nécessite l'installation d’un plugin Cassandra sur le serveur, également disponible sur JasperForge.

Pentaho Report Designer (PRD) :

PRD possède également un plugin qui permet la connexion vers une base Cassandra.

En revanche, il faut obligatoirement passer par Pentaho Data Integration (l’ETL de Pentaho) pour pouvoir travailler les données en provenance de Cassandra car il n’existe pas de connecteurs natifs directement dans PRD.

Cela dit, le procédé fonctionne très bien et nécessite un seul composant de sortie avec un tri sur les lignes.

 

La problématique est ensuite totalement similaire à celle de iReport : la requête est limitée dans ses possibilités mais les composants fonctionnent.

Conclusion :

Le langage CQL est actuellement assez limité pour alimenter des tableaux de bords.

Une partie de ces limites peuvent être palliées via des traitements au niveau de la base de données Cassandra ou en aval de la requête, dans la logique embarquée dans le rapport (ce qui peut s’avérer coûteux en termes de ressources, les volumes de données étant conséquents).

Adrien Futschik
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire