Actualités

[22/05/2017] Smile récompensé lors du Hackathon Carrefour !

Smile a remporté le Prix du Code lors du Hackathon Carrefour, organisé ce week-end à Paris !

[18/05/2017] OpenShift, le nouveau livre blanc Smile !

Smile publie aujourd'hui un livre blanc dédié à OpenShift, le PaaS open source orienté DevOps. A télécharger dès maintenant !

[15/05/2017] Smile décroche le label HappyAtWork 2017 !

Pour la 2ème année consécutive, Smile obtient le label HappyAtWork for Starters qui récompense les entreprises où il fait bon débuter sa carrière !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Elaborer des rapports BIRT avec une base source Big Data Cassandra via JDBC

Les bases Big Data arrivent à maturité et permettent de gérer efficacement de fortes volumétries de données.
La base Cassandra offre des avantages certains de performances en mono et multi data center, de robustesse et tolérance aux pannes des nœuds de cluster ainsi qu'une simplicité de mise en œuvre.

BIRT permet de se connecter à Cassandra via les connecteurs HECTOR et JDBC. Nous développerons la connectivité JDBC dans ce billet.

Le langage CQL de Cassandra, proche du SQL, ne permet pas encore d'effectuer des aggrégations et l'application de fonctions en base de données.

Par contre, le moteur de reporting BIRT intègrant un puissant moteur d'aggrégation et de fonctions sur données,la combinaison Cassandra + BIRT permet de réaliser des reportings et tableaux de bord.

Création de la Data Source du rapport BIRT

La création de la Datasource commence de manière classique, avec le choix « JDBC Database Connection for Query Builder » ; on notera au passage l'entrée «Cassandra Scripted Data Source » (via HECTOR).

Dans l'onglet JAR List, identfier les librairies jar relatives :

Paramétrer l'url JDBC et le driver ; BIRT peut guider l'identification de la classe du driver JDBC si besoin.

Tester la connexion à un nœud du cluster Cassandra avant d'enregistrer la Data Source.

Création du Data Set

Ecrire la requête SQL du Data Set. Ne pas oublier les limitations actuelles du langage CQL : les aggrégations et applications de fonctions seront effectuées en aval, dans le rapport BIRT.

Les champs (colonnes Cassandra) sont automatiquement mappées.

Des champs calculés par BIRT peuvent être ajoutés au Data Set.

Création d'un Data Cube

Le dataset est ensuite utilisable de manière classique et permet de définir un cube BIRT (dimensions et mesures) si besoin.

Création de restitutions

Le Data Set (et le cube) peuvent alimenter des tableaux (croisés) et graphiques.

Précautions à prendre pour l'exploitation fiable du rapport

2 précautions spécifiques à la source Cassandra via JDBC sont à prendre en compte pour une exécution fiable des tableaux de bords et rapports :

  • la compatibilité des requêtes CQL avec les timeouts définis au niveau du cluster Cassandra
  • la présence du driver JDBC ainsi que les librairies nécessaires référencées ci-dessus
Florent
picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire