Actualités

[22/05/2017] Smile récompensé lors du Hackathon Carrefour !

Smile a remporté le Prix du Code lors du Hackathon Carrefour, organisé ce week-end à Paris !

[18/05/2017] OpenShift, le nouveau livre blanc Smile !

Smile publie aujourd'hui un livre blanc dédié à OpenShift, le PaaS open source orienté DevOps. A télécharger dès maintenant !

[15/05/2017] Smile décroche le label HappyAtWork 2017 !

Pour la 2ème année consécutive, Smile obtient le label HappyAtWork for Starters qui récompense les entreprises où il fait bon débuter sa carrière !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Utiliser un entrepôt de données Cassandra comme source de données aux cubes Jedox

Une base Cassandra permet de stocker efficacement de grandes masses de données.
La présence d'un driver JDBC et du langage CQL ouvrent de nombreuses possibilités à Cassandra, comme nous l'avons aperçu dans des articles précédents ([Talend|http://blog.smile.fr/Extraire-des-donnees-d-une-base-Big-Data-Cassandra-avec-l-ETL-Talend-via-JDBC], [BIRT|http://blog.smile.fr/Elaborer-des-rapports-BIRT-avec-une-base-source-Big-Data-Cassandra-via-JDBC]).

Nous relatons aujourd'hui comment associer la puissance d'agrégation et d'analyse du moteur MOLAP Jedox aux capacités de stockage de Cassandra en utilisant cette dernière comme source de données aux cubes Jedox.

Installation du driver JDBC de Cassandra dans l'ETL Jedox

Jedox dispose d'un ETL de chargement des cubes MOLAP, en technologie Java, motorisé par un serveur Tomcat.

Pour y installer le driver JDBC de Cassandra, il suffit de déposer dans le répertoire tomcat/lib de l'installation de Jedox BI Suite :

Paramétrage de la connexion dans l'ETL Jedox

Connexion

Le paramétrage d'une base Cassandra comme connexion source à l'ETL Jedox se fait en choisissant le type « GenericDB » à la création d'une nouvelle connexion et en paramétrant la chaine de connexion JDBC, comme présenté ci-dessous ; les paramètres de connexion peuvent également être variabilisés :

Extraction

La connexion définie peut ensuite servir à des extractions, comme illustré ci-dessous, en prenant en compte :

  • le paramétrage de timeout de l'instance Cassandra est ici aussi important : un timeout à l'extraction des données génère une erreur de job de l'ETL Jedox
  • la requête SQL paramétrée doit être une requête CQL

Les champs résultant de la requête CQL sont automatiquement mappés en sortie. L'extraction est ensuite utilisable de manière classique dans les transformations et chargements (dimensions, cubes).

Florent B.
picto

Commentaires

       
AntoineT
Bonjour,
je me demandais c'est bien juste org.apache.cassandra.cql.jdbc.CassandraDriver qu'il faut spécifier comme classe de pilote?
Merci d'avance :)
jeudi 07 mai 2015 @ 16:50
       

       
AntoineT
Il me mets toujours que la classe de pilote n'est pas trouvable j'ai essayé pas mal de trucs, en me disant que c'était un problème de compatibilité vu que j'utilise Cassandra 2.0.14. Avez-vous une piste?
jeudi 07 mai 2015 @ 16:50
       
Ecrire un nouveau commentaire