Actualités

[22/03/2017] Smile participe au salon Cloud Computing World Expo

Smile interviendra ce mercredi 22 mars au salon Cloud Computing World Expo pour présenter notre projet collaboratif OCCIware (plateforme standard outillée de connecteurs Cloud).

[22/03/2017] Smile vainqueur des IoT Awards 2017 !

Lors de l'IoT World à Paris, Smile a remporté l'IoT Award dans la catégorie "High-tech" pour son projet de cabine connectée avec Coved.

[17/03/2017] Smile dans le Journal de l'Emploi sur Demain TV

Géraldine Moreau-Luchaire, notre Responsable Recrutement, nous parle des 350 postes à pourvoir en 2017 !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Comparatif des interfaces SQL d'exploitation d'entrepôts de données Big Data/NoSQL

A l'heure où de plus en plus d'entreprises déploient ou migrent leur entrepôt de données sur HADOOP, il nous a paru intéressant de partager un comparatif des outils d'accès aux données en langage SQL, qui reste à ce jour une référence.
Nous présentons ici un comparatif synthétique des briques Big Data Apache Hive et Apache Drill face à MySQL sur les fonctionnalités de lecture des données (les fonctionnalités de chargement ne sont pas traitées dans cet article).

Hive

Hive est la brique de requêtage SQL native d'HADOOP.

Drill

 Drill est une brique qui permet de requêter directement des sources NoSQL… en SQL.

MySQL

MySQL est un système de gestion de bases de données Open Source largement répandu.

Richesse des fonctionnalités SQL

Fonctions SQL

MySQL

Hive

Drill

Jointures

[INNER | CROSS] JOIN, {LEFT|RIGHT} [OUTER] JOIN

{LEFT|RIGHT|FULL} [OUTER] JOIN,
CROSS JOIN, LEFT SEMI JOIN

[INNER] JOIN, {LEFT|RIGHT|FULL} [OUTER] JOIN

Union

Oui

Oui

Oui

Sous-requête

Oui

Oui

Oui

Filtrage et tri

Oui

Oui

Oui

Fonctions mathématiques

Oui

Oui

Oui

Fonctions date

Oui

Oui

Oui

Fonctions chaîne de caractère

Oui

Oui

Oui

Opérateurs conditionnels

Oui

Oui

Oui

Opérateurss relationnels

Oui

Oui

Oui

Opérateurs arithmétiques

Oui

Oui

Oui

Opérateurs logiques

Oui

Oui

Oui

Analytics/Fenêtrage

Non

Oui (OVER)

Non (prévu dans la feuille de route d'Apache Drill)

Plan d’exécution

Oui

Oui

Oui

Gestion des structures de données avancées

Structures

MySQL

Hive

Drill

Définition des structures de données

Oui

Oui

Optionnelle

Stockage externe

Non

Oui (fichiers, JDBC, MongoDB, Google Spreadsheet,..)

Oui (fichiers CSV, JSON, MongoDB, Hive)

Partitionnement

Oui

Oui

Oui

Indexes

Oui (mais pas BITMAP)

Oui (dont BITMAP)

Non

Vues

Oui

Oui

Oui

Types de données complexes

Non

Oui

Oui

Capacités de traitement

Capacités de traitement

MySQL

Hive

Drill

Traitement de requêtes réparti

Non

Oui (MapReduce, PIG, Spark, Tez)

Oui (Drillbit, MapReduce, PIG, Spark, Hive)

Connectivité

Drivers

MySQL

Hive

Drill

JDBC

Oui

Oui

Oui

ODBC

Peu exploitable

Oui

Oui

Conclusion

S'il y a encore quelques années, l'exploitation de données Big Data se faisait au travers soit d'un langage spécifique soit avec une forte latence, les choses ont évolué ; Hive et Drill permettent maintenant d'exploiter pleinement les données d'un DWH Big Data/NoSQL avec de bonnes performances et un bon niveau de respect des standards SQL.

Leur connectivité leur permet un usage facile depuis les outils classiques de requêtage, BI, tableurs et applicatifs.

Apache Hive est la référence en exploitation de données stockées dans un entrepôt HADOOP. Son intégration aux moteurs Tez et Spark lui permet de servir des requêtes SQL avec une faible latence.

Apache Drill est très pratique pour de la découverte de données et requêter des données partiellement structurées. Son évolution rapide en fait également un outil prometteur.

Florent BERANGER
picto

Commentaires

       
Freda
Très bel article. J’ai réussi à maîtriser le langage sql en me basant sur un tutoriel en vidéo sur http://www.alphorm.com/tutoriel/formation-en-ligne-le-langage-sql et je dois dire que ce comparatif m’intéresse beaucoup. Je vais l’étudier minutieusement. Merci pour le partage.
mardi 14 juin 2016 @ 8:10
       
Ecrire un nouveau commentaire