Actualités

[08/09/2017] Breaking news ! Smile décroche le label Happy Trainees 2018

Après le label HappyAtWork, Smile s’offre celui décerné par ses stagiaires et alternants !

[21/07/2017] Smile lance les premiers vélos solaires connectés à l’occasion du Sun Trip Tour 2017

Smile, leader des solutions IoT et open source, confirme sa solide expertise sur le marché de l’embarqué en participant activement à la course de vélos solaires du Sun Trip Tour.

[03/07/2017] Smile remporte le Drupagora d'Or 2017 du meilleur site e-commerce

Le vendredi 30 juin, la 3ème édition des Drupagora d'Or s'est déroulée à Paris.

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Hortonworks 2.3, une nouvelle version et deux grandes avancées pour Hadoop et le big data

Hortonworks 2.3 vient de paraître, et présente au moins deux avancées majeures pour le big data basé sur Hadoop.

Avant de rentrer dans le détail, rappelons que Hortonworks est une distribution de Hadoop, intégrant de nombreux projets de la fondation Apache, en constituant un ensemble cohérent,  opérationnel et supporté. Hortonworks, au plus proche des standards Hadoop en est d'ailleurs un contributeur majeur pour faire évoluer le cœur du produit et les fonctionnalités bigdata.

Plusieurs évolutions et corrections sont intégrées dans cette version 2.3, mais c’est deux fonctionnalités qui nous paraissent essentielles, et qui manquaient en partie jusque là : la simplification de l’administration sur laquelle nous reviendrons prochainement, et la sécurité des données, que nous allons détailler ci-dessous.

Sécurité des données

L’enjeu de la sécurité est important. En effet, avec l’approche big data, nous construisons des datalakes et les alimentons avec de nombreuses sources de données. La dynamique des nouvelles données étant forte, et l’alimentation étant aisée, le datalake se remplit aisément, par différents intervenants, mêlant des données avec des degrés de confidentialité différents, et introduisant ainsi en continu des potentielles brèches de sécurité, qu’il faut gérer.

Il n’est évidemment pas concevable que les données, tant sécurisées dans le SI traditionnel, soient lisibles de tous dans un datalake. La réponse apportée par Hadoop jusqu’ici était acceptable, mais encore incomplète.

Ranger pour la sécurité unifiée

Avec cette version de Ranger, Hortonworks donne une réponse unifiée de la sécurité. Et ce n’est pas rien, quand on connait le nombre de solutions sous-jacentes qu’il faut unifier. Cette version ajoute la gestion de la sécurité pour SolR, Kafka et YARN aux outils déjà gérés (HDFS, HBase, Hive, Knox et Storm). Si SolR n’est pas toujours utilisé dans un projet big data, l’ajout de YARN est très utile, YARN étant central dans l’accès aux données, que ce soit en SQL, fichiers, streaming, …

Données cryptées

De plus, les données de HDFS peuvent maintenant être cryptées (et donc inaccessibles pour les administrateurs système par exemple) et leur accès par clé de décryptage est managé par le même Ranger.

Accès sécurisé aux métadonnées

La gestion des droits est approfondie y compris pour les administrateurs dans Hive avec le contrôle des droits pour les accès aux métadonnées des structures (qui manquait jusqu’ici…). Ce qui permet de renforcer et d’assurer la sécurité par « tenant » dans une architecture multi-tenants.

Audit de sécurité

Avoir une solution unique pour la sécurité permet de tracer tous les accès aux données, et ainsi de pouvoir auditer la sécurité, a posteriori, avec la liste des accès réalisés sur une période, par ressource / type de ressource ou utilisateur.

Gouvernance des données avec Apache Atlas

Atlas est un nouveau projet placé en incubation depuis peu dans la fondation Apache, issu d’une « initiative pour la gouvernance des données » entre plusieurs acteurs, éditeurs et utilisateurs de big data, autour de Hortonworks. L’objectif est d’obtenir une gouvernance des données interopérable avec le « legacy », en développant un framework d’échange de métadonnées, et en implémentant une taxonomie orientée métier pour plusieurs domaines, tels que la finance, les telecoms, le retail ou la santé. Encore jeune, ce projet reste très prometteur, avec beaucoup de choses prévues déjà sur le second semestre 2015.

En conclusion, avec cette version, Hortonworks fait un grand pas dans la gestion de la sécurité des données autour de Hadoop.
Et ce n’est pas fini !

picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire