Actualités

[26/06/2017] Smile acquiert Hypertexte, expert en référencement naturel (SEO) et en contenus optimisés

Smile annonce l’acquisition de l’agence Hypertexte, spécialiste du référencement naturel, de la conception et de la réalisation de contenus pensés pour le SEO.

[21/06/2017] Smile dans le top 10 des entreprises où il fait bon travailler !

Smile entre dans le classement très fermé des entreprises où il fait bon débuter sa carrière. Un palmarès publié dans Les échos et réalisé par Meilleures-entreprises.com.

[20/06/2017] Smile classé 1er hébergeur en haute disponibilité depuis 3 mois

Depuis début mars, soit 3 mois consécutifs, Smile est à la tête du Classement des Hébergeurs en haute disponibilité, réalisé par ip-label et le Groupe NextRadio TV (01net, BFM, RMC).

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
picto

Hortonworks 2.3, une nouvelle version et deux grandes avancées pour Hadoop et le big data

Hortonworks 2.3 vient de paraître, et présente au moins deux avancées majeures pour le big data basé sur Hadoop.

Avant de rentrer dans le détail, rappelons que Hortonworks est une distribution de Hadoop, intégrant de nombreux projets de la fondation Apache, en constituant un ensemble cohérent,  opérationnel et supporté. Hortonworks, au plus proche des standards Hadoop en est d'ailleurs un contributeur majeur pour faire évoluer le cœur du produit et les fonctionnalités bigdata.

Plusieurs évolutions et corrections sont intégrées dans cette version 2.3, mais c’est deux fonctionnalités qui nous paraissent essentielles, et qui manquaient en partie jusque là : la simplification de l’administration sur laquelle nous reviendrons prochainement, et la sécurité des données, que nous allons détailler ci-dessous.

Sécurité des données

L’enjeu de la sécurité est important. En effet, avec l’approche big data, nous construisons des datalakes et les alimentons avec de nombreuses sources de données. La dynamique des nouvelles données étant forte, et l’alimentation étant aisée, le datalake se remplit aisément, par différents intervenants, mêlant des données avec des degrés de confidentialité différents, et introduisant ainsi en continu des potentielles brèches de sécurité, qu’il faut gérer.

Il n’est évidemment pas concevable que les données, tant sécurisées dans le SI traditionnel, soient lisibles de tous dans un datalake. La réponse apportée par Hadoop jusqu’ici était acceptable, mais encore incomplète.

Ranger pour la sécurité unifiée

Avec cette version de Ranger, Hortonworks donne une réponse unifiée de la sécurité. Et ce n’est pas rien, quand on connait le nombre de solutions sous-jacentes qu’il faut unifier. Cette version ajoute la gestion de la sécurité pour SolR, Kafka et YARN aux outils déjà gérés (HDFS, HBase, Hive, Knox et Storm). Si SolR n’est pas toujours utilisé dans un projet big data, l’ajout de YARN est très utile, YARN étant central dans l’accès aux données, que ce soit en SQL, fichiers, streaming, …

Données cryptées

De plus, les données de HDFS peuvent maintenant être cryptées (et donc inaccessibles pour les administrateurs système par exemple) et leur accès par clé de décryptage est managé par le même Ranger.

Accès sécurisé aux métadonnées

La gestion des droits est approfondie y compris pour les administrateurs dans Hive avec le contrôle des droits pour les accès aux métadonnées des structures (qui manquait jusqu’ici…). Ce qui permet de renforcer et d’assurer la sécurité par « tenant » dans une architecture multi-tenants.

Audit de sécurité

Avoir une solution unique pour la sécurité permet de tracer tous les accès aux données, et ainsi de pouvoir auditer la sécurité, a posteriori, avec la liste des accès réalisés sur une période, par ressource / type de ressource ou utilisateur.

Gouvernance des données avec Apache Atlas

Atlas est un nouveau projet placé en incubation depuis peu dans la fondation Apache, issu d’une « initiative pour la gouvernance des données » entre plusieurs acteurs, éditeurs et utilisateurs de big data, autour de Hortonworks. L’objectif est d’obtenir une gouvernance des données interopérable avec le « legacy », en développant un framework d’échange de métadonnées, et en implémentant une taxonomie orientée métier pour plusieurs domaines, tels que la finance, les telecoms, le retail ou la santé. Encore jeune, ce projet reste très prometteur, avec beaucoup de choses prévues déjà sur le second semestre 2015.

En conclusion, avec cette version, Hortonworks fait un grand pas dans la gestion de la sécurité des données autour de Hadoop.
Et ce n’est pas fini !

picto

Commentaires

Soyez la premiere personne à ajouter un commentaire sur cet article.
Ecrire un nouveau commentaire