Actualités

[16/10/2014] L'édition 2014 du livre blanc de Smile : "Bonnes pratiques du web"

Smile publie une nouvelle version du livre blanc "Bonnes pratiques du web – Toutes les clés pour concevoir son site web". A télécharger gratuitement !

[14/10/2014] Smile vous donne RDV sur les forums de recrutement de 2014-2015 !

Vous aimez le web et les technologies de pointe, vous souhaitez mettre votre expertise au service du meilleur de l’open source ? Venez rencontrer Smile durant les prochains forums écoles de cette année 2014-2015.

[13/10/2014] Smile, partenaire de la 7ème édition de l'Open World Forum

L’Open World Forum 2014 se tiendra les 30 et 31 Octobre à l’Eurosites George V, à Paris. Pour cette édition, la ligne force est : "Take Back Control". Inscriptions gratuites !

Toutes les actualités picto
       

Vous avez besoin de mettre à jour votre Lecteur Flash Flash 7

Guillemet ouvrant l'actualité des solutions
et des technologies open source Guillemet fermant
[29/04/14]

Talend intègre dans sa solution Talend Open Studio for Data Integration des composants permettant la création d'une base de données, de dimensions et de cubes Jedox. On peut donc se demander s'il est possible de substituer l'ETL de Jedox par Talend. Nous allons voir ensemble par étapes les différents composants dans Talend qui permettent de créer une base de données, des dimensions, des attributs et cubes.  [...]

Lire le billet
[12/03/14]

Le moteur de recherche Elasticsearch permet de stocker des informations de localisation aisément. En effet, chaque document est stocké au format JSON et Elasticsearch supporte le format GeoJSON. [...]

Lire le billet
[27/02/14]

PDI (Pentaho Data Integration) est un outil ETL puissant qui fait partie de la suite décisionnelle Pentaho Business Analytics. Outre les fonctionnalités classiques que l'on peut attendre d'un ETL, sa compatibilité avec les autres modules de la suite Pentaho permet des utilisations moins classiques. [...]

Lire le billet
[22/01/14]

L'une des nouveautés stars de la version 5.0 de Pentaho Data Integration est le tout nouveau "Pentaho Data services" permettant de simuler la manipulation d'une base de données depuis une transformation PDI via un connecteur JDBC "Kettle Thin".
Ce n'est cependant pas l'unique nouveauté de cette nouvelle édition qui met l'accent sur la reprise sur erreur qui n'était pas encore très mature jusqu'à l'heure. [...]

Lire le billet
[10/12/13]

Jedox continue d'évoluer et cet article est l'occasion de présenter quelques unes des nouveautés. Jedox 5 met l’accent sur la qualité des rendus avec de nouveaux graphiques particulièrement travaillés ainsi que sur la portabilité de la solution dans la suite Office et l’amélioration des exports web/Excel ... [...]

Lire le billet
[12/11/13]

SpagoBI permet l’exécution et la planification de traitements ETL Talend depuis le portail décisionnel. Cette fonctionnalité est pratique pour permettre à des utilisateurs clés de rafraîchir des données de manière autonome (période de clôture comptable par exemple). [...]

Lire le billet
[24/09/13]

La version 5 de Pentaho apporte nativement la possibilité d'utiliser un traitement Pentaho Data Integration (PDI/Kettle) comme source de données au reporting, dashboarding, au requêtage et à l'analyse OLAP.
Les données exploitées à la restitution sont récupérées, à la volée, de manière analogue au résultat d'une requête SQL classique. [...]

Lire le billet
[10/06/13]

Une base Cassandra permet de stocker efficacement de grandes masses de données.
La présence d'un driver JDBC et du langage CQL ouvrent de nombreuses possibilités à Cassandra, comme nous l'avons aperçu dans des articles précédents ([Talend|http://blog.smile.fr/Extraire-des-donnees-d-une-base-Big-Data-Cassandra-avec-l-ETL-Talend-via-JDBC], [BIRT|http://blog.smile.fr/Elaborer-des-rapports-BIRT-avec-une-base-source-Big-Data-Cassandra-via-JDBC]). [...]

Lire le billet
[11/03/13]

Les bases Big Data arrivent à maturité et permettent de gérer efficacement de fortes volumétries de données.
La base Cassandra offre des avantages certains de performances en mono et multi data center, de robustesse et tolérance aux pannes des nœuds de cluster ainsi qu'une simplicité de mise en œuvre. [...]

Lire le billet
[05/02/13]

Lors d'une mise en place d'une solution de qualité de données, on est régulièrement amené à devoir confronter des données sources avec des référentiels et proposer des corrections.
A ce niveau, Talend propose le composant tFuzzyMatch qui permet de faire correspondre une donnée approximative avec une colonne de référence. Ce qui est limité si l'on veut faire une recherche à travers plusieurs colonnes de référence : typiquement, un nom de pays dont on ne connaît pas la langue source auquel on voudrait appliquer des correspondances sur différentes colonnes contenant les libellés dans plusieurs langues. Il faudrait alors utiliser autant de tFuzzyMatch que de langues à parcourir.  [...]

Lire le billet