Développement et couche intermédiare

Les bases de données sont devenues des éléments incontournables du paysage informatique. Elles permettent de stocker un lot d’informations dans une structure définie par avance. Les technologies actuelles permettent d'organiser et de structurer la base de données de manière à pouvoir facilement manipuler le contenu et stocker efficacement de très grandes quantités d'informations. Les bases de données, comme MySQL ou PostgreSQL, sont de type relationnel utilisant le langage SQL pour l’interrogation de leurs données.
L’émergence du phénomène Big Data est intrinsèquement lié au fait que l’information et la capacité à la traiter est devenue l’un des facteurs clé dans le succès d’une entreprise. Soumise à de tels enjeux de volumétrie et d’hétérogénéité, les technologies utilisées jusqu’alors n’ont pas tardé à montrer leurs limites et il a été nécessaire de réinventer un certain nombre d’outils pour qu’ils puissent s’adapter à ces nouvelles contraintes: stockage et traitement de données qui doit désormais être distribué, collecte de données hétérogènes et multi-sources, restitution des données.
L’ETL est souvent une brique du décisionnel même si on l’utilise parfois en dehors de ce cadre. ETL signifie « Extract Transform Load ». Ce sont des outils qui permettent la réalisation de synchronisations massives d’informations d’une source de données vers une autre. Dans les faits, les ETL peuvent être utilisés dans des cas bien plus simples d’extraction, de transformation et/ou de chargement. Les outils d’ETL disposent généralement de connecteurs permettant l’importation ou l’exportation de données dans les applications tierces.
CATEGORIES