Lexique Big Data

Data Cleansing: Littéralement nettoyage des données. C'est une phase qui consiste à supprimer les données incohérentes, corriger les erreurs comme, par exemple, des données mal saisies. Disposer d'informations d'un bon niveau de qualité est un préalable à l'élaboration d'algorithmes de Machine Learning. Data Analyst: Maitrisant les outils du Big Data et les statistiques, le Data Analyst code les algorithmes prédictifs sur la plateforme analytique. Data Scientist: A la fois statisticien de haut vol, capable de manipuler les outils informatiques du Big Data et comprendre les enjeux business de ses analyses. Le Data Scientist (parfois traduit en scientifique des données) est l'homme clé du Big Data. Data Lake: L'approche Data Lake ou lac de données consiste à mettre en place un cluster Hadoop où vont converger toutes les données brutes que l'entreprise peut capter. Lexique pour comprendre la Big Data. Un moyen de casser les silos instaurés avec les approches datawarehouse. Hadoop: Initialement développé par Doug Cutting et Mike Cafarella alors employés chez Yahoo!, Hadoop, du nom de l'éléphant en peluche du fils de Doug Cutting, est une implémentation open source du modèle de programmation MapReduce, initialement imaginé par Google.

Lexique Big Data App

Les professionnels spécialisés dans le data Mining utilisent des méthodes semi-automatiques ou automatiques. Le concept SoLoMo: SoLoMo est l'acronyme de Social, Local, Mobile. Il s'agit d'une des grandes tendances apparues en 2012. Elle est liée au fait que le nombre de Smartphones et de tablettes vendus est devenu supérieur à celui des ordinateurs. Cette nouvelle situation nécessitait en retour, une communication cross-canal (tous réseaux) de la part des entreprises. La Business intelligence: La business intelligence ou informatique décisionnelle est destinée aux décideurs et aux dirigeants d'entreprises. Elle réunit les outils et les méthodes élaborées pour modéliser les donnée issues du Big Data afin de les rendre intelligibles par les dirigeants et de faciliter la prise de décision. Le cloud: Le cloud ou Nuage est une organisation externalisée dans la sphère web. Le vocabulaire du Big Data : 10 expressions clés pour tout comprendre - Ecole de commerce. Elle offre un accès omniprésent et à la demande, à un réseau partagé et à des ressources informatiques configurables. Le cloud computing est notamment apprécié pour sa grande souplesse d'utilisation.

Les dark data sont des données qui sont stockées par un grand nombre d'acteurs (entreprises, organisations…), mais qui ne sont pas utilisées dans un but précis ou ne sont pas utiles. Lexique Big Data. Les organisations ont tendance à les stocker pour les revendre, les utiliser éventuellement dans le futur etc. Elles sont un problème important notamment pour la préservation du secret et de la vie privée. Y-a-t-il d'autres thèmes que vous souhaitez voir définir? Laissez moi vos questions en commentaires.