BigData : Lumière sur les Enjeux gestion intensive et durable de données Numériques via Internet en Afrique dès 2013
L’arrivée
des réseaux sociaux, le Cloud computing et du mobile font exploser progressivement
le volume et le flux de données sur internet et au sein des entreprises en
Afrique. Ce qui pose déjà les enjeux de la gestion intensive de données. Mais
pas de panique, les solutions plus ou moins très efficaces existent. Quelles
soient Open Source comme Propriétaires.
Comparativement
aux grands noms d’internet en 2012 notamment Google,Microsoft,Apple,Yahoo,Facebook,
Twitter… on constate qu’ils font face au mêmes défis .
Ils y
apportent donc la solution en optant davantage pour l’utilisation de l’Open
source en l’occurrence Hadoop est un framework Java libre destiné aux applications distribuées et à la gestion intensive des données. Il permet aux applications de
travailler avec des milliers de nœuds et des pétaoctets de données.Hadoop a été créé par Doug Cutting et fait, en 2009, partie des
projets de la fondation logicielle Apache.
Hadoop est
par conséquent composé d’un ensemble
de briques permettant de bâtir des architectures de traitement sur des très
gros volumes de données. Parmi les principaux composants, Hadoop
regroupe un système de gestion de fichier (HDFS), un gestionnaire de calcul parallèle (MapReduce),
un système de gestion de base de données non-relationnelle distribuée (HBase)
et un ensemble de logiciels dédiés à la récupération et l’analyse des données
stockées (Pig, Hive, HCatalog).
Une version
d'Hadoop est également distribuée par Cloudera, qui propose un service de
formation et un support commercial.
Comments