COMPRENDRE LE BIG DATA
Ce que vous avez toujours voulu savoir sur le Big Data,sans jamais oser le demander. Par Jane McConnell, Consultante Teradata
lundi 7 décembre 2015
Le big data est dans tous les esprits et conversations professionnelles. Mais le terme de big data a fait l'objet de tellement de tentatives de définition que la confusion est souvent au rendez-vous.
Nombreux sont ceux qui s'interrogent face au big data : un webinar de Gartner fait état d'une étude qui souligne que 15% des personnes interrogées considèrent que la compréhension du big data compte parmi leurs trois défis les plus importants.
Quant à moi, j'ai ma statistique favorite : 9% des organisations qui ont investi dans les projets de big data ont du mal à comprendre ce qu'est... le big data. On ne peut que s'interroger face à cette interrogation : mais dans quoi ces organisations ont-elles réellement investi ?
Voici donc une liste de questions à l'intention de ceux qui s'interrogent sur le big data, sans forcément oser les poser.
Le big data est-il aussi volumineux qu'on le prétend?
Bien que le nom le suggère, nous utilisons en réalité ce terme pour décrire toute donnée qui, pour une raison ou pour une autre, n'est pas adaptée aux bases de données traditionnellement utilisées ces dernières années dans le cadre d'applications d'analyses et de business intelligence. À titre d'exemple, il s'agit de données qui ne s'intègrent pas dans une base de données relationnelle à des fins de requêtes (les pixels d'une image par exemple), ou qui doivent subir un traitement spécifique avant d'être intégrées avec d'autres données (données chronologiques provenant d'un équipement par exemple).
En quoi consiste ce mouvement actuel autour du big data ?
Il s'agit de pouvoir utiliser toutes les données à disposition, qu'il s'agisse d'images, de séquences vidéo, de fichiers audio, de texte en langage naturel, de données provenant de capteurs et bien sûr des données relationnelles classiques. Et ce, quel que soit le volume de ces données, mesuré en mégaoctets ou téraoctets, et qu'il s'agisse de données à un instant donné ou d'un flux permanent de données.
Qu'est-ce qui rend la gestion de ces données si complexe
Différents outils IT sont nécessaires pour gérer et rechercher ces données, une différence majeure par rapport aux données plus « traditionnelles ». Nous avons beaucoup à apprendre des grands noms de l'Internet, Yahoo, Google, et autres eBay, les pionniers de nouveaux outils et techniques analytiques. Les données qu'ils utilisent quotidiennement sont très proches de celles que les acteurs du secteur des hydrocarbures ont tant de mal à gérer. Ils interrogent des téraoctets de logs issus de serveurs Web pour mieux comprendre les comportements de leurs clients et prospects et ils utilisent un traitement basé sur le langage naturel, avec notamment une analyse des sentiments et des humeurs identifiés dans le contenu des réseaux sociaux. Enfin, avec la prolifération des objets connectés, notamment ceux qui se portent sur soi comme les coachs de santé de Fitbit ou l'Apple Watch, les données issues de capteurs présentent également un grand intérêt.
Pourquoi devons-nous analyser le big data ?
Et pourquoi ne le ferions-nous pas ? Dans certaines industries comme le pétrole et du gaz, les enjeux sont particulièrement importants. Lorsqu'on sait qu'un forage d'exploration peut coûter jusqu'à plusieurs millions d'euros, autant prendre des décisions métiers fondées sur les données... plutôt que sur des intuitions.
Le secteur du transport bénéficie également du big data. Les données des capteurs (une des sources du big data) qui surveillent le comportement et les performances des moteurs peuvent être associées aux données de spécifications du moteur, à son historique de maintenance ou encore aux détails des opérations d'entretien et d'utilisation (en clair toutes les sources de données disponibles traditionnellement). Cette corrélation permet aux opérateurs de prévoir précisément les risques de panne de ce moteur. Pour les opérateurs ferroviaires, les compagnies aériennes ou les acteurs de la logistique, cette approche permet de planifier l'immobilisation d'un moyen de transport à des fins de maintenance préventive, plutôt que d'attendre une panne réelle, au grand dam de passagers ou de destinataires de marchandises.
Ce modèle est-il transposable dans le secteur du pétrole et du gaz ? Si nous associons nos données de capteurs avec des informations spécifiques émanant des puits de forage, d'opérations de maintenance, du contexte géologique ou de conditions extérieures (météo par exemple), il devient possible d'améliorer les politiques de maintenance et les opérations de logistique, permettant ainsi aux entreprises de mieux maîtriser leurs coûts et d'éviter les problématiques fortuites.
Voilà qui semble être une décision métier particulièrement pertinente.
Communiqué de presse
© 2024 Dataevent