Skip to main Content
Article

Retour vers le futur de la Data

Global Knowledge
  • Date: 24 November, 2020

Evolution de l'utilisation de la donnée

 

Pendant longtemps, la data a été un domaine assez mystérieux et réservé à l'administrateur de bases données, également connu sous le nom de DBA. Celui-ci travaille sur des serveurs de données tels qu'Oracle, SQL server ou DB2 et s'occupe principalement de la sécurité d'accès, le stockage, les sauvegardes sur des données d'exploitation : c’est-à-dire les données sur nos clients, nos commandes, ….

Des données qui supportent nos applications et qui sont donc des données internes.

L'analyse de données était confiée à une équipe de développement, avec un passé d'informaticien pour pouvoir se projeter sur des solutions de reporting. Les décideurs devaient être en interaction avec ces équipes de développement et la création des rapports restait une activité limitée.

 

Aujourd'hui, ce que l'on dira de ces activités d'analyse de données c'est que les champs de données vont bien au-delà de l'entreprise: on s'intéresse aux réseaux sociaux, on s'intéresse à des nouveaux outils de télémétrie, on s'intéresse à des flux de données privés.

 

Le monde de la donnée est dépoussiéré et on doit se poser les questions autrement.

 

Désormais,  on parle de "growth Manager" ou de Data Scientist. On attend de ces fonctions qu'elles anticipent sur les besoins de nos clients. Leur expertise s'exerce avant tout sur leurs capacités à modéliser, à anticiper plus que sur l'outil informatique lui-même.

D'ailleurs les outils sont beaucoup plus dédiés à des statisticiens,  à des analystes, à des modélisateurs plutôt qu'à des informaticiens.
Des nouveaux métiers ont donc vu le jour autour de la prédiction, de la modélisation et le DBA reste, quant à lui, dans l'archivage et la protection de données. En outre, on peut y trouver des effets corolaires : c'est vrai qu'avec tous ces nouveaux métiers autour de l'analyse de données qui fournissent beaucoup d'informations en interne et les différents services d'une entreprise vont pouvoir désormais faire du reporting autour de leur propre activité, ce que l'on appelle du scoring d'activité.

 

Quelles sont les données qui intéressent les entreprises ?

 

Pourquoi est-ce si important que l'on traite ces forts volumes de données qui tournent autour d'elle.

 

On l'a vu, la collecte de données va bien au-delà de l'entreprise grâce notamment aux réseaux sociaux.

Si on prend l'exemple du marketing, il va se poser des questions sur ce que font et disent les clients sur les réseaux sociaux. Pour observer les comportements des clients, il faut bien évidemment être capable de capter énormément d'informations tels que des posts sur twitter, des informations sur Facebook, des publications sur Instagram etc, etc.. Que font nos clients sur nos propres sites? Là aussi c'est intéressant d'analyser tous les comportements, tous les types de visites que l'on a pu avoir pour détecter des profils, pour éventuellement abandonner certaines activités au profit d'autres. Et que dit-on de nos marques, on en revient à l'observation des réseaux sociaux mais cette fois ci un peu plus orienté sur notre propre société.

 

L'industrie va également s'intéresser à ces nouvelles données pour accélérer ses protocoles de tests, en collectant énormément de données issues de la réalité, on va pouvoir confronter un nouveau produit ou un nouveau logiciel à des situations réelles plus facilement. On va pouvoir fiabiliser également les productions grâce à des retours d'information sur les défauts rencontrés qui peuvent être plus nombreux notamment dans le cadre du développement logiciel. Et on va pouvoir piloter plus facilement les productions grâce à des retours d'informations issues de mécanismes de télémétrie, issues de capteurs que l'on peut diffuser sur une chaine de production mais que l'on peut également diffuser dans des contextes très très élargis.

 

Qui travaille sur nos données?

 

Puisque cela est devenu important pour l'entreprise d'avoir une idée claire sur ce qu'il se passe autour d'elle, différentes professions sont apparues  :

 

  • le data architect conçoit la solution informatique qui va soutenir le système de collecte et d'analyse de données.
  • L'analyste de données s'occupera de vérifier les données que l'on utilise en reporting, de nettoyer ces données et valider certaines tendances. Il reste dans l'analyse de ce qui s'est passé.
  • Le data scientist est là pour essayer de prévoir ce qu'il peut se passer. Il s'appuie sur les tendances de l'analyste et il va essayer de tirer, par des corrélations et par différentes observations des données, des modèles pour qu'en nourrissant ces modèles des anciennes données on puisse prévoir de futurs résultats.
  • Et puis, puisque l'architecte a mis en place une solution technique, il faut la maintenir, l'automatiser et c'est le rôle du Data Engineer.

 

Qui dit nouvelles professions dit formation de ses collaborateurs.

 

 

Concrètement on se forme sur quoi ?

 

Nous pouvons dans un premier temps nous concentrer sur les technologies du Cloud car celui-ci va apporter des capacités techniques très larges qu'on ne pouvait avoir en interne. Les formations sur les bases de données dans le Cloud comportent des particularités qu'il est important de maîtriser même si on utilise déjà des BDD comme SQL Server, Postgres ou bien Maria DB.

Et le Cloud a aussi amené la prise en charge de très forts volumes de données non structurées grâce à la mise en place de bases de données type NoSql : comme DynamoDb sous AWS,  CosmosDb sous Azure puis des projets plus open source comme MongoDb par exemple.

 

On peut former aux process big data, aux scripting Python R pour la modélisation par exemple et aux technologies d'intelligence artificielle, le machine learning qui consiste à faire apprendre par une solution logicielle des scénarios, et quand on a énormément de scénarios et bien, la machine apprendra encore mieux.

 

Enfin pour les utilisateurs finaux, on peut se focaliser sur du reporting et leur permettre d'avoir des tableaux de bord, des graphiques qui soient analysables et utilisables pour aider à la prise de décisions et/ou ajuster la stratégie. On formera alors sur des outils comme QlickView, tableau, Power BI.

 

On comprend mieux l'importance de l'analyse de données pour les entreprises.

 

Par contre, si elles ne sont pas volontaires dans le processus d'exploration de données, elles y seront de toute façon contraintes tant c'est vu par les actionnaires et les partenaires comme un outil de pilotage et de stratégie absolument indispensable : meilleure connaissance de ses clients et leurs parcours, nouvelles opportunités business et amélioration des performances opérationnelles.

 

Par ailleurs, les perspectives liées à la data démontrent bien que nous n'en sommes qu'au début de son développement, et que en plus d'une stratégie dédiée d'analyse et utilisation des données, une politique de formation adaptée est essentielle pour accompagner les changements de ce marché et maintenir les compétences de ses collaborateurs. 

Voir les éditeurs associés:
Voir les domaines associés:
Cookie Control toggle icon