Cadors des mathématiques, caïds de l’informatique : une nouvelle espèce jonglant avec aisance entre concepts mathématiques, outils d’analyse et vision stratégique de valorisation de la donnée est née. Le data scientist transforme des données en informations utiles pour les décideurs. Par Ariane Despierres-Féry

Les écoles d’ingénieurs pionnières

Centrale Lille a ouvert dès 2012 une option Décision & Analyse de Données (DAD) pour son cursus ingénieur, dirigée par Pierre Chainais. De son côté, Télécom ParisTech forme en 2017 la 4e promotion de son Mastère Spécialisé Big Data. Une formation créée par des enseignants-chercheurs à la pointe dans leur discipline mais aussi « des besoins des entreprises au travers de notre recherche collaborative » explique son directeur, Stéphan Clémençon.

Stephan Clémencon - TPT

Stephan Clémencon – TPT

Des formations évolutives

Le Big Data est un domaine en effervescence mais ses concours restent encore flous. Centrale Lille ajuste ainsi sa maquette pédagogique chaque année. Et comme Télécom ParisTech, elle fait intervenir des enseignants, des chercheurs et des professionnels dans ses cours. « Il est important de transmettre une vision et des pratiques opérationnelles », confirme Stéphan Clémençon.

 

Une double compétence de haut niveau

La maîtrise du Big Data est sous-tendue par deux compétences complémentaires et indissociables. Elles caractérisent le profil des maîtres de la donnée : des forts en math à l’aise avec l’informatique et la programmation. « Le dénominateur commun de nos étudiants est qu’ils n’ont pas peur des maths ! » confirme Léo Souquet, DG relations extérieures de Data ScienceTech Institute (DSTI).

DSTI - Paris 2

DSTI – Paris 2

Pour Morgan Saveuse, directeur des études du CESI, le Big Data « est du ressort de bac+5 au minimum. Les concepts mathématiques sont de haut niveau comme les statistiques, la théorie des ensembles, le raisonnement récursif. Les data scientists traitent de problèmes complexes ».

« La partie analytique repose sur les mathématiques, le machine learning, l’intelligence artificielle, les méthodes d’exploitation des données », ajoute Stéphan Clémençon. Les méthodes mathématiques s’appliquent aussi pour la visualisation des données et l’interaction homme/machine.

 

Geek sur les bords

Les techniques d’analyse de données, défi de la gestion de volumes très importants, relèvent de compétences informatiques : définir les requêtes dans la base de données, exploiter les fonctions existantes du logiciel, maîtrise de l’environnement de programmation, collaboration avec les informaticiens, gestion de projet.

« Le data scientist collecte et trie les données, nettoie l’environnement, développe des modèles, lance des algorithmes pour en tirer de la valeur en fin de chaîne » décrit Léo Souquet. Pour DSTI la data science est un métier de sur-spécialisation, une sur-couche sur de solides compétences en sciences, mathématiques et informatique.

DSTI - Léo Souquet - DG relations extérieures

DSTI – Léo Souquet – DG relations extérieures

 

Une vision stratégique et proche des métiers

Le Big Data est néanmoins un domaine interdisciplinaire. Créer de la valeur à partir de données suppose de travailler avec les métiers de l’entreprise, en mode projet, de comprendre leurs enjeux au-delà de la technique. « L’objectif de l’acquisition, du traitement (structuration) et de l’analyse des données, puis de sa traduction en une information exploitable par de non-experts, est de bien souvent de créer de nouveaux services » rappelle Stéphan Clémençon.

L’analyse des données est aussi un outil d’aide à la décision, de prédiction, d’analyse prévisionnelle. Le data scientist sait ainsi exploiter les données, les rendre intelligibles et les mettre en perspective. Il marie compétences scientifiques de haut niveau, solides qualités humaines et intellectuelles, d’analyse et stratégiques.

« Le data scientist est formé à comprendre l’environnement professionnel qui génère le Big Data afin de répondre aux besoins des métiers et décideurs utilisateurs de ses analyses », souligne Pierre Chainais. Il aborde aussi les problématiques de plus en plus cruciales liées aux aspects juridiques, éthiques et économiques de la collecte et l’utilisation de données.

 

Data analyst ou data scientist ?

Pierre Chainais qualifie les ingénieurs diplômés de son option de data analysts ou data scientists, mais pas de data engineers (plus proches de la donnée brute, ils gèrent son stockage, garantissent sa pérennité, assurent l’interface entre le data scientist et le projet industriel). « Nous formons des ingénieurs en sciences de la donnée. Ils transforment des données en informations utiles pour les décideurs ». « Le data scientist traduit un volume massif de données pour le rendre utilisable et valorisable par les autres métiers de l’entreprise » ajoute Morgan Saveuse.

Morgan Saveuse - CESI

Morgan Saveuse – CESI

Les diplômés du MS de Télécom ParisTech exercent une panoplie de métiers : consultants, architectes de base de données, data scientists, chief data officer, chef de projet…

 

La double approche manager/ingénieur du data analyst

Le CESI et Skema Business School viennent de signer un accord de double diplôme qui préparera notamment des data analysts intégrant une double vision du métier. « Nous apportons la dimension technique, informatique, ingénierie, création d’outils ;  et Skema la dimension business, management, usages des données et internationale, précise Isabelle Caradot, directrice des études du CESI en charge de ce partenariat. Nos diplômés développeront une double approche et des méthodes complémentaires qui leur permettront de proposer des systèmes répondant au mieux aux besoins des différents métiers ».

 

Isabelle Caradot - CESI

Isabelle Caradot – CESI

 

Data manager

 

Un autre professionnel est un maître de la donnée : le data manager. « Son profil est mixte : orienté informatique et doté d’une vision stratégique, décrit Morgan Saveuse. Il traite la donnée de son entrée dans l’entreprise jusqu’à sa sortie, fort de sa capacité à en considérer les cheminements ». La collecte de données n’est pas une fin en soi, mais le point de départ d’analyses et d’actions stratégiques. Le data manager s’assure de la cohérence du processus de data management à travers les services de l’entreprise.

 

Vers une normalisation des métiers

 « Aujourd’hui les entreprises recrutent des data scientists généralistes au sens où ils maîtrisent et ont une vision de l’ensemble des maillons de la chaîne de la valorisation des données, précise Léo Souquet. A mesure que le métier se normalisera, les entreprises rechercheront des spécialistes de l’un de ces maillons : collecte, stockage, analyse, utilisation, programmation, création des outils, etc. »

Demain nous trouverons des data architects en charge de l’architecture, du stockage des données et de leur intégration ; des data stewards garants de la gestion des flux de données et du respect de l’éthique et du droit ; des experts en visualisation des données pour imaginer et designer les outils, programmer les bibliothèques graphiques.

 

Faire appel à des data scientists n’est plus une question

Hier très recherchés dans les secteurs traditionnellement producteurs et consommateurs de données comme la banque, l’assurance et l’énergie ; les maîtres de la donnée sont désormais courtisés de toutes parts. Grande distribution, transports, logistique, santé, télécoms, défense, services en ligne, e-commerce, retail, bâtiment, agriculture, environnement, aucun secteur ne peut plus s’en passer.

 

« Toutes les entreprises sont intéressées par la possibilité d’améliorer leurs services et produits, de proposer une offre de pointe grâce à l’analyse des données semées par leurs clients ou prospects ! » conclut Pierre Chainais.