Le métier de data scientist a émergé suite à la prise de conscience du potentiel que représentent les données massives (big data). Son rôle est de trier, d’analyser et de donner une interprétation à la data des organisations. Il s’agit du profil le plus transversal de tous les métiers liés à la data. Le scientifique de la data structure les mégadonnées pour en faire des prévisions. Son rôle a donc une incidence majeure sur la stratégie des entreprises. Cette fiche métier reprend les grandes lignes de la profession : missions, compétences, qualités, parcours d’études, rémunération et perspectives d’évolution.
Les intitulés du poste
Le data scientist peut être nommé différemment selon les organisations et les pays :
- Data miner
- Chief data scientist
- Analyste des données
- Analyste en science des données
- Statisticien des données
- Statisticien de la data
- Ingénieur-analyste la data
- Spécialiste de la data
Définition de la data : On nomme « big data » toutes les données numériques (internes et externes) de l’entreprise récupérées par les sites web, les réseaux sociaux, les logiciels, les applications… La data compte des informations écrites mais aussi des vidéos et des images. C’est une mine de renseignements pour les entreprises.
Différence entre le business data analyst et le data scientist : Le business data analyst travaille les données en fonction d’une question précise, alors que le scientifique de la data analyse les données pour faire émerger des questions et des pistes de réflexion. En résumé, le premier sait ce qu’il cherche, le deuxième trouve ce qu’il faut chercher. Dans certaines entreprises, certains professionnels occupent les 2 fonctions.
Description de la mission et de la fonction de data miner
Le scientifique de la data peut être embauché par une entreprise indépendante, une institution, une société qui propose des services liés au traitement des données, un cabinet de conseils spécialisé, une SSII, etc.
Le data miner choisit les algorithmes de tri et d’interprétation qui lui seront utiles, ainsi que les solutions de stockage des données (data warehouse). Son rôle est de faire parler la data pour qu’elle révèle des questions à traiter ou des pistes à explorer. Le spécialiste de la donnée observe, organise, catégorise, élabore des statistiques pour identifier des sujets importants, voire des problématiques. Ses compétences analytiques sont essentielles au métier. Par ses conclusions, il éclaire le pouvoir décisionnel des dirigeants.
Il cherche dans les données massives à faire émerger des questions et à donner des indications qui peuvent concerner tous les services de l’entreprise (RH, marketing, finance, commercial, etc.). Les informations révélées peuvent aussi bien concerner l’organisation interne que le développement (externe).
Le data miner peut travailler seul ou en équipe. Quoiqu’il en soit, il collabore avec d’autres spécialistes, comme les data engineers qui sont chargés de récolter et de nettoyer la data en amont. Il œuvre généralement sous le management d’un chef de projet data et du directeur des systèmes d'information (DSI). Il fait part de ses conclusions aux interlocuteurs concernés. Il est donc souvent en contact avec différents membres de l’entreprise : les autres experts des services technologiques ainsi que les dirigeants et managers.
Son travail est utile aux entreprises et aux industries de tous les domaines d'activité.
Les missions du statisticien de la data :
-
Recueil et extraction des donnéesselon leur pertinence ;
-
Traitement, exploitation et intégration des donnéesdans un data warehouse (entrepôt de données) ;
-
Élaboration de statistiques, d’analyses, de prédictions, de recommandations (livrables aux décideurs concernés) ;
-
Création de tableaux de bord (avec KPI) + bilan des performances pour donner une vision compréhensible des résultats aux différents interlocuteurs ;
-
Création de procédures et d’automatisations ;
-
Veille technologiquesur le sujet de l’analyse des données ;
-
Formation continue dans le domaine.
Le big data est une ressource immense, représentant un énorme potentiel. L’expertise du data scientist permet de transformer les données en informations précieuses et en questionnements porteurs de sens pour les organisations et la société en général.