Home Liste de tous les métiersData scientist : un analyste du Big Data
Data scientist : un analyste du Big Data

Data scientist : un analyste du Big Data

Le data scientist est un professionel capable de manipuler et de comprendre un grand volume de données complexe trouvées dans le Big Data. Ce mathématicien est expert en calcul statistiques. Il donne du sens aux données et accompagne les sociétés dans des problématiques liées aux mégadonnées . Voyons tout de suite la fiche de poste du data scientist.

La data science : ce nouveau terrain de jeu des professionnels

Les mégadonnées ont provoquées un vrai changement dans le pilotage des entreprises et dans la manière dont nous percevons le web en général. En effet, le volume de données d’Internet ne cesse de grossir d’années en années (seulement 0,5% de ce volume est analysé) et la tendance nous indique que ce n’est pas prêt de s’arrêter.

Data science – définition

La data science ou science des données est née de la méthode scientifique. Elle représente l’évolution logique de la simple “analyse de données” mais orientée avec une problématique centrée autour du Big Data. L’ensemble de ces méthodologies permettront de traiter des questions complexes qui demandent de traiter un grand volume de données.

La data science peut aider à traiter des questions vastes. Elle peut s’appliquer à de nombreux domaines comme la médecine(recherche microbienne ou lutte contre les maladies graves) ou des questions  plus pragmatiques comme la mise en place de services marketing pour aider les entreprises. C’est un champ de recherche pharaonique qui demande beaucoup de patience et de compétences.

Data Scientist Missions
Quelle est la fiche de poste du data scientist ? source : pixabay

Les trois V du Big Data

L’environnement lié au big data disposent de caractéristiques particulières. Cet écosystème représente le terrain de jeu du data scientist :

  • Volume de données  : les données sont énormes et grandissent chaque jour davantage.
  • Variété de données : au rythme de leur croissance, les données de diversifient.
  • Vitesse de l’exploitation des données : les données vont toujours plus vite et il convient de réagit rapidement et efficacement à ce nouvel enjeu crucial pour les entreprisesF.

Un quatrième V existe et désigne le mot “véracité”. En effet, l’extension d’Internet amène aussi son lot de fake news et le data sciencist doit prendre en compte ce facteur important pour ne pas rendre des analyses infondées.

Nous sommes tous des acteurs du Big Data

Ces données sont produites par tout le monde : entreprises et particuliers; Elles cohabitent dans un vaste océan d’octets et se croisent en permanence. Elles proviennent de sources multiples (réseaux sociaux, capteurs, téléphones mobiles, cliques sur le web, transactions, deep web etc.) et dans de multiples formats (images, documents, données structurées ou non structurées etc.).

La donnée est donc devenue une matière à part entière pour les artistes et les statisticiens. Il suffit de voir l’engouement pour les expositions comme 123data à la fondation EDF pour s’en convaincre.

Le data scientist : cet expert qui donne du sens aux données

Nous l’avons compris, cs mégadonnées représentent aussi une occasion inédites pour les entreprises d’optimiser leur processus décisionnel. En effet, les choix son devenus “data driven” c’est à dire : piloter par les données. Ce changement de paradigme influence énormément la vie des entreprises.

Les data scientist apparaissent dans ce contexte et tentent de donner du sens aux données. Cependant, les caractéristiques intrinsèques de ces données ne leur facilitent pas la tâche. Les processus de manipulation sont longs et demandent de vraies compétences d’analyse connexes.

A lire aussi : les métiers du web qui ont la côte

Compétences du data Scientist

Le métier de data Scientist demande un certain nombre de compétences difficiles à réunir chez un seul candidat.

Le data scientist est avant tout technicien

Voici quelques compétences techniques qu’un data scientist doit avoir. Ce métier évoluant à 100 à l’heure, je ne vous en offre qu’un bref aperçu qui vous aidera à rédiger une fiche de poste pour data scientist.

  • Stockage et acquisition de données : stocker et exploiter les informations de manière structurée dans une base de données relationnelle.
  • Analyse de données et apprentissage automatique avec R et SQL : le Data Scientist doit comprendre la programmation R et le langage SQL, qui sont les deux outils les plus utilisés par les experts en Big Data. Ils permettent de résoudre des problèmes d’analyse de données à petite ou moyenne échelle. En outre, la manipulation de la syntaxe SQL est indispensable pour la préparation et l’analyse de base des données. La gestion des bibliothèques R permettra la construction de modèles d’apprentissage supervisé et non supervisé, ainsi que les bibliothèques les plus courantes pour les “disputes de données” avec le langage R.
  • Machine Learning :  un Data Scientist doit être capable d’appliquer les techniques d’apprentissage automatique avec R.

 

Une grande capacité à envisager les problématiques commerciales

Il doit pouvoir aborder une problématique d’exploitation de données , sans perdre de vue les besoins du projet pour lequel il travaille. La finalité du projet est donc très importante et doit être prise en compte dans la mission du data scientist.

Le data scientist doit être un statisticien capable de prendre en compte les contraintes de gestion inhérentes à chaque projet (confidentialité des données, rentabilité du projet, choix politique dans la mise en place de l’algorithme d’analyse…). Cela lui demandera une grande capacité d’adaptation et une forte motivation pour travailler en équipe.

Le data scientist est pédagogue.

Il doit pouvoir préparer ses analyses statistiques et les mettre en forme pour les expliquer aux instances dirigeantes (CEO) de l’organisation au sein de laquelle il évolue. Il lui faudra faire preuve d’une grande pédagogie pour se faire entendre.

Métier de data scientist
Data scientist métier [crédit photo : pexels]

Missions d’un data scientist

Le quotidien d’un data scientist ne repose pas seulement sur l’extraction de données, mais aussi sur le fait de savoir comment les valoriser. C’est pourquoi il procède généralement par cycle de travail

  • Extraction des données indépendamment de la source ou du volume.
  • Nettoyage des données.
  • Traiter les données à l’aide de méthodes statistiques.
  • Remaniement des données, si nécessaire.

Quel diplôme pour devenir data scientist ?

Au minimum diplômé de Master 2 voir plutôt d’un doctorat, ce spécialiste n’aura aucun mal à naviguer à travers des données complexes pour les présenter sous un format plus clair qui permettront d’obtenir des réponses de pilotage pour l’entreprise.

Les écoles de formations aux data sciences sont nombreuses. En voici quelques unes.

    • HETIC : Mastère Data & Stratégie Digitale approche scientifique de la data appliquée au web
    • ESIA :École d’ingénieurs du monde numérique, l’ESIEA forme des ingénieurs généralistes des Sciences et Technologies du Numérique sur deux campus à Paris
    • ENSAI : A deux pas de Rennes, l’ENSAI forme des statisticiens professionnels capables de donner du sens aux données

1 thought on “Data scientist : un analyste du Big Data

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *