Data Scientist (H/F) - EDF

92800 Puteaux - 07/07/2022

  • Selon profil

  • CDI

  • 1 - 2 ans


 

En bref : l'entreprise EDF recrute un(e) Data Scientist (H/F) en CDI à Puteaux (code postal 92800). Le candidat idéal ? Expérience de 1 - 2 ans et des compétences en #Data # R # PYTHON

CONTEXTE :

Créée en 2018, au sein de la Direction des Systèmes d'Information du Groupe EDF, l'Usine Data Analytics pour la Production (Usine DAP) utilise la Data Science et l'Intelligence Artificielle (Machine Learning, NLP, …) pour répondre aux différentes problématiques rencontrées par les exploitants et les ingénieries de l'ensemble des entités du Groupe EDF en charge de la production d'électricité (nucléaire, thermique, hydraulique, solaire et éolien).

Maintenance prédictive, optimisation des plannings et des activités d'exploitation et de maintenance, amélioration de la préparation et de l'efficacité des opérations de maintenance et d'exploitation, amélioration de la performance de la production, optimisation des ressources matérielles, … sont autant de domaines sur lesquels l'Usine DAP est ainsi amenée à travailler.

Pour mener à bien ses missions, l'Usine DAP, composée d'une 30aine de personnes, mêlant Data Scientists et Data Analystes issus des métiers de la production, exploite tous types de données : séries temporelles (issues de la collecte de données sur plus de 20 ans d'exploitation), données textuelles (rapports d'intervention, spécifications techniques, procédures d'exploitation, déclaration d'incidents, …), images/vidéo (examens télévisuels, …)

Chaque problématique métier est traitée sous forme d'un projet réalisé en mode agile par une équipe constituée pour l'occasion.

MISSION :

Au sein de l'Usine Data Analytics Production, le Data Scientist aura pour principale mission :

* L'accompagnement des métiers de la production pour réaliser l'expression de leurs besoins,

* L'identification, la définition et la mise en œuvre de la méthode d'analyse la plus appropriée (Machine Learning, Text Mining, Process Mining, modélisation statistique, …) pour répondre à la problématique. Il s'appuie sur le Data Analyst pour interpréter les résultats et réorienter l'analyse le cas échéant. Il échange régulièrement avec les interlocuteurs métiers pour présenter les résultats et valider les solutions proposées.

* La mise en place opérationnelle de la solution retenue sur une infrastructure du type BigData (plateforme Hadoop on premise ou utilisation du cloud en fonction des clients) avec l'aide des Data Engineer.

* La valorisation des résultats obtenus auprès des utilisateurs métiers et des autres producteurs

* Le partage des bonnes pratiques de Data Science au sein du collectif de l'Usine DAP

Formation scientifique Bac+5 (école d'ingénieur, master) avec une spécialisation en statistiques, machine learning ou plus généralement en mathématiques appliquées

Compétences DataScience :

* Maîtrise de l'environnement et de la programmation Python et R

* Maîtrise des principes de data visualisation et d'outils associés (Dash, Shiny, Tableau Software, PowerBI).

* Expérience de méthodes de modélisation, (analyses factorielles, typologies, arbres de décision, modélisations prédictives, séries temporelles, forêts aléatoires, gradient boosting, réseaux de neurones, réseaux bayésiens …)

* Compétences en Machine Learning (classification et régression, clustering, surapprentissage, régularisation, deep learning etc.), Traitement Automatique du langage, Text Mining, …

* Maitrise des méthodes de développement (Versionning avec GitHub, ….)

* Connaissance des éléments d'une stack d'analyse de données massives ou en temps réel : Hbase, Hive, Spark, Elastic Search, ….

Softskill :

* Rigueur : organiser les données et s'assurer que tout soit clair en étant synthétique.
* Curiosité : s'investir dans une mission et en comprendre tous les tenants et aboutissants en étant à l'écoute des besoins.
* Autonomie, sens du service et de la relation client, aisance à l'oral, bon relationnel et bonnes capacités rédactionnelles et de synthèse.
* Capacité à faire évoluer et partager ses connaissances, à travailler avec les autres Data Scientists

#Data # R # PYTHON

Cette offre est expirée. Voir d'autres offres