Data Scientiste (F/H) - EDF

75000 Île-de-France - 30/06/2023

  • Selon profil

  • CDI

  • Débutant


 

En bref : l'entreprise EDF recrute un(e) Data Scientiste (F/H) en CDI à Île-de-France (code postal 75000). Le candidat idéal ? Expérience de Débutant et des compétences en #Data # GitHub

Au sein de la DSI Groupe, l'Usine Data Analytics pour la Production a en charge la valorisation des données métiers des différents producteurs et ingénieries des parcs nucléaire, thermique, hydraulique et renouvelable du Groupe EDF par des méthodes de data science.

Le rôle du Data Scientiste au sein de cette unité est de mettre en place la solution d'analyse la plus appropriée (Machine Learning, Text Mining, Process Mining…) pour répondre aux besoins des exploitants et des ingénieries.

Ces besoins couvrent les champs de la maintenance prédictive, de l'optimisation des planning d'exploitation, de la maîtrise de l'efficacité de la production, de la gestion optimale des ressources matérielles et humaine, de la gestion des chantiers et travaux, du traitement des évolutions du parc, actuel et futur, Nucléaire, Thermique, Hydraulique et Renouvelables.

Au sein de l'Usine Data Analytics pour la Production, le Data Scientiste aura pour principale mission :

• l'accompagnement des métiers de la production pour l'expression de leurs besoins;

• la mise en place opérationnelle de la solution sur une infrastructure du type BigData (plateforme Hadoop on premise ou utilisation du cloud en fonction des clients) avec l'aide des Data Engineer.

• Aider le Data Analyste sur l'interprétation des résultats.

• Valoriser les résultats obtenus auprès des producteurs et ingénieries

• Le partage des bonnes pratiques de Data Science au sein du collectif (équipe d'une 30aine de personnes) et au sein de l'écosystème Data Science du Groupe EDF.

Profil Bac +5 orienté mathématiques appliquées et statistiques

Compétences Data Science :

• Maîtrise de l'environnement et de la programmation Python, R

• Maîtrise des principes de data visualisation et outils associés (Dash, Tableau Software, PowerBI).

• Expérience de méthodes de modélisation, (analyses factorielles, typologies, arbres de décision, modélisations prédictives, séries temporelles, forêts aléatoires, gradient boosting, réseaux de neurones, réseaux bayésiens …)

• Compétences en Machine Learning (classification et régression, clustering, surapprentissage, régularisation, deep learning etc.), Traitement Automatique du langage, Text Mining, Traitement d'images…

• Maitrise des méthodes de développement (versionning avec GitHub, ….)

• Connaissance des éléments d'une stack d'analyse de données massives ou en temps réel : Hbase, Hive, Spark, Elastic Search, …. Softskill :

• Innovation et créativité : être force de proposition pour faire évoluer les modes de fonctionnement, mais aussi rechercher les opportunités de développement de l'activité de l'Usine DAP (aussi bien à l'interne qu'à l'externe)

• Rigueur et capacité de synthèse : savoir organiser et structurer les informations, les présenter clairement et bonne capacité de synthèse.

• Curiosité : s'investir dans une mission et en comprendre tous les tenants et aboutissants en étant à l'écoute des besoins.

• Autonomie, sens du service et de la relation client, aisance à l'oral, bon relationnel et bonnes capacités rédactionnelles.

• Capacité à faire évoluer et partager ses connaissances, à travailler en équipe

Des connaissances ou compétences dans le domaine de la production et l'ingénierie (nucléaire, hydraulique, éolien) seraient un plus.

Mail : ********************

#Data # GitHub

Cette offre est expirée. Voir d'autres offres