Data Engineer - SQL / R (H/F) - EDF

92700 Colombes - 24/03/2023

  • 50000 - 70000 Euros

  • CDI

  • 1 - 2 ans


 

En bref : l'entreprise EDF recrute un(e) Data Engineer - SQL / R (H/F) en CDI à Colombes (code postal 92700). Le candidat idéal ? Expérience de 1 - 2 ans et des compétences en #Python # SQL # R # Postgre # Oracle # HDFS # Hive # Git # Confluence

Au sein de la DSIN, le Centre de Solutions et de Compétences DataScience & IA (CSC DS & IA), a pour mission de réaliser les travaux d'analyse et de valorisation des données de Commerce. Les collaborateurs du CSC DS & IA apportent ainsi leur expertise fonctionnelle et technique aux métiers du Marché d'Affaires et du Marché des Clients Particuliers pour répondre à des enjeux variés comme les départs à la concurrence, la conquête de nouveaux clients, la satisfaction client, la détection des fraudes ou encore la mise en place de services innovants. Pour cela, ils s'appuient sur un environnement technique riche et des bases de données conséquentes (~26 millions de clients, B2C+B2B).

Afin de répondre à ces besoins, le CSC DS & IA recrute un/une Data Engineer. Au sein d'une équipe de Data Engineer, et en appui d'une équipe de plus de 20 Data Scientists, votre mission consistera à :

- Mettre en place des pipelines de traitements de données avec des volumes importants de données (plusieurs dizaines de millions de lignes)
- Mettre en place des traitements de données distribuées (Spark …)
- Extraire massivement des données (Hadoop - Hive, Oracle - SQL, …) - vous-même ou en appui d'un Data Scientist
- Aider au debuggage des Data Scientists dans l'extraction de données (compréhension des problématiques Yarn, JVM, tablespace temp…)
- Accompagner les Data Scientists dans le maintien et l'évolution des outils de requêtage développés en interne (dnquery pour requeter Oracle et Hive) > extension à une nouvelle technologie de stockage des données (PostGre, SQL Server…)
- Accompagner les déploiements de modèles de Machine Learning
- Installer ou construire des outils permettant la fiabilisation et le suivi des chaînes récurrentes de type traitement de la donnée ; Accompagner les Data Scientists dans l'utilisation de ces outils
- Contribuer à la construction des stratégies de monitoring et d'industrialisation des livrables des Data Scientists
- Contribuer à l'évolution de l'environnement technique des Data Scientists

- Vous êtes titulaire d'un Bac +5 (Master, diplôme d'ingénieur) dans le domaine informatique, des mathématiques / statistiques, de la Data Science ou du Big Data
- Vous bénéficiez d'une expérience d'au moins 3 ans en tant que Data Engineer
- Vous avez déjà travaillé dans un contexte de Datascience et automatisé des traitements de type Datascience
- Vous maîtrisez les langages Python, SQL, R (en bonus) et les outils Docker, Airflow
- Connaissance de l'environnement Hadoop : HDFS, Hive, Spark
- Vous avez déjà manipulé des données stockées sous S3
- Vous êtes à l'aise avec les outils collaboratifs de développement (Git, Confluence, ...)
- Une connaissance de GitlabCI est un plus
- Vous bénéficiez d'une ou plusieurs expériences de travail en mode Agile
- Vous êtes curieux et les projets innovants vous passionnent
- Vous êtes force de proposition et proactif
- Vous aimez transmettre et travailler en équipe

Méthodologie de travail :

Vous collaborerez étroitement avec les Référents Techniques, Run et DevSecOps du CSC DS & IA, ainsi qu'avec l'équipe en charge des lacs de données au sein de la DSIN.
A ce titre, vous participerez fortement au collectif afin de diffuser les bonnes pratiques (Python, Spark…).
Le poste est situé à Colombes, proche de La Défense Ouest, avec une possibilité de télétravail partiel.

Rémunération :

Fourchette estimative : entre 50k et 57k€, la rémunération sera proposée selon vos compétences, vos expériences acquises et vos diplômes.

L'étude de rémunération sera effectuée en adéquation avec le marché de l'emploi actuel. Par ailleurs, des primes variables sur les résultats, intéressement, épargne salariale sont mises en place.

Cette mission est un moyen idéal d'accroître votre valeur professionnelle, vos compétences et de progresser vers d'autres directions du Groupe. Alors n'hésitez pas, rejoignez-nous, ce poste est fait pour vous !

Dans le groupe EDF accueillir des personnes en situation de handicap fait partie de notre ADN. Notre objectif est d'ouvrir nos portes à toutes les compétences, toutes les énergies et toutes les personnalités sans exclusion.

Le poste proposé est donc ouvert à toutes et à tous.

#Python # SQL # R # Postgre # Oracle # HDFS # Hive # Git # Confluence

Cette offre est expirée. Voir d'autres offres