LEAD DATA ENGINEER (H/F)

  • CDI 
  • La Plaine Saint Denis
  • Partager sur Facebook
  • Partager sur Twitter
  • Partager sur Linkedin
Itnovem

Itnovem

LEAD DATA ENGINEER (H/F)

  • CDI 
  • La Plaine Saint Denis
  • Bac +5 / Master
  • > 7 ans

À propos

Filiale technologique du groupe SNCF, intégrée à la Direction du Digital et des Systèmes d’information, Itnovem. se positionne comme expert de l’Internet Industriel. Porteuse de grands projets de la révolution digitale, notre société est en constante recherche de profils pour rejoindre la grande aventure de l’Internet des objets, de la data science et de l’accompagnement des projets digitaux. Qu’il s’agisse de maintenance prédictive, d’aide à la décision sur la maintenance des infrastructures, de gare 4.0, d’usine du futur, ou de sécurisation des assets, nos équipes font valoir à la fois une expérience métier et une expertise technique sans cesse renouvelée, dans le respect des valeurs du groupe : Excellence, Innovation, Collectif, Agile, Engagement.

Itnovem
Itnovem
Itnovem
Itnovem
Itnovem

Descriptif du poste

LE POSTE Au sein du pôle Data Science et Engineering (DSE), notre lead data engineer (H/F) interviendra pour les projets de la Direction du Digital SNCF au sein de la Fab Big Data. Structure transverse qui réunit infrastructures Big Data et expertise Big Data pour l'ensemble du groupe, la Fab s'est constituée en juillet 2015 afin de traiter avec les différentes entités les projets nécessitant des moyens Big Data pour être menés à bien. Elle se compose de 5 pôles : Pilotage et valorisation projets, Data Science et Engineering, Usine IT, pôle Data (Gouvernance et Services Data), pôle transverse Data IoT.

Itnovem. recherche aujourd’hui un(e) lead data engineer (H/F) pour travailler au sein du pôle DSE de la Fab Big Data. Le pôle, en pleine croissance, comprend environ 25 personnes (40% data scientists, 60% data engineers).

Vous travaillerez sur des thématiques très variées liées aux problématiques industrielles, opérationnelles et stratégiques des métiers du groupe SNCF, comme par exemple :
• La maintenance du matériel roulant et l’optimisation des process ;
• La maintenance et la surveillance du réseau (voies, abords et caténaires) et des cartographies déclinées sur les problématiques prioritaires ;
• L’analyse du langage naturel, notamment sur des enquêtes et rapports techniques notamment autour de la sécurité ferroviaire ;
• L’optimisation des plans horaires, la prévision de perturbations, la gestion de la consommation énergétique ;
• L'information voyageurs ;
• L’analyse des données IoT…

Actuellement, le pôle mène une douzaine de projets de front de type et de taille variable : accompagnement data science, prototypage, industrialisation, run de projets en production. La majorité des projets où les data engineers interviennent sont des projets agiles d'industrialisation avec des équipes de 3 à 6 personnes, et d'une durée allant de 6 à 9 mois.

MISSIONS

Missions transverses

• Piloter et développer l'équipe data engineers, avec une passion pour les défis à grande échelle et les nouvelles technologies.
• Veiller à la capitalisation et au partage de connaissances au sein du pôle DSE (documentation, production d'assets réutilisables, templatisation, etc.).
• Promouvoir une culture d'ingénierie forte et la passion pour la qualité du delivery.
• Participer comme expert à la démarche de conseil technologique et scientifique du pôle d’expertise DSE auprès des métiers du groupe SNCF.
• Contribuer au recrutement de nouveaux talents.
• Contribuer proactivement à la veille technique, aux projets R&D, et à la construction d’assets et de services techniques orientés data.
• Participer à l’animation de la filière Data et à l’implémentation des pratiques Data au sein des métiers (formations, conseil et expertise).
• Participer aux autres activités du pôle Data Science & Engineering (reporting d’activité, communication interne et externe, collaboration avec les universités et laboratoires associés).

Missions projets

• En mode projet, jouer un rôle de lead data engineer pour des équipes mixtes de data engineers, data scienstists, ops et architectes.
• Industrialiser des projets liés aux problématiques et enjeux DATA en développant une chaîne de traitement de données robuste et automatisée.

  • Spécifications techniques
  • Release plan des différents livrables
  • Ingestion et mise en qualité des données selon les bonnes pratiques de la FAB
  • Traitement, agrégation et sauvegarde des données
  • Intégration continue (versioning, packaging, tests et déploiement)
  • Exposition des APIs sous forme de webservices Rest
  • Configuration des briques logicielles
  • Monitoring des briques logicielles
  • Etroite collaboration avec le chef de projet, PO, OPS et architectes
  • Participation aux activités d'architecture, conception et développement
  • Veille à la bonne documentation des projets
    • Etre vigilant à maintenir les politiques de sécurité : Protection des données (ACL, chiffrement in motion/at rest), identification des utilisateurs, gestion des autorisations, pistes d’audit.
    • Rédiger du code de haute qualité et maintenable, et améliorer les performances de notre environnement de développement.
    • Apporter du support aux OPS dans la résolution des incidents. Troubleshooting et tuning de la plateforme sur l’ensemble de la stack technologique.

Profil recherché

COMPETENCES TECHNIQUES

Compétences techniques exigées

• Langages Scala/Java
• Ecosystème Hadoop (Yarn, MR, HDFS, oozie, Spark, Hive/beeline, Hbase…)
• Un ou plusieurs outils d’ingestion des données : Flume, logstash, fluentd…
• Une ou plusieurs bases de données NoSql : Cassandra, mongoDB…
• Un ou plusieurs SGBR : MySQL, SQL Server, Oracle…
• IC/DC (Jenkins, Git, Nexus, Maven/Sbt, Ansible, Docker, Rundeck, Data factory…)
• Implémenter et maintenir la stratégie de sécurité : Protection des données (ACL, chiffrement in motion / at rest), identification des utilisateurs (Kerberos), gestion des autorisations (Ranger), piste d’audit...
• Elasticsearch et Kibana
• Data API : REST web services, messaging (Kafka)…
• Architectures microservices
• Cycle de vie des données (DLC & ILC)
• Agilité Scrum

Compétences techniques appréciées

• Concepts et technologies de gestion de la sécurité : Kerberos, ACL, Sentry/ranger, CyberArk…
• Composants Azure : HDInsight, Azure Databricks, Azure Function, OMS, etc.
• Architectures lambda et kappa
• Gouvernance des données, notamment personnelles (Traçabilité, Sécurité, Audit)
• Python

QUALITES PERSONNELLES ET COMPETENCES FONCTIONNELLES

• Autonomie
• Curiosité
• Rigueur et organisation
• Très bon relationnel
• Bonnes capacités de communication orale et écrite
• Leadership et capacités à dynamiser et former l’équipe data engineers du pôle DSE
• Force de conviction et capacité d’impact
• Proactivité et dynamisme
• Orienté satisfaction client et business

EXPERIENCES ET FORMATIONS

Formation

Bac +5 (école d’ingénieur ou master spécialisé en data engineering) ou titulaire d’un doctorat en informatique/data engineering

Expérience requise Vous aimez relever des défis ? Vous aimez travailler en équipe dans la bonne humeur avec une culture de l'excellence ? Vous voulez que votre travail ait un impact fort et vous vous intéressez à des problématiques industrielles ? Ce poste est donc fait pour vous.

Vous avez acquis au moins 7 ans d’expériences dans les nouvelles technologies, dont 3 ans dans le Big data. Vous avez déjà piloté des équipes sur l'industrialisation de projets data.

Poste basé à La Plaine Saint Denis (RER D, Saint Denis Stade de France) avec des déplacements ponctuels (en moyenne 2-3 fois par mois) à prévoir, généralement en Ile-de-France.

Découvrez l'équipe de Itnovem