Site Reliability Engineer (SRE) F-M-X

Resumen del puesto
Indefinido
Toulouse
Salario: 45K a 60K €
Fecha de inicio: 02 de junio de 2024
Unos días en casa
Experiencia: > 3 años
Formación: Licenciatura / Máster
Competencias y conocimientos
Conocimiento de los protocolos de seguridad
Seguridad en la nube
Derecho laboral
Capacidad de comunicación
Herramientas de automatización
+15

Intent Technologies
Intent Technologies

¿Te interesa esta oferta?

jobs.faq.title

El puesto

Descripción del puesto

Nous ouvrons un poste de Site Reliability Engineer (SRE), en charge de garantir la fiabilité, la disponibilité et la performance de notre plateforme SaaS.

Missions principales

  • Collaborer avec les équipes de développement et d’exploitation pour concevoir et mettre en œuvre des solutions cloud sur notre infrastructure technique (AWS, Kubernetes, MongoDB, Kafka, NodeJS).

  • Maintenir l’infrastructure en utilisant des outils de gestion de configuration et d’automatisation.

  • Assurer l’observabilité des systèmes et la prévention des incidents de production.

  • Résoudre les incidents et gérer les problèmes en collaboration avec les équipes concernées.

  • Produire les KPIs de performance (SLOs)

  • Garantir la sécurité du cloud (posture de sécurité, gestion des vulnérabilités, détection et mitigation des menaces)

  • Gérer les plans de continuité d’activité (PCA) et de reprise d’activité (PRA)

  • Maîtriser les coûts d’exploitation.

  • Promouvoir la culture de l’ingénierie de la fiabilité.

Stack technique

  • Cloud : AWS, OVHCloud

  • Backend : NodeJS, Express, Kafka

  • Storage : MongoDB, S3, Algolia

  • Deployment : Kubernetes, Docker

  • Automation : Ansible, Helm, Terraform

  • Mesh : Istio

  • Monitoring : Datadog, Sentry

Conditions de travail

  • Poste à temps plein.

  • Télétravail partiel (jusqu’à 3 jours par semaine)

  • Horaires flexibles avec possibilité de participer à des astreintes.

  • Bureaux modernes au centre-ville de Toulouse (Village by CA 31), à proximité immédiate de tous les commerces et des transports en communs (métro, bus, tramway)


Requisitos

  • Maîtrise des systèmes d’exploitation (Linux), des technologies de conteneurisation (Docker, Kubernetes) et des plateformes cloud (AWS).

  • Connaissance des langages de script (Python, Bash, PowerShell) et des outils d’automatisation (Ansible, Terraform, Helm).

  • Expérience avec les outils de surveillance et de gestion des logs (ELK, Datadog), et connaissance des stratégies de prévention des incidents de production et de détection précoce.

  • Connaissance des stratégies de continuité et de reprise d’activité (PCA/PRA)

  • Connaissance des politiques et des procédures de sécurité cloud.

  • Capacité à travailler en équipe et à communiquer efficacement.

  • Esprit d’initiative et capacité à résoudre des problèmes complexes.

  • Diplôme en informatique, ingénierie ou domaine connexe, 3 à 5 ans d’expérience professionnelle dans un rôle similaire.

  • Des certifications professionnelles dans les domaines de l’infrastructure cloud et de l’automatisation sont un plus.


Proceso de selección

Dans le cadre de ce recrutement le processus sera le suivant :

  1. Call/visio avec Alexis (CPTO), pour faire connaissance

  2. Call/visio avec Samuel (Platform architect) pour évaluer vos compétences

  3. Rencontre avec l’équipe tech, pour voir par vous même comment ça se passe

  4. Entretien avec Benjamin (CEO), pour vous souhaiter la bienvenue !

¿Quieres saber más?