Cette offre n’est plus disponible.

Senior Software Reliability Engineer

CDI
Paris
Salaire : Non spécifié
Télétravail non autorisé
Expérience : > 3 ans

Opendatasoft
Opendatasoft

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Dans le cadre de la croissance et du développement international d’Opendatasoft, nous recrutons des ingénieurs SRE pour rejoindre l’équipe infrastructure, composée actuellement de 3 ingénieurs.

Responsabilités de l’équipe

L’équipe infrastructure s’occupe de l’hébergement et de l’opération de la plateforme SaaS d’OpenDataSoft pour tous nos clients, en lien étroit avec les équipes produit et de développement.

Notre application pose des problèmes de performance et de scalabilité uniques : nous opérons une trentaine de clusters Elasticsearch stockant toutes les données de nos clients, avec des volumes et des schémas hautement variables : cela va de la liste des bureaux de votes d’une commune, à des centaines de millions de mesures de capteurs enregistrées en temps réel, le tout accédé via nos API, à des débits de quelques centaines d’appels par seconde.

Notre philosophie Dev/Ops est pragmatique : nous cherchons à fournir aux développeurs les outils leur permettant d’être plus productifs et efficaces, tout en automatisant et en monitorant, pour optimiser les délais de mise en production et de feedback. L’agilité est appliquée avec discernement, aussi bien au niveau du déploiement que de l’organisation. Les déploiements se font sur un rythme hebdomadaire, sans downtime.

Le mode d’opération de l’équipe se rapproche du Site Reliability Engineering : nous sommes responsables à la fois de la fiabilité du service et du déploiement des fonctionnalités, conjointement avec les développeurs. Nous automatisons au maximum les opérations de la plateforme afin de suivre la croissance de l’entreprise et les développements du produit, tout en assurant et contrôlant les objectifs de qualité de service (SLA).

Vos objectifs

  • Améliorer la fiabilité et la performance de la plateforme
  • Automatiser le packaging et les mises à jour, afin d’en augmenter la fréquence
  • Automatiser le déploiement et le scaling du service
  • Gérer le monitoring (finesse et pertinence des alertes), et automatiser les réponses aux alertes

Outils utilisés

  • OS : Debian/Ubuntu Linux
  • Stack: nginx/uwsgi/django/celery/mysql/rabbitmq/memcached/redis
  • Ops: Python, Saltstack, Zabbix, Elasticsearch, Logstash, Kibana, Grafana
  • VCS: Git, Github

Profil recherché

  • Expérience avec un outil de gestion de configuration (Puppet, Chef, Salt, Ansible…)
  • Expérience significative de gestion des opérations d’une application web à fort trafic
  • Maîtrise de python
  • Maîtrise des problématiques de performance (processeur, mémoire, accès aux données, caches, performance)
  • Compréhension des problématiques liées aux systèmes distribués (locking, théorème CAP…)
  • Anglais courant

Bonus

  • Expérience avec ElasticSearch
  • Gestion de bases de données relationnelles ou NoSQL
  • Expérience avec IaaS/PaaS (AWS, Azure, CloudStack, OpenStack)

Déroulement des entretiens

1. Entretien téléphonique (30 minutes)

David Thoumas (CTO) ou Julien Leproust (Head of Infrastructure and Security)
Présentation du poste, de l’équipe, du parcours et des motivations du candidat, de son principal accomplissement…

2. Entretiens physiques

Sur une même demi-journée :

  1. Entretien technique avec un lead-dev et un dev (1h)
  2. Entretien technique avec le manager, Julien Leproust (1h)
  3. Entretien* avec l’équipe RH (30 minutes)
  4. Entretien avec David Thoumas, CTO (1 heure)

* Les entretiens suivants ne se font que si l’entretien technique est validé.

Option : Rencontre avec l’équipe et les collaborateurs + visite de nos bureaux

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Développement de logiciels et de sites Web”.

Voir toutes les offres