This position is no longer available.

Senior Software Reliability Engineer

Permanent contract
Paris
Salary: Not specified
No remote work
Experience: > 3 years

Opendatasoft
Opendatasoft

Interested in this job?

jobs.faq.title

The position

Job description

Dans le cadre de la croissance et du développement international d’Opendatasoft, nous recrutons des ingénieurs SRE pour rejoindre l’équipe infrastructure, composée actuellement de 3 ingénieurs.

Responsabilités de l’équipe

L’équipe infrastructure s’occupe de l’hébergement et de l’opération de la plateforme SaaS d’OpenDataSoft pour tous nos clients, en lien étroit avec les équipes produit et de développement.

Notre application pose des problèmes de performance et de scalabilité uniques : nous opérons une trentaine de clusters Elasticsearch stockant toutes les données de nos clients, avec des volumes et des schémas hautement variables : cela va de la liste des bureaux de votes d’une commune, à des centaines de millions de mesures de capteurs enregistrées en temps réel, le tout accédé via nos API, à des débits de quelques centaines d’appels par seconde.

Notre philosophie Dev/Ops est pragmatique : nous cherchons à fournir aux développeurs les outils leur permettant d’être plus productifs et efficaces, tout en automatisant et en monitorant, pour optimiser les délais de mise en production et de feedback. L’agilité est appliquée avec discernement, aussi bien au niveau du déploiement que de l’organisation. Les déploiements se font sur un rythme hebdomadaire, sans downtime.

Le mode d’opération de l’équipe se rapproche du Site Reliability Engineering : nous sommes responsables à la fois de la fiabilité du service et du déploiement des fonctionnalités, conjointement avec les développeurs. Nous automatisons au maximum les opérations de la plateforme afin de suivre la croissance de l’entreprise et les développements du produit, tout en assurant et contrôlant les objectifs de qualité de service (SLA).

Vos objectifs

  • Améliorer la fiabilité et la performance de la plateforme
  • Automatiser le packaging et les mises à jour, afin d’en augmenter la fréquence
  • Automatiser le déploiement et le scaling du service
  • Gérer le monitoring (finesse et pertinence des alertes), et automatiser les réponses aux alertes

Outils utilisés

  • OS : Debian/Ubuntu Linux
  • Stack: nginx/uwsgi/django/celery/mysql/rabbitmq/memcached/redis
  • Ops: Python, Saltstack, Zabbix, Elasticsearch, Logstash, Kibana, Grafana
  • VCS: Git, Github

Preferred experience

  • Expérience avec un outil de gestion de configuration (Puppet, Chef, Salt, Ansible…)
  • Expérience significative de gestion des opérations d’une application web à fort trafic
  • Maîtrise de python
  • Maîtrise des problématiques de performance (processeur, mémoire, accès aux données, caches, performance)
  • Compréhension des problématiques liées aux systèmes distribués (locking, théorème CAP…)
  • Anglais courant

Bonus

  • Expérience avec ElasticSearch
  • Gestion de bases de données relationnelles ou NoSQL
  • Expérience avec IaaS/PaaS (AWS, Azure, CloudStack, OpenStack)

Recruitment process

1. Entretien téléphonique (30 minutes)

David Thoumas (CTO) ou Julien Leproust (Head of Infrastructure and Security)
Présentation du poste, de l’équipe, du parcours et des motivations du candidat, de son principal accomplissement…

2. Entretiens physiques

Sur une même demi-journée :

  1. Entretien technique avec un lead-dev et un dev (1h)
  2. Entretien technique avec le manager, Julien Leproust (1h)
  3. Entretien* avec l’équipe RH (30 minutes)
  4. Entretien avec David Thoumas, CTO (1 heure)

* Les entretiens suivants ne se font que si l’entretien technique est validé.

Option : Rencontre avec l’équipe et les collaborateurs + visite de nos bureaux

Want to know more?

These job openings might interest you!

These companies are also recruiting for the position of “Développement de logiciels et de sites Web”.

See all job openings