[Stage] Junior data scientist - NLP

  • Stage (5 à 8 mois)
  • Paris
  • Partager sur Facebook
  • Partager sur Twitter
  • Partager sur Linkedin
Liegey Muller Pons

Liegey Muller Pons

[Stage] Junior data scientist - NLP

  • Stage (5 à 8 mois)
  • Début :  May 1, 2019
  • Paris
  • Bac +5 / Master
  • < 6 mois

À propos

Liegey Muller Pons est une entreprise de tech dans le domaine de l'analyse de l'opinion et de la communication. Sa mission est de révolutionner les campagnes électorales et la communication des entreprises à destination de la population grâce à la data et au contact humain.

Elle commercialise Cinquante Plus Un, un logiciel de big data en Saas qui permet de modéliser la population locale et ses préoccupations, ainsi que des campagnes de porte-à-porte ciblées pour toucher le public de la manière la plus efficace. Ses utilisateurs vont de l’élu local au grand groupe industriel.

LMP travaille sur des enjeux majeurs en Europe : les campagnes présidentielles (F. Hollande 2012, E. Macron 2017) et législatives françaises, la gestion des déchets nucléaires, les élections nationales en Espagne et en Belgique ou l’implantation des énergies renouvelables en France.

Liegey Muller Pons
Liegey Muller Pons
Liegey Muller Pons
Liegey Muller Pons
Liegey Muller Pons

Descriptif du poste

L’ambition de l’équipe data de LMP est de construire une base de connaissance contenant 100% des informations qui permettent de comprendre l’opinion, les enjeux du territoire et des collectivités à une échelle locale. Pour cela, nous investiguons toutes les sources de données possibles et mettons en œuvre les dernières techniques à la pointe de la data science.

Le NLP est une compétence clef pour atteindre cet objectif, car il permet d’extraire des informations venant enrichir cette base de connaissances à partir de données textuelles. Le stagiaire data-scientist aura pour mission de participer à l’approfondissement de la compétence NLP chez LMP. Pour cela, il pourra :

  • Contribuer à la mise en œuvre et à l’amélioration de techniques de NLP déjà utilisées dans nos produits,
  • Améliorer la compétence de LMP sur les techniques utilisées en testant des méthodologies de l’état de l’art (par exemple : implémentation d’une méthodologie de topic mining nouvelle, test de nouveau package de NER…),
  • Explorer des sujets de NLP nouveaux pour évaluer leur pertinence pour LMP.
    Le stage comportera des tâches de R&D exploratoires ainsi que la contribution à la réalisation de Proof of concepts pour des analyses clients.

Le stagiaire data-scientist participera aux sprints et aux différentes « cérémonies » (sprint planning, rétro, démo…). Il aura pour référent un data-scientist senior qui le coachera sur les aspects scientifiques liés au NLP. Il sera également amené à interagir avec les autres data-scientists de l’équipe et bénéficiera de leur expertise scientifique et technique.

Être junior data-scientist chez LMP, c’est avoir l’opportunité d’appliquer l’état de l’art de la data science à des données et des problématiques originales, au sein d’une start-up technologique exigeante et ambitieuse qui suit les meilleurs pratiques en la matière. C’est avoir de l’impact dans une phase où les sujets sont encore ouverts. C’est également apprendre au quotidien auprès du leadership expérimenté de LMP (co-fondateurs, managers). LMP a déjà accueilli à plusieurs reprises avec succès des stagiaires de R&D en data science et saura vous proposer le coaching et les responsabilités qui vous feront progresser.

Missions

  • Identifier de nouvelles pistes de recherche en NLP,
  • Implémenter de nouvelles analyses de NLP sur nos sources de données,
  • Documenter ces investigations et contribuer à renforcer le socle de compétences NLP de LMP,
  • Mettre en œuvre des techniques de NLP sur des sources de données nouvelles,
  • Réaliser des livrables et des POC pour des clients.

Environnement technique

  • Gros volumes de données textuelles de différentes natures (quasi intégralité de la presse française de ces 20 dernières années, documents administratifs…) à analyser,
  • Algorithme de Topic mining, détection d’évènements, sentiment analysis,
  • Python (pandas, numpy, sklearn) ou R (tidyverse, deplyr),
  • Base de données SQL et Elastic Search,
  • Utilisation de Spacy et NLTK pour le NLP

Profil recherché

Prérequis

  • Etudiant ou jeune diplômé d’une grande école ou d’une université de premier plan
  • Goût pour la recherche et le prototypage rapide,
  • Goût pour le NLP et connaissances préalables sur le sujet,
  • Bon niveau en Python ou R,
  • Intérêt pour les sujets politiques ou communication.

Apprécié

  • Mise en œuvre du NLP dans des projets,
  • Niveau avancé en Python et bonne connaissance des packages de NLP (spacy, nltk…)
  • La langue de travail est le français.

Déroulement des entretiens

  1. Entretien d'introduction (45 min)
  2. Test technique à réaliser à la maison (environ 2h)
  3. Entretien technique avec le CSO et le lead data scientist (2h): debrief test technique et cas d'usage
  4. Entretien avec un fondateur (1h): motivation, présentation du poste et de la société

Découvrez l'équipe de Liegey Muller Pons