Le Datalab répond aux sollicitations de la Direction Technique concernant les supports en statistiques et en analyse de données. A ce titre, le Datalab participe à des projets techniques et apporte un soutien autour de la DATA pour répondre à des problématiques métier.
Au sein de cette équipe, vos travaux seront dédiés à l'IA générative.
Votre objectif sera de mettre en place des prototypes d'outil d'analyse de données écrites en langage naturel ou autres données non structurées à l'aide de l'IA. L'enjeu est d'extraire rapidement des informations pertinentes pour une utilisation opérationnelle dans des bases de données non structurées difficilement exploitées à l'heure actuelle.
Vous aurez donc à réaliser les missions suivantes :
- Faire une revue de l'état de l'art et des outils open source à disposition pour les problématiques étudiées
- Réaliser des prototypes et proof of concept sur des sujets tels que :
o Questions – Réponses à partir d'un corpus documentaire
o Classification en présence d'un fort déséquilibre de classes
o Fine-tuning et quantification dans un environnement avec ressources de calcul limitées
- Réaliser un retour d'expérience et identifier des perspectives pour chaque étude menée en lien avec le client interne
Nous recherchons un apprenti avec les compétences suivantes :
* Étudiant en science des données ou informatique
* Connaissances solides en pré-traitement des données de texte, IA (couches de convolution, mécanisme d'attention, autoencodeur) et en particulier appliquée au NLP (Hugging Face, architecture transformer encoder et decoder, Retriever Augmented Generation, etc…)
* Maîtrise du langage de programmation Python (PyTorch, PySpark, SQL seraient un plus)
* Aptitude à travailler de manière autonome et être force de proposition
* Solides compétences en communication et en rédaction de rapports
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Évry-Courcouronnes