À propos de Vincent
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- KPMGData Scientistjuin 2025 - septembre 2025 (3 mois)Paris, FranceDéveloppement d’une solution d’analyse de Virtual Data Room (VDR) contenant plusieurs milliers de documents sensibles (transaction financières, contrats, légal etc.) pour le compte du pôle M&A IT.La solution extrait les informations des documents de la VDR, les classifie, les représente de manière fidèle sémantiquement parlant et les stocke en Base de données vectorielle pour utilisation d’un RAG.L’accent a été mis sur la performance de la classification et du RAG, ainsi que de l’optimisation technique afin de déployer en production une solution utilisable (temps de processing, arbitrage performance et temps de traitement etc.).J’ai notamment utilisé du développement asynchrone ainsi que des queues et worker (RabbitMQ et Celery) pour améliorer les performances techniques.La solution utilise un système agentique avec plusieurs LLM propriétaires (OpenAI) permettant de répondre à des questions poussées sur les informations présentes, ou absentes, de la VDR.J'ai aussi mis en place une routine d'évaluation de la solution impliquant les métiers, afin d'améliorer continuellement la solution après son déploiement.
- Doctolib FranceMachine learning engineerSECTEUR MÉDICALavril 2022 - avril 2025 (3 ans)Paris, FranceConception d'une architecture Agent déployé en production
- Développement d'un chatbot intelligent reposant sur une architecture multi-agents, offrant une interaction fluide avec des agents spécialisés capables de traiter une large variété de scénarios de support client.
- Intégration de fonctionnalités avancées permettant de gérer des questions complexes et d'automatiser des actions, telles que la réponse aux requêtes, la clarification des besoins, la mise à jour d'informations utilisateur en base de données, et la demande de validation utilisateur avant toute exécution d'action.
- Mise en place d'une architecture d'évaluation du système agent. Intégration d'un service externe, création d'un dataset d'évaluation, mise à disposition d'un repo de prompt importé dans le système Agent pour permettre aux profils non techs d'itérer sur le prompting
- Mise en place de techniques avancées de vérification des réponse du système Agent afin de mitiger les hallucinations et de fournir un produit prêt au déploiement en production
Développement d'un système RAG (Retrieval Augmented Generation) déployé en production- Déploiement en production via FastAPI d'un système complet de RAG avec la mise en place d'une Vector DB sous Opensearch, un modèle de reranking et un modèle de génération de la réponse.
- Itérations sur les méthodes d'indexation pour améliorer la récupération des données pertinentes dans la VectorDB
- Ajout de nouvelles sources de données dans la VectorDB via des méthodes de clustering permettant de répondre plus précisément aux requêtes utilisateur
Medium articles- https://medium.com/doctolib/part-2-from-rag-to-agents-doctolibs-journey-to-revolutionize-customer-care-6b14da40f5ae
- https://medium.com/doctolib/part-1-from-retrieval-augmented-generation-rag-to-agents-doctolibs-journey-to-revolutionize-d34610eeb550
- DoctolibData Scientistjuin 2020 - avril 2022 (1 an et 10 mois)Fine-tuning de LLM & Déploiement d’un pipeline d’anonymisation
- Fine-tuning de CamemBERT pour la reconnaissance d’entités nommées (NER) visant l’anonymisation de données sensibles issues des utilisateurs.
- Déploiement d’un pipeline complet d’anonymisation basé sur Presidio via FastAPI, avec mise à disposition du modèle en MaaS (Model as a Service) pour plusieurs équipes internes.
- Suivi de la qualité du modèle (scoring, évaluation) et amélioration continue via l’intégration de nouvelles sources de données sensibles.
Modèle de classification des feedbacks clients- Entraînement d’un modèle XGBoost pour la classification multi-label de retours clients.
- Utilisation d’un pipeline d'entraînement en cascade pour gérer la complexité des multiples catégories à prédire.
- Déploiement en production pour des usages en reporting et en prévention du churn.
Avis
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- IngénieurGrenoble INP2017Biomédical et Imagerie Médicale