À propos de Côme
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- ServierSenior Data ScientistINDUSTRIE PHARMACEUTIQUEaoût 2024 - Aujourd'hui (1 an et 10 mois)Suresnes, FranceRôle :o Participation au développement d’un assistant intelligent pour la rédaction médicale via recherche contextuelle et génération LLMo Conception d’un système scalable pour comprendre les requêtes, agréger les sources, structurer les réponseso Co-construction d’un cadre d’évaluation métier (exactitude, complétude…)o Contribution à la modularité du système pour benchmarker facilement modèles et composantsDétails techniques :o Pipeline PDF basé sur Docling, séparant texte/visuels (tables, figures) pour améliorer la recherche• Parsing → Chunking → Embedding → Indexation• Orchestration via Cloud Workflows, déclenchée par Cloud Storage, Eventarc, Pub/Subo Pipeline RAG agentique : décomposition des requêtes + multi-hop retrieval via LLM + synthèse finale avec citationso Plateforme d’évaluation sur Vertex AI Pipelines : déclenchements automatisés, datasets versionnés (GitLab CI + BigQuery), comparaison rapide entre LLMs et rerankers
- SNCFAI EngineerTRANSPORTSjanvier 2024 - juillet 2024 (5 mois)Saint-Denis, FranceRôle :o Accompagnement stratégique et technique des différentes initiatives métiers sur l’IA / l’IA Générativeo Implémentation d’un pattern général de RAG via l’utilisation de services managés Azure et AWSo Capitalisation et diffusion des expériences acquises pour enrichir la base de connaissances au sein du CDC Cloudo Support stratégique sur l’IA / l’IA générative, cartographie des différentes solutions et architecturesInitiatives et projets concernés :o Chatbot sur une base documentaire contenant des référentiels métiers (textes, figures, tableaux, schémas)o Reconnaissance des visages des personnes sur les voies et floutage de ces dernierso Aide à la supervision dans la recherche d’informations synthétiques au sein d’une base documentaire en cas d’incident
- MindlytixMachine Learning EngineerEDITION DE LOGICIELSjuillet 2023 - novembre 2023 (5 mois)Paris, FranceRôle :o Utilisation et déploiement d’un modèle d’image captioning via un Large Language Model (LLM) multimodalo Conception et développement de pipelines de clustering et de classification d’images et de vidéos selon une taxonomie en plusieurs niveaux propre à chaque industrieo Design et implémentation d’un data warehouse conçu pour soutenir divers cas d'utilisation métierso Enrichissement de la donnée via l’appel à des API externes, notamment la reconnaissance de célébrités, la détection de labels et de la colorimétrieDétails techniques :o Traitement des vidéos via la détection puis l’exploitation des keyframes obtenues via l’API GCP Video Intelligence shot change detectiono Image captioning (image to text) : benchmark des différentes solutions open source puis utilisation du modèle LLaVa basé sur le LLM Vicunao Implémentation des deux principaux modules de la pipeline :• Classification en zero-shot des images vers une taxonomie sur deux niveaux propre à chaque industrie. Utilisation de CLIP pour les images brutes et BART préentraîné sur MNLI pour les descriptions obtenues via le image to text• Topic modeling sur les images : embedding des descriptions, clustering via HDBSAN et naming automatique des clusters via TF-IDF et Llama 2o Déploiement et orchestration des modules sur GCP Vertex AI Pipelineso Postprocessing et agrégation des résultats sur BigQuery via l’utilisation de dbt
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master 2 Data ScienceÉcole Polytechnique2017Sujets : • Machine Learning - from Theory to Practice • Optimization for Data Science • Methods for Big Data Analytics • Deep Learning • Data Camp • Learning for Text and Graph Data • Big Data Frameworks • Structured Data - Learning, Prediction, Dependency, Testing • Machine Learning - Business case • Systems for Big Data Analytics
- Diplôme d'ingénieurECE Paris2017Systèmes d'information, Cybersécurité et Big Data
Certifications
- Professional Machine Learning EngineerGoogle2022