À propos de Nathan
- LLM en production : agents, RAG hybride (dense + sparse + reranking LLM), serveurs MCP, évaluation adversariale type LLM-as-judge (prompt injection, escalade de privilèges, isolation des données)
- ML classique : classification multi-classes sur données déséquilibrées (XGBoost), explicabilité (SHAP), déploiement FastAPI / Kubernetes
- Data & MLOps sur AWS : pipelines ELT (Airbyte, Snowflake, dbt), lakehouse bronze/silver/gold, IaC (Terraform, CloudFormation), services managés (S3, ECS, Lambda, RDS), monitoring
- Gouvernance & enablement IA : politiques d'usage GenAI, sélection d'outils, workshops et accompagnement transverse des équipes Produit / R&D / Customer Success
- Pilotage du comité IA d'un éditeur SaaS : définition de la politique GenAI à l'échelle entreprise, framework adversarial pour évaluer la robustesse des agents
- Moteur de recommandation multilingue (RAG hybride embeddings + TF-IDF + ANN + reranking LLM) déployé en production
- Classification automatique de transactions bancaires sur des milliers de classes déséquilibrées, réduisant la catégorisation manuelle de 70%
Français
Bilingue ou natif
Anglais
Bilingue ou natif
Allemand
Capacité professionnelle limitée
Expériences
- MyUnisoftLead AI EngineerEDITION DE LOGICIELSseptembre 2025 - mai 2026 (8 mois)Paris, France
- Conception et déploiement d'un modèle XGBoost de classification multi-classes (milliers de classes déséquilibrées) pour la prédiction de codes comptables à partir de transactions bancaires : réduction de 70% de la catégorisation manuelle
- Développement de serveurs MCP sécurisés et conception d'un framework de test adversarial LLM-as-judge évaluant la robustesse des agents face aux injections de prompt, escalades de privilèges et attaques d'isolation de données
- Pilotage du comité IA : définition des politiques d'usage de l'IA générative à l'échelle de l'entreprise, sélection des outils, mise en place des bonnes pratiques
- Animation bimensuelle de workshops IA et accompagnement transverse (Produit, R&D, Customer Success) : évaluations de faisabilité technique, adoption des pratiques
- MajelanData Scientist / ML EngineerDIVERTISSEMENTS & LOISIRSavril 2023 - août 2025 (2 ans et 4 mois)Paris, France
- Conception et développement d'un moteur de recommandation de podcasts multilingue combinant architecture RAG hybride (Azure OpenAI, TF-IDF, recherche ANN) et re-ranking par LLM, exposé via FastAPI et déployé sur AWS (EKS, Terraform, CloudFormation)
- Mise en place d'un pipeline ELT sur AWS (Airbyte → Snowflake → dbt) consolidant des millions d'enregistrements dans un lakehouse bronze/silver/gold ; création de tableaux de bord analytiques (Streamlit, Metabase) sur des datamarts pour les équipes internes et les utilisateurs
- Reprise en main d'une codebase legacy volumineuse et non documentée, support de services critiques en production après le départ de l'équipe de développement : rétro-ingénierie, stabilisation et maintenance
- CNRSStagiaire de rechercheCENTRES DE RECHERCHEmars 2021 - juin 2021 (3 mois)Strasbourg, France
- Traitement, structuration et visualisation de jeux de données massifs issus de simulations dans le cadre du projet Future Circular Collider (FCC)
- Exploration d'outils et workflows Big Data pour l'analyse scientifique
- Présentation au FCC Jamboree organisé par le CERN
Recommandations
Soyez le premier à recommander Nathan
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Diplôme bac+5 (niveau 7 RNCP) en Data ScienceCentraleSupélec2022Cursus orienté projets multi-secteurs (banque, distribution, agronomie, santé) : - Nettoyage et préparation de données - Analyse exploratoire (univariée, multivariée) - Réduction de dimensionnalité - Entraînement de modèles supervisés et non supervisés, optimisation d'hyperparamètres, évaluation de performance - Deep learning sur données textuelles et visuelles - Déploiement d'API et de dashboards - Versioning Git - Déploiement Big Data et calcul distribué (AWS) Stack : Numpy, Pandas, Scikit-learn, Matplotlib, Seaborn, Plotly, SHAP, TensorFlow, Keras, LightGBM, XGBoost, FastAPI, Streamlit, Gunicorn, PySpark
- Master en Physique des particules élémentairesUniversité de Strasbourg2021Mention Bien. Accent sur les concepts statistiques et probabilistes.