You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Thibaut ModrinTM

Thibaut Modrin

Data Engineer freelance – Pipelines ELT, MLOPS

333 €/jour
Dijon, FR
0-2 ans

Délai de réponse moyen : 1h

À propos de Thibaut

💡 Disponible en freelance de mi-juillet à mi-novembre 2025 pour des missions Data Engineering / Data Science, en full remote ou sur site (Paris, Lyon, Dijon).

Sur cette période, je peux intervenir à temps plein sur vos projets data :

Ingestion et transformation de données (ETL en Python / SQL)

Analyse, modélisation et préparation à la mise en production

Automatisation de pipelines et reporting

Déploiement d’APIs ou d’outils d’analyse


📆 De mi-novembre à mi-avril, je reste disponible pour des missions au forfait ou interventions ponctuelles :

Création de pipelines Python/SQL

Scripts d’automatisation et nettoyage de données

Dashboards analytiques et reporting

Industrialisation de modèles et déploiement via FastAPI



---

🎯 Mon approche :

Compréhension rapide de vos enjeux métiers

Intégration dans vos environnements existants

Conception de solutions simples, robustes et efficaces

Livraison progressive, documentée, et alignée sur vos priorités



---

🔧 Stack technique

Langages : Python, SQL

Librairies : Pandas, NumPy, Scikit-learn, Plotly, Seaborn

ETL & Transformation : Python, SQL, dbt

Stockage : Snowflake, PostgreSQL, SQLite

APIs & Apps : FastAPI, Streamlit

Automatisation : Scripts Python, CI/CD léger, Airflow



---

💬 Profil : Data Engineer / Data Scientist pragmatique, autonome, à l’écoute, avec une approche orientée valeur ajoutée et résultats concrets.
Mon objectif : vous aider à tirer le meilleur parti de vos données, en construisant des pipelines clairs, fiables et performants.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle limitée

  • Espagnol

    Capacité professionnelle limitée

Accepte de travailler sur site
Dijon (jusqu’à 50 km), Paris (jusqu’à 50 km), Lyon (jusqu’à 50 km)

Expériences

  • Maternité-Projet Final
    Data Scientist
    janvier 2025 - avril 2025 (3 mois)
    Dijon, France
    Nettoyage et exploration du dataset médical fourni par un statisticien d’une maternité régionale.
    Feature engineering médical à partir de variables cliniques (âge, antécédents, durée du travail, etc.). Modélisation supervisée : comparatif de modèles (Logistic Regression, Random Forest, XGBoost).
    Évaluation & interprétabilité : matrice de confusion, courbes ROC, SHAP values.
    Suivi des expériences avec MLflow.
    Déploiement d’une app Streamlit pour démonstration interactive du modèle auprès d’utilisateurs non techniques (ex. : sages-femmes, médecins).
    Machine learning
  • Formation Jedha
    Data Scientist - Projet de formation
    mars 2025 - avril 2025 (1 mois)
    🚗 Optimisation des retards & API de pricing – Getaround


    🎓 Projet certifiant – Formation Data Scientist Fullstack, Jedha
    🛠️ Technos : Python, Pandas, Streamlit, Scikit-learn, FastAPI, Docker, Hugging Face Spaces, GitHub


    ---

    🎯 Objectif du projet :
    Réduire les retards au retour des véhicules sur la plateforme Getaround en proposant une analyse stratégique pour l’introduction d’un délai minimum entre deux locations, et déployer une API de pricing prédictif utilisable par les propriétaires de véhicules.


    ---

    🔍 Travaux réalisés :

    🧠 Analyse des retards de location

    Étude des retours tardifs selon les modes de check-in : Mobile, Connect

    Simulation de différents scénarios de seuils (15, 30, 60 min) pour quantifier les locations impactées

    Estimation de la perte de revenus potentielle pour les propriétaires

    Visualisation avec Streamlit Dashboard (partage web Hugging Face)


    🤖 Modèle de pricing prédictif

    Prétraitement du fichier pricing_project.csv (normalisation, sélection de features)

    Entraînement d’un modèle de régression (RandomForestRegressor)

    Évaluation des performances sur jeu de test (RMSE, MAE)

    Construction d’un endpoint /predict avec FastAPI pour prédire un prix optimal


    🌐 Déploiement complet en ligne

    Déploiement de l’application sur Hugging Face Spaces (Streamlit + FastAPI)

    Création de la documentation dynamique /docs

    Hébergement du code sur GitHub avec README et instructions d’exécution locale

    Test de l’API avec curl et requêtes POST en JSON



    ---

    📈 Résultats :

    Dashboard interactif permettant à l’équipe produit de tester l’impact du seuil par type de voiture

    API accessible publiquement, capable de fournir un prix optimal pour une configuration de location donnée

    Mise en production d’une solution complète alliant Data Analysis, ML et DevOps
    FastAPI Machine learning
  • Freelance
    Freelance Data Scientist
    avril 2024 - Aujourd'hui (2 ans et 2 mois)
    • Développement de l'application mobile VITIZEN pour les viticulteurs (Android Kotlin + backend Python, Firebase)
    • Conception et mise en œuvre d'un assistant IA de type RAG pour la consultation de documents techniques agricoles
    • Réalisation d'un proof of concept pour la prédiction du risque d'hémorragie post-partum sévère (modèle de classification, évaluation )
    • Déploiement de micro-services data avec FastAPI et Docker pour prototypage rapide

Recommandations

Soyez le premier à recommander Thibaut

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Concepteur Développeur en Science des Données
    Jedha Bootcamp
    2025
    Formation Data Scientist Fullstack – Jedha (450h) Certification RNCP – Paris / en ligne – 2024–2025 Programme intensif couvrant l’ensemble du cycle de vie d’un projet data : Python & analyse de données (Pandas, Numpy, Plotly, scraping, APIs) Machine Learning & Deep Learning (classification, clustering, réseaux de neurones) Big Data & Cloud (PySpark, Databricks, stockage AWS) Déploiement de modèles (FastAPI, Docker, mise en production) Approche orientée projet avec mises en situation concrètes et préparation à des postes opérationnels : Data Scientist, ML Engineer, Data Engineer.

Compétences

Catégories