À propos de Thibault
- Data Engineering : Collecte et transformation des données (ETL/ELT), data pipelines optimisés, orchestration (Airflow), monitoring et qualité des données.
- Data Science : Modélisation et mise en production de modèles ML, analyse prédictive, NLP, détection d’anomalies et optimisation des processus.
- Stack : Python, SQL, Spark, API, AWS, Docker.
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Engie GreenData Engineer / Data ScientistENERGIEjanvier 2025 - Aujourd'hui (1 an et 5 mois)Montpellier, FranceRécupération et analyse des données historiques des actifs renouvelables• Conception et développement d’un pipeline de parsing et d’intégration de données hétérogènes internes (Python, Airflow, AWS, Flask), garantissant la collecte et l’unification des données• Analyse avancée des courbes de charge et contrôle de la qualité des données temporelles pour détecter et corriger les incohérences• Création d’un programme de validation automatisée pour identifier les anomalies et les données manquantes, assurant une qualité de données optimale• Développement et mise en place de tableaux de bord de contrôle (Power BI, Flask), permettant un suivi en temps réel de la qualité des données• Optimisation des performances du pipeline pour garantir un traitement fiable, scalable et automatisé des données à grande échelle
- EDATERData Scientist / Data Engineerjanvier 2021 - décembre 2023 (3 ans)Montpellier, FranceModélisation du poids économique des secteurs maritime et touristique- Classification des descriptions d'activité par NLP en collaboration avec le client, améliorant la précision de la classification NAF- Modélisation du chiffre d'affaires et de la valeur ajoutée des entreprises à partir des données URSSAF et MSA- Déploiement multirégional : Nouvelle-Aquitaine (2021), Occitanie (2022)Analyse surfacique des territoires agricoles en Bretagne (2010-2020)- Accréditation pour le traitement de données sensibles sur un dispositif d'accès sécurisé CASD sur le recensement agricole au niveau individuel- Analyse contrefactuelle entre exploitants aidés ou non et régimes d'aidesAnalyse temporelle de la trajectoire des entreprises défaillantes- Retro-ingénierie des schémas de défaillance pour identifier les motifs récurrents précédant la défaillance- Prédiction des entreprises à risque en intégrant des variables telles que la durée d'un état, le secteur d'activité, la localisation géographique, etc.Création d'un système d'information (SI) sur les entreprises (~50M)- Pipeline de traitement mensuel de données (d'activité, d'emploi, de GPS et financière) en open data (SIRENE , BODACC , RNCS ) avec Python- Algorithme d'appariement pour retrouver les entreprises par raison sociale (+300% de rapidité du process existant par optimisation et parallélisation)
- Business & Decision (B&D)Data Analystavril 2018 - avril 2020 (2 ans)Montpellier, FranceMissions pour CDC Habitat- Migration du reporting de Hummingbird BI vers Qlikview, avec la création et MEP de tableaux de bord (patrimoine, achats, ventes, CRM, . . .)- Développement et maintenance évolutive pour la centralisation et la mutualisation des services SI (projet Trajectoire 2022 )- Traitement de tickets (Jira), documentation (Confluence), versioning (git)Missions pour EFIDIS - Responsable applicatif- Programmation des refresh mensuels et qualification des données- Traitement de tickets (SAP BO)
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Anglais C1EF School - Manchester (U.K.)2024Programme d'immersion intensive
- D.U. - Data Science & Big DataUniversité de Montpellier - France2021Python, SQL, NoSQL, Tensorflow, Actuariat, Économétrie, Statistiques