À propos de Baptiste Marc
Data Science
Développement produit
- 📊 Lead Data Scientist Senior (9 ans)
- 🔬 Chercheur en IA / Mathématiques
- 🏛️ Professeur en Data Science (Université Catholique de Lille)
- 🦄 Fondateur SaaS IA weeki.io (5 ans à Euratechnologies)
Anglais
Bilingue ou natif
Français
Bilingue ou natif
Grec
Bilingue ou natif
Expériences
- DECATHLON | TECHNOLOGYSenior Data scientist for Supply Chain ForecastGRANDE DISTRIBUTIONjanvier 2024 - janvier 2025 (1 an)Paris, FranceLead Senior Data Scientist – Forecast & Supply ChainMissionPrévision de la demande, optimisation des stocks et réapprovisionnements.Modèles adaptatifs aux variations saisonnières.Équipe : 1 PM, 4 DS, 2 DA, 1 MLContexteRetail, supply chain complexe, e-commerce, omnicanalModélisation robuste pour variabilité demande, comportement conso, contraintes approObjectifsForecast multi-échellesPrévisions probabilistes (distributions, intervalles confiance)Apprentissage incrémental (cutoffs)Automatisation déploiementOptimisation stocks, réduction rupturesTechnologies & InfraLangages : Python (Pandas, Numpy, PySpark, Scikit-learn, TensorFlow)Frameworks : FastAPI, Streamlit, PoetryCloud & Infra : Databricks, AWS S3, GitStockage & Pipeline : Colibra, Delta files, Parquet, Databricks JOBS templateOrchestration : AirflowCI/CD & DevOps : GitHub Actions, DockerML Management : MLflow, DatabricksMonitoring & Viz : TableauDonnées & PipelinesCentralisation sur Colibra / S3 / ParquetQualité données validée avant ingestionSources : historiques ventes, indicateurs éco, signaux externesTransformations & AnalysesClustering, saisonnalité, PCA, statistiques (Anova, X², T-test, F-Fisher)Feature Engineering : lags, macroéconomie, KNN, clusteringModélisation & PrédictionFeature Selection : SelectKBest, Boruta, RFE, SFS, Random Forest ImportanceForecast ML : LightGBM, XGBoost, RandomForest, CatBoost, AdaBoostTime Series : SARIMA, TFT, RNN, STL, ARIMA, Fourier, Poly SaisonnièreOptimisation : HPO (Optuna, HyperOpt)Fonctions coût : RMSE, WAPE, MAE, Tweedie, Quantile LossFeature ImportanceLocale : SHAP, LIMEGlobale : Beta Coeffs, Friedman H, PermutationDéploiement & ExploitationAPI via FastAPI, UI via Streamlit, hébergé sur Databricks APPAutomatisation Airflow, monitoring erreurs/dérivesAlerte dérivationsReporting & VisualisationDashboards TableauBacktesting comparatifScénarios
- UPFUNDSenior Lead Datascientis for Real EstateIMMOBILIERjanvier 2024 - janvier 2025 (1 an)Paris, FranceMachine Learning (ML) →- Prédiction d'indicateurs immobiliers (commerces, appartements, maisons) à l'aide de modèles de Machine Learning, d'analyses géospatiales et prévision de séries temporelles.Data Engineering (DE) & Data Analysis (DA) →- Création de pipelines de données, prétraitement, analyse exploratoire (EDA)Research & Development (R&D) →- Identification et définition des problématiques de recherche, pour orienter les projets de manière structurée et scientifique. Définition des hypothèses de travail, avec production de synthèses des modèles utilisés.Knowledge management (KM) →- Création d'un état de l'art sur les statistiques spatiales, séries temporelles, prévisions et Machine Learning appliqué à l'immobilier.- Centralisation, structuration et gestion des connaissances scientifiques, afin de tirer profit des savoirs et faciliter leur réutilisation.
- UNIVERSITE CATHOLIQUE DE LILLE👨🏫 Professor in Datascience / ML / Probability & Statistics 👨🏼🏫BIOTECHNOLOGIESjanvier 2023 - janvier 2025 (2 ans)Lille, FranceProgramme de cours – Professeur Vacataire en MathématiquesFondations• 0.1 : Éléments de calcul et outils• 0.2 : Épistémologie et théorie de la connaissancePartie 1 – Théorie des systèmes• 1.1 : Systèmes dynamiques• 1.2 : Systèmes adaptatifs complexesPartie 2 – Dynamique stochastique et probabilités• 2.1 : Théorie de la mesure• 2.2 : Théorie des probabilités• 2.3 : Distributions de probabilité usuelles• 2.4 : Statistiques asymptotiques• 2.5 : Processus stochastiques et séries temporelles• 2.6 : Géométrie de l'informationPartie 3 – Observation des données• 3.1 : Statistiques descriptives• 3.2 : Analyse exploratoire des donnéesPartie 4 – Inférence et théorie de l'estimation• 4.1 : Estimation des paramètres• 4.2 : Conception expérimentale, échantillonnage et tests d'hypothèses• 4.4 : Arbres de décision et sélection de modèles• 4.5 : Inférences bayésiennesPartie 5 – Exemples de modèles linéaires et de régression• 5.1 : Régression linéaire simple• 5.2 : Régression linéaire multiple• 5.3 : Autres méthodes de régressionPartie 6 – Autres exemples de modèles classiques• 6.1 : Tests univariés usuels• 6.2 : Tests multivariés usuels• 6.3 : Statistiques non paramétriquesPartie 7 – Exemples de modèles non linéaires• 7.1 : Modèles graphiques probabilistes• 7.2 : Théorie de la percolation• 7.3 : Statistiques spatiales• 7.4 : Théorie des valeurs extrêmes• 7.5 : Modélisation basée sur les agents• 7.6 : Dynamique des réseauxTechnologies et outils utilisés :MATLAB, R, Python, LaTeX, Jupyter Notebooks, SPSS, SAS, Excel, NumPy, SciPy, Pandas, Matplotlib, TensorFlow, PyTorch, Tableau, Power BI, SQL, GitHub.
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- MASTER in MATHEMATICS and COMPUTER SCIENCE applied to COGNITIVE SCIENCE for BUSINESSLille University2019— Data Science with Python: Machine Learning — Probability — Statistical Linear Models & Regression — English M1 — Web — Computing for Neurocognitive Science — Digital development for Neuropsychology — Philosophy of Mind — Ergonomy & Product design — R programming — Non Parametric Statistics — SAS for datascience — E-marketing — Technology for Psychological Research M2 — Ethics & deontology — Functionnal Neuroscience — Emotionnal Process & Affective neuroscience — Neurocognition — Artificial Neural Networks — Programming for Experimental research — UX design / Product and Experience optimization
- NEW YORK CITY DATA SCIENCE ACADEMYNew York Datascience Academy (NYCDSA)2019— Deep Learning — Statistical models — Hadoop — Spark — AWS — Datavizualizatiuon — Linux system — Advanced SQL — NoSQL — Web Scraping — Time Series Analysis — Reinforcement Learning — Computer Vision — Generalized Linear Models — Tree Methods — Support Vector Machines — Natural Language Processing — Code Optimization — Advanced Phyton — Advanced R