You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Baptiste Marc MokaBM

Baptiste Marc Moka

Supermalter

Senior Data Scientist / AI Engineer & Professor

675 €/jour
3 projets
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Baptiste Marc

Je développe des solutions qui optimisent l'exploitation de vos données sur un pipeline efficace pour renforcer votre compétitivité.

Data Science

Traitement de données
— Python (poetry) / R
— ETL (Airflow, DBT, Fivetran)
— Data Analysis / EDA
— Stream (Beam, Dataflow, Kafka)
— Hadoop / Snowflake
— PySpark

Collection de données
— Data Engineering / UML
— Hadoop / Spark
— Web Scraping (Beautifulsoup, Selenium, Scrapy)
— LLM RAG / ChatGPT

LLM / ChatGPT API
— Prompt Engineering (CoT & Tool Calling)
— RAG (LangChain, LlamaIndex)
— Vector DB (FAISS, Chroma)
— Agents & Tool Use
— Guardrails, HPO & Monitoring

Prédiction & Classification
— Modélisation
— Modèles statistiques, IA & Machine Learning (50+ modèles)
— Deep Learning (Tensorflow)
— PyTorch, ScikitLearn
— Computer vision
— Time series
— NLP

Monitoring / Alerting
— Dashboards (PowerBI, Tableau, Looker, Shiny, Dash)
— Data visualisation
— ELK Stack

Développement produit

Prototypage
— UX/UI & Research (Figma, Adobe XD)

Développement
— Front (React, JS, HTML, SCSS)
— Back / APIs (Flask, FastAPI)
— Advanced SQL / NoSQL
— Automatisation (N8n, Make, Zapier)

Production
— CI/CD : GitHub, Jenkins, Serverless framework
— Cloud : GCP / AWS (Lambda, API gateway, S3, RDS)
— TensorFlow, PyTorch, MLflow, Scikit-learn
— Databricks, Dataiku,
— Docker, Kubernetes
— Cybersécurité (OWASP, ISO27001, EBIOS)

Expériences :
  • 📊 Lead Data Scientist Senior (9 ans)
  • 🔬 Chercheur en IA / Mathématiques
  • 🏛️ Professeur en Data Science (Université Catholique de Lille)
  • 🦄 Fondateur SaaS IA weeki.io (5 ans à Euratechnologies)

Éducation :
- Doctorant en Machine Learning
- Formé aux USA à NYC & Stanford 🇺🇸

  • Anglais

    Bilingue ou natif

  • Français

    Bilingue ou natif

  • Grec

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km), Lille (jusqu’à 50 km), Ferney-Voltaire (jusqu’à 50 km), Thonon-les-Bains (jusqu’à 50 km)

Expériences

  • DECATHLON | TECHNOLOGY
    Senior Data scientist for Supply Chain Forecast
    GRANDE DISTRIBUTION
    janvier 2024 - janvier 2025 (1 an)
    Paris, France
    Lead Senior Data Scientist – Forecast & Supply Chain

    Mission

    Prévision de la demande, optimisation des stocks et réapprovisionnements.
    Modèles adaptatifs aux variations saisonnières.

    Équipe : 1 PM, 4 DS, 2 DA, 1 ML

    Contexte

    Retail, supply chain complexe, e-commerce, omnicanal
    Modélisation robuste pour variabilité demande, comportement conso, contraintes appro

    Objectifs

    Forecast multi-échelles
    Prévisions probabilistes (distributions, intervalles confiance)
    Apprentissage incrémental (cutoffs)
    Automatisation déploiement
    Optimisation stocks, réduction ruptures

    Technologies & Infra

    Langages : Python (Pandas, Numpy, PySpark, Scikit-learn, TensorFlow)
    Frameworks : FastAPI, Streamlit, Poetry
    Cloud & Infra : Databricks, AWS S3, Git
    Stockage & Pipeline : Colibra, Delta files, Parquet, Databricks JOBS template
    Orchestration : Airflow
    CI/CD & DevOps : GitHub Actions, Docker
    ML Management : MLflow, Databricks
    Monitoring & Viz : Tableau

    Données & Pipelines

    Centralisation sur Colibra / S3 / Parquet
    Qualité données validée avant ingestion
    Sources : historiques ventes, indicateurs éco, signaux externes

    Transformations & Analyses
    Clustering, saisonnalité, PCA, statistiques (Anova, X², T-test, F-Fisher)
    Feature Engineering : lags, macroéconomie, KNN, clustering

    Modélisation & Prédiction

    Feature Selection : SelectKBest, Boruta, RFE, SFS, Random Forest Importance
    Forecast ML : LightGBM, XGBoost, RandomForest, CatBoost, AdaBoost
    Time Series : SARIMA, TFT, RNN, STL, ARIMA, Fourier, Poly Saisonnière
    Optimisation : HPO (Optuna, HyperOpt)
    Fonctions coût : RMSE, WAPE, MAE, Tweedie, Quantile Loss

    Feature Importance

    Locale : SHAP, LIME
    Globale : Beta Coeffs, Friedman H, Permutation

    Déploiement & Exploitation

    API via FastAPI, UI via Streamlit, hébergé sur Databricks APP
    Automatisation Airflow, monitoring erreurs/dérives
    Alerte dérivations

    Reporting & Visualisation

    Dashboards Tableau
    Backtesting comparatif
    Scénarios
    Databricks MLflow Forecast MLOps Data Pipeline
  • UPFUND
    Senior Lead Datascientis for Real Estate
    IMMOBILIER
    janvier 2024 - janvier 2025 (1 an)
    Paris, France
    Machine Learning (ML) →

    - Prédiction d'indicateurs immobiliers (commerces, appartements, maisons) à l'aide de modèles de Machine Learning, d'analyses géospatiales et prévision de séries temporelles.

    Data Engineering (DE) & Data Analysis (DA) →

    - Création de pipelines de données, prétraitement, analyse exploratoire (EDA)

    Research & Development (R&D) →

    - Identification et définition des problématiques de recherche, pour orienter les projets de manière structurée et scientifique. Définition des hypothèses de travail, avec production de synthèses des modèles utilisés.

    Knowledge management (KM) →

    - Création d'un état de l'art sur les statistiques spatiales, séries temporelles, prévisions et Machine Learning appliqué à l'immobilier.
    - Centralisation, structuration et gestion des connaissances scientifiques, afin de tirer profit des savoirs et faciliter leur réutilisation.
    Data Pipeline Analyse de données MLOps Machine learning Statistiques
  • UNIVERSITE CATHOLIQUE DE LILLE
    👨‍🏫 Professor in Datascience / ML / Probability & Statistics 👨🏼‍🏫
    BIOTECHNOLOGIES
    janvier 2023 - janvier 2025 (2 ans)
    Lille, France
    Programme de cours – Professeur Vacataire en Mathématiques

    Fondations
    • 0.1 : Éléments de calcul et outils
    • 0.2 : Épistémologie et théorie de la connaissance

    Partie 1 – Théorie des systèmes
    • 1.1 : Systèmes dynamiques
    • 1.2 : Systèmes adaptatifs complexes

    Partie 2 – Dynamique stochastique et probabilités
    • 2.1 : Théorie de la mesure
    • 2.2 : Théorie des probabilités
    • 2.3 : Distributions de probabilité usuelles
    • 2.4 : Statistiques asymptotiques
    • 2.5 : Processus stochastiques et séries temporelles
    • 2.6 : Géométrie de l'information

    Partie 3 – Observation des données
    • 3.1 : Statistiques descriptives
    • 3.2 : Analyse exploratoire des données

    Partie 4 – Inférence et théorie de l'estimation
    • 4.1 : Estimation des paramètres
    • 4.2 : Conception expérimentale, échantillonnage et tests d'hypothèses
    • 4.4 : Arbres de décision et sélection de modèles
    • 4.5 : Inférences bayésiennes

    Partie 5 – Exemples de modèles linéaires et de régression
    • 5.1 : Régression linéaire simple
    • 5.2 : Régression linéaire multiple
    • 5.3 : Autres méthodes de régression

    Partie 6 – Autres exemples de modèles classiques
    • 6.1 : Tests univariés usuels
    • 6.2 : Tests multivariés usuels
    • 6.3 : Statistiques non paramétriques

    Partie 7 – Exemples de modèles non linéaires
    • 7.1 : Modèles graphiques probabilistes
    • 7.2 : Théorie de la percolation
    • 7.3 : Statistiques spatiales
    • 7.4 : Théorie des valeurs extrêmes
    • 7.5 : Modélisation basée sur les agents
    • 7.6 : Dynamique des réseaux

    Technologies et outils utilisés :
    MATLAB, R, Python, LaTeX, Jupyter Notebooks, SPSS, SAS, Excel, NumPy, SciPy, Pandas, Matplotlib, TensorFlow, PyTorch, Tableau, Power BI, SQL, GitHub.
    Data science Analyse de données Inférence bayésienne Data Engineer

Recommandations

Ceren D.CD
Léo SingezLS
AU
+9
Ceren D. et 11 autres personnes recommandent Baptiste Marc

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • MASTER in MATHEMATICS and COMPUTER SCIENCE applied to COGNITIVE SCIENCE for BUSINESS
    Lille University
    2019
    — Data Science with Python: Machine Learning — Probability — Statistical Linear Models & Regression — English M1 — Web — Computing for Neurocognitive Science — Digital development for Neuropsychology — Philosophy of Mind — Ergonomy & Product design — R programming — Non Parametric Statistics — SAS for datascience — E-marketing — Technology for Psychological Research M2 — Ethics & deontology — Functionnal Neuroscience — Emotionnal Process & Affective neuroscience — Neurocognition — Artificial Neural Networks — Programming for Experimental research — UX design / Product and Experience optimization
  • NEW YORK CITY DATA SCIENCE ACADEMY
    New York Datascience Academy (NYCDSA)
    2019
    — Deep Learning — Statistical models — Hadoop — Spark — AWS — Datavizualizatiuon — Linux system — Advanced SQL — NoSQL — Web Scraping — Time Series Analysis — Reinforcement Learning — Computer Vision — Generalized Linear Models — Tree Methods — Support Vector Machines — Natural Language Processing — Code Optimization — Advanced Phyton — Advanced R

Compétences

Catégories