You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mehdi BouafiaMB

Mehdi Bouafia

Data Engineer | Batch & Streaming | GCP Certified

450 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Mehdi

Data Engineer / DataOps certifié Google Cloud, spécialisé dans la conception, l’industrialisation et l’exploitation de pipelines de données batch & streaming sur environnements cloud (GCP, Azure, AWS).

Expert en Python, PySpark, Spark (Scala), dbt et Airflow, avec une forte orientation fiabilité et amélioration continue.

J’interviens de bout en bout, de la compréhension des besoins métiers à la mise en production, jusqu’à l’accompagnement des équipes dans l’adoption et l’optimisation des solutions BI & Analytics, tout en garantissant la performance et la résilience des plateformes data.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 20 km)

Expériences

  • OVHCloud
    Data Engineer
    avril 2022 - mars 2025 (2 ans et 11 mois)
    Data Engineering & Industrialization

    ▪ Conception et industrialisation de pipelines data à grande échelle
    ▪ Prise en charge end-to-end des besoins métiers, de la conception jusqu’à la livraison, avec accompagnement des utilisateurs
    ▪ Développement de pipelines batch & streaming (Kafka) en Python, PySpark, Spark (Scala), dbt
    ▪ Développement de recettes et flux de transformation sur Dataiku DSS et intégration dans les pipelines de production
    ▪ Intégration de sources via APIs REST et automatisation des flux d'ingestion
    ▪ Modélisation des données en couches (staging → intermediate → marts) avec dbt, PySpark, Spark (Scala) et exposition via Dremio comme couche sémantique unifiée
    ▪ Mise en place de tests de qualité des données : complétude, unicité, cohérence référentielle
    ▪ CI/CD sur Bitbucket : versioning, revues de code, déploiement automatisé des pipelines
    ▪ Orchestration des workflows via DAGs Airflow : scheduling, gestion des dépendances, monitoring, résilience

    Data Platform & Automation

    ▪ Optimisation des environnements d'analyse et de transformation (Dremio, Dataiku DSS, Superset, Tableau Server)
    ▪ Structuration des pratiques d'équipe : revues de code, standards de développement, documentation technique
    ▪ Accompagnement des data analysts et des équipes métier

    Data Governance, Migration & Quality

    ▪ Migrations critiques (Data Lake legacy → Silver, SQL Server → PostgreSQL, intégration Kafka)
    ▪ Analyse d'impact, traçabilité et validation de la cohérence des données
    ▪ Contrôles d'accès RBAC, gestion des habilitations (LDAP, FreeIPA, Apache Ranger)
    ▪ Contribution à la traçabilité des données : lignage, auditabilité, cohérence inter-systèmes

    DataOps & Observability

    ▪ Ownership end-to-end des pipelines en production : monitoring, incidents, amélioration continue
    ▪ Conception de pipelines fault-tolerant : retry, idempotence, dead-letter queues
    ▪ Observabilité et alerting (Airflow, Grafana, Graylog), réduction de la dette opérationnelle
    Python Airflow Dataiku Spark DBT
  • Extia
    Data Engineer
    juin 2023 - mars 2025 (1 an et 9 mois)
    Animation de webinaires internes, diffusion des bonnes pratiques et de la culture Data Création de contenus pédagogiques et supports de formation
  • Nova Technology
    Data Engineer
    mars 2022 - juin 2023 (1 an et 3 mois)
    Equipe Stream Data : Diffusion de la culture Data et accompagnement de la croissance de l'équipe
    Projet BoondKPI : conception d’un Data Warehouse à partir des extractions automatiques du CRM BoondManager (Python, REST API) et création d’un dashboard Power BI pour le suivi des KPIs
    Python Microsoft Power BI PostgreSQL

Recommandations

Soyez le premier à recommander Mehdi

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 Exploration Informatique des Données et Décisionnel
    Université Sorbonne Paris Nord, Institut Galilée
    2022
    Master 2 Exploration Informatique des Données et Décisionnel
  • Master 1 Informatique
    Université Sorbonne Paris Nord, Institut Galilée
    2021
    Master 1 Informatique

Certifications

Compétences

Catégories