You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Chafiq M.CM

Chafiq M.

đŸ„‡ Data engineer: Spark, Databricks, Lakehouse, AI

670 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Chafiq

👋 Bienvenue sur mon profil Malt ! 🚀

Je suis Senior Data Engineer / Tech Lead (8+ ans), expert Databricks, Spark, Kafka, Airflow et CI/CD (GitLab/Jenkins). J’aide les Ă©quipes Ă  livrer des pipelines fiables, observables et Ă©conomiques, du batch au streaming, on-prem ou cloud (Azure/AWS). Domaines : banque/assurance, risque, fraude, rĂ©glementaire, KPI.

đŸ§‘â€đŸ’» Data Engineering & DevOps
‱ Conception & build de pipelines ETL/ELT end-to-end (Delta/SQL/APIs)
‱ Streaming & event-driven avec Kafka (Connect/Streams/Schema Registry)
‱ Optimisation perfs & coĂ»ts (partitions, cache, AQE, Z-Order)
‱ QualitĂ© des donnĂ©es, tests TDD, observabilitĂ© (mĂ©triques, SLA/SLO)
‱ Orchestration Airflow, CI/CD, packaging Docker
‱ DĂ©ploiements Kubernetes, gestion des secrets
‱ Maintenance Ă©volutive/corrective & debug de jobs critiques

đŸ’» Software Engineering
‱ Backends Python/Scala/Java (FastAPI/REST/Spring Boot)
‱ IntĂ©gration bases & modĂšles (Delta Lake, Hive, Elasticsearch, Postgres)
‱ Exposition de la donnĂ©e : APIs, SQL, dashboards & KPIs

🎯 RĂ©alisations clĂ©s
‱ 🏩 CrĂ©dit Agricole Assurance : x30 de perfs sur Spark (heures → minutes) + migration Spark 3.5 & Airflow, automatisations via IHM.
‱ 🏩 SociĂ©tĂ© GĂ©nĂ©rale : migration fraude marchĂ© on-prem → Azure/Databricks, temps d’exĂ©cution Ă·30.
‱ 🏩 Natixis : moteur risques (VaR/CVaR) optimisĂ©, TDD 95 %, jobs 8 min → 1 min.

🧰 Stack
Apache Spark 2/3, Databricks (Delta/Unity Catalog), Kafka, Airflow, Hadoop/Hive/HBase, Snowflake, DBT, Python, Scala/Java, SQL, GitLab/Jenkins/Sonar, Docker/Kubernetes, Azure & AWS, Cloudera/MapR.

📈 Mon exigence : des solutions robustes, scalables, testĂ©es et observables, avec des quick wins dĂšs la 1Êłá”‰ semaine.

Besoin d’un expert Data Engineering/DevOps/CI ?
Écrivez-moi avec use case, volumĂ©trie, stack : je reviens avec un plan d’attaque concret.
Je réponds vite (souvent < 1 h).

Agences/ESN : conditions spécifiques, me consulter.
  • Anglais

    Capacité professionnelle complÚte

  • Allemand

    Notions

  • Espagnol

    Notions

  • Arabe

    Bilingue ou natif

  • Français

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km), Paris (jusqu’à 100 km)

Expériences

  • CrĂ©dit Agricole Assurances
    Tech Lead - Senior Data Engineer
    BANQUE & ASSURANCES
    janvier 2023 - Aujourd'hui (3 ans et 5 mois)
    Paris, France
    Contexte : Refonte, migration et évolution de plusieurs déclarations réglementaires mensuelles et annuelles (FICOVIE, IER, EAI CDC,
    EAI, FATCA) dans un environnement Big Data critique et réglementé.

    Actions :
    • Encadrement et mentoring d’une Ă©quipe de Data Engineers sur Spark/Hadoop.
    • Mise en place de standards de dĂ©veloppement (Git, TDD, CI/CD, SonarQube).
    • Pilotage de la migration de la plateforme Data : orchestration Oozie → Airflow, migration Spark 2.4 → Spark 3.5, java 8 → java 17, gestion des contraintes de compatibilitĂ© et performance.
    • Participation active aux ateliers de spĂ©cifications techniques et fonctionnelles, ainsi qu’aux comitĂ©s de suivi de migration.
    • DĂ©veloppement d’une IHM mĂ©tier pour automatiser les processus dĂ©claratifs de bout en bout.
    • Release management.

    Résultats :
    • RĂ©duction du temps de traitement Spark de plusieurs heures Ă  quelques minutes (x30 en performance).
    • SuccĂšs de la migration vers Spark 3.5 et Airflow, avec sĂ©curisation des jobs critiques et minimisation des risques de rĂ©gression.
    • AccĂ©lĂ©ration de la montĂ©e en compĂ©tence des Ă©quipes (formations Spark 3.x, Airflow, CI/CD).
    • AmĂ©lioration de la qualitĂ© logicielle et de la fiabilitĂ© des pipelines grĂą ce Ă  la mise en place des bonnes pratiques CI/CD et TDD.
    • Automatisation des dĂ©claratifs rĂ©glementaires via l’IHM → rĂ©duction des tĂąches manuelles et fiabilisation des processus mĂ©tiers.

    Technologies : Spark 2.4 & 3.5, Hadoop, Hive, HBase, Kafka, Python, Airflow, Java 8, Scala 2.12, MAPR, Spring Boot, Angular, PostgreSQL, SQL, Kubernetes, JFrog, Jenkins, SonarQube, GitLab, Github Copilot (GPT, Claude, Gemini), IntelliJ, Windows.
    Apache Spark Java Scala Airflow Kubernetes
  • SociĂ©tĂ© GĂ©nĂ©rale
    Senior Data Engineer
    BANQUE & ASSURANCES
    août 2021 - décembre 2022 (1 an et 4 mois)
    Fontenay-sous-Bois, France
    Contexte : DĂ©veloppement d’une plateforme de contrĂŽ le de marchĂ© et dĂ©tection de fraude sur des volumĂ©tries massives, dans un contexte de migration vers le Cloud.

    Actions :
    • Pilotage de la migration de l’écosystĂšme On-Premise → Cloud Azure (HDInsight, Azure Storage).
    • Migration Spark 2.x → Spark 3.x, avec optimisation des performances (AQE, DPP, jointures adaptatives).
    • Encadrement et mentoring de l’équipe Data Engineering (Paris, Londres, Bangalore).
    • Mise en place des bonnes pratiques de dĂ©veloppement (Git, TDD, CI/CD, SonarQube)
    • Collaboration Ă©troite avec les Ă©quipes mĂ©tiers et support pour sĂ©curiser les mises en production.
    • Release management.

    Résultats :
    • RĂ©duction du temps de traitement Spark de plusieurs heures Ă  quelques minutes (x30 en performance).
    • AccĂ©lĂ©ration des analyses de fraude grĂą ce Ă  des pipelines optimisĂ©s et scalables dans Azure.
    • Adoption rĂ©ussie de Spark 3.x et Cloud Azure → amĂ©lioration de la robustesse et de la flexibilitĂ© de la plateforme.
    • AmĂ©lioration significative de la stabilitĂ© et des coĂ» ts opĂ©rationnels des calculs de risque.
    • AmĂ©lioration de la qualitĂ© logicielle et de la fiabilitĂ© des pipelines grĂą ce Ă  la mise en place des bonnes pratiques CI/CD et TDD.

    Technologies : Microsoft Azure (HDInsight, Azure Storage Explorer, Databricks), Java 8, Scala 2.11, Apache Spark 2 et 3, Kerberos, Spring Boot, REST API, HDP 2.6, Hive, Hadoop, Windows, IntelliJ.
    Data Engineer Spark Scala Java Cloudera Data Platform
  • BPCE SA
    Data Engineer
    BANQUE & ASSURANCES
    février 2019 - juin 2021 (2 ans et 4 mois)
    Paris, France
    Sujet : Logiciel de calcul des indicateurs de risk et P&L (Profit & Loss).

    • Assurer la maintenance et l’évolution des composants existants.
    • ImplĂ©menter les process de calcul pour HVAR, Sensi x Shocks, Stress Tests.
    • Implentation de la mĂ©thodologie TDD dans l’équipe (de 0% Ă  95% de courverture du code par TU).
    • Optimisation des algorithmes et code Spark pour plus d’efficacitĂ© en temps et utilisation mĂ©moire(de 8mins Ă  1mins dans les process de calcul).
    • Analyse, conception et dĂ©veloppement des solutions et des nouvelles fonctionnalitĂ©s.
    • Participation Ă  l’élaboration de spĂ©cifications technique et fonctionnelle.
    • Participation aux rĂ©unions de chiffrage des livrables.
    • Assurer les mises en production .
    • Coordination avec les Ă©quipes de support et infrastructure .

    Technologies : Windows, IntelliJ, Scala 2.11, Apache Spark 2, Apache Kafka, Kerberos, Spring Boot, Java 8, REST API, HDP 2.6, HBase, Hive, Hadoop.
    Data Engineer Spark Scala Event-driven architecture Cloudera Data Platform (CDP)

Recommandations

AU
AU
AU
+3
Ancien utilisateur et 5 autres personnes recommandent Chafiq

Ces profils de freelance correspondent également à vos critÚres

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master MIAGE - Big Data pour la Finance
    Université Paris-Dauphine
    2017
    - Big Data & Data Engineering - Machine Learning & Data Analytics
  • DiplĂŽme d'ingĂ©nieur - GĂ©nie Logiciel (Option Big Data)
    ENSEIRB-MATMECA
    2017
    - Développement Logiciel - Architecture des SystÚme d'information - Développement Web - Bonnes pratiques et méthode Agile - Big Data

Certifications

Compétences

Catégories