Description

En tant que data Engineer, je me spécialise dans la collecte, le stockage, la gestion et l'analyse de grands volume de données. J'ai plusieurs expériences dans la création de pipelines de données et le développement de processus automatisés pour intégrer des données provenant de plusieurs sources.

Grâce à mon expertise, je peux vous aider à maximiser la valeur de vos données et à prendre de meilleures décisions d'affaires.

stack technique: Spark scala python Databricks Azure

Langues

Français
Bilingue ou natif
Anglais
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

CNP
Databricks Solution Architect.
BANQUE & ASSURANCES
juin 2025 - Aujourd'hui (1 an)
Paris, France
j’ai accompagné le client à travers un POC stratégiques basés sur Databricks.
L’objectif était de poser des bases solides : une plateforme évolutive, sécurisée, et de permettre
aux équipes de monter en compétence.
Réalisations
Conception d’un pipeline de données basé sur des modèles d’IA déployés sur Databricks, permettant la transcription des appels clients tout en anonymisant les informations sensibles.
Mise en place d’un pipeline ETL robuste et prêt pour la production avec Delta Live Tables
Mise en place de Unity Catalog
Change Data Capture (CDC) pour suivre et propager efficacement les modifications de données en quasi temps réel
Liquid Clustering pour optimiser les performances et permettre des requêtes économes en coût sur de grands volumes de données
Model Serving pour mettre en production des modèles de machine learning directement dans l’environnement Databricks.
Asset Bundles et Azure Pipelines pour l’intégration CI/CD, permettant un déploiement automatisé et sous contrôle de version des workflows Databricks
Accompagnement des équipes internes en partageant les bonnes pratiques Databricks, tant sur les aspects techniques que méthodologiques
Azure Databricks Microsoft Azure Gitlab CI/CD Python
TF1
Cloud Data engineer
PRESSE & MÉDIAS
juin 2023 - juin 2025 (1 an et 11 mois)
Boulogne-Billancourt, France
Au sein du pôle produit publicitaire (PPP), j'ai collaboré avec les équipes métier pour développer des pipelines de données basés sur des spécifications fonctionnelles, ainsi que pour concevoir un framework permettant de généraliser l’ingestion de données avec Spark

Travaux réalisés:
Évaluer les besoins des différentes équipes pour définir les architectures et technologies les plus adaptées à chaque usage.
Concevoir et implémenter des pipelines de données permettant de collecter, traiter et stocker les informations de manière automatisée et fiable.
Améliorer la qualité des données et réduire les risques de sécurité, grâce à des architectures et des outils de gestion de données robustes et performants
Conception et Développement from Scratch d'un système d'information dédié à la collecte, au traitement et à la visualisation des données d’audience
Documents applicatifs nécessaires au transfert de connaissances de l'entité et en dehors de l'entité
Spark Scala Extraire, transformer, charger (ETL) Azure Databricks Spark Streaming
Crédit Agricole CIB
Big Data Engineer
BANQUE & ASSURANCES
janvier 2022 - juin 2023 (1 an et 5 mois)
Montrouge, France
Contexte:

Le projet CMT (cash management transformation) a pour but de construire plusieurs interfaces de traitement de données massives qui communiquent entre elles afin de garantir une meilleure et rapide gestion des paiements (de l'initiation du paiement jusqu'à la validation).
Dans ce projet j’ai intégré l'équipe qui veille sur le développement et la maintenance de l’application cœur de ce projet et ses pipelines. Cette application s’occupe du traitement de la requête du moteur de payement vers les applications externes afin de collecter des données depuis plusieurs référentielles, ça permet aussi l’enrichissement de données en se basant sur des exigences, la génération et la transformation du format de données,, lecture et écriture en respectant l’encodées spécifié, tout cela pour permettre une communication saine entre ces applications.

Travaux réalisés:
● Développement d’un job spark batch pour la création des extractions de paiements pour alimenter une application de détection de fraudes et blanchiment d’argent
● Développement des jobs Streaming des paiements internationaux pour gérer les nouveaux flux (Java, Spark)
● Documents applicatifs nécessaires au transfert de connaissances.
● Livrables : code, documentation, revue de code

Environnement technique:
● Environnement de dev: Java, Gitlab, Jenkins, Junit, Cucumber
● Environnement Big Data: Spark, Kafka, Elasticsearch
Spark kafka Elasticsearch Cucumber Gitlab CI/CD