Description

Ingénieur de données et DevOps avec plus de 6 ans d’expérience dans la conception, la mise en place et la maintenance de pipelines optimisés sur Databricks et Azure. Expertise en Apache Spark, PySpark, Azure Data Factory et Delta Live Tables, Unity Catalog et orchestration via Databricks Workflows, Python et Git, avec des pratiques IaC et CI/CD pour assurer qualité et conformité. Autonome et orienté production, je couvre l’intégralité du cycle de vie des données, du design au monitoring et à la gouvernance.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Allemand
Notions

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km), Strasbourg (jusqu’à 50 km)

SNCF
Senior Data Engineer
TRANSPORTS
décembre 2025 - avril 2026 (4 mois)
Paris, France
En tant que Data Engineer & IA , j'ai conçu une application qui vise à illustrer les capacités de monitoring et d'amélioration de la qualité des données. J'ai développé des pipelines multisources via Delta Live Tables avec une architecture Medallion et des mécanismes de Change Data Capture pour la synchronisation en temps réel. J'ai mis en place des contrôles de qualité déclaratifs à chaque couche de transformation, ainsi que la gouvernance des données via Unity Catalog. J'ai également développé des dashboards interactifs de data quality avec Python et Streamlit, et intégré un LLM (Llama-3) capable d'interroger les données en langage naturel, d'appliquer dynamiquement des contraintes de qualité et de générer automatiquement des dashboards à la demande. Enfin, j'ai conçu une architecture hybride combinant données structurées et capacités LLM pour des assistants IA orientés action, le tout en Squad Agile avec rédaction de documentation technique et préparation des packages de livraison.
Databricks PySpark Streamlit LLM Delta Lake
Sodexo
Ingénieur Data Platform & DevOps
RESSOURCES HUMAINES
janvier 2024 - novembre 2025 (1 an et 10 mois)
Paris, France
Au sein d'un programme RH stratégique et international, j'ai piloté la modernisation et l'industrialisation des flux de données RH pour accompagner la montée en charge du programme. J'ai conçu et mis en œuvre des pipelines de données en temps réel avec Azure Data Factory, Databricks et Delta Lake, et développé des jobs PySpark orchestrés via Databricks Workflows pour l'ingestion, la transformation et l'exposition des données. J'ai implémenté une automatisation complète du cycle de vie CI/CD avec Azure DevOps (Git, YAML, déploiements automatisés) dans un environnement multi-niveaux (dev, pré-production, production). J'ai collaboré avec une équipe internationale architectes data en Europe, ingénieurs en Amérique pour définir l'architecture technique, garantir la sécurité et dimensionner les ressources. J'ai également assuré la conception, le développement, le test et la maintenance de composants Big Data et BI dans un contexte de volume et de performance élevés, tout en rédigeant la documentation technique et en collaborant étroitement avec les métiers pour traduire leurs besoins en architectures de données robustes.
Microsoft Azure PySpark Databricks Azure DevOps SQL
ICDC
Ingénieur Big Data
BANQUE & ASSURANCES
janvier 2013 - juin 2023 (10 ans et 5 mois)
Paris, France
J'ai contribué à la migration de l'écosystème Big Data vers une plateforme modernisée visant à améliorer la performance analytique et l'accessibilité des données. J'ai élaboré des flux ETL sur Apache Spark et Apache Impala pour remplacer Hadoop classique via Python/PySpark, et piloté l'extraction de données depuis les systèmes Legacy PostgreSQL. J'ai développé et automatisé les traitements avec Python, Sqoop et Spark, intégrés via Jenkins et Bitbucket. J'ai garanti la stabilité du système via le Maintien en Condition Opérationnelle (MCO), incluant l'identification, l'analyse et la résolution de bugs en production. J'ai travaillé sur une infrastructure complexe comprenant plusieurs environnements (dev, pré-prod, prod) avec plusieurs datawarehouses et datamarts, tout en participant activement aux cérémonies Agiles et en collaborant directement avec les Product Owners pour la maturation des besoins analytiques.
PySpark ETL Hadoop Spark SQL

Consulter toutes les expériences de Haroun

Soyez le premier à recommander Haroun

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Data Engineering&Devops
OPC
2020
Data Engineering&Devops
Master of Engineering
NATIONAL COLLEGE OF ENGINEERS SOUTH ALSACE
2019
Master's Degree in Engineering

Fabric Data Engineer Associate
Microsoft
2024
https://learn.microsoft.com/fr-fr/credentials/certifications/fabric-data-engineer-associate/?practice-assessment-type=certification
Microsoft Azure Data Engineer Associate
Microsoft
2025

Les certifications de Haroun sont accessibles uniquement aux membres Malt

Data Engineer

Haroun B.

Senior Data Engineer

À propos de Haroun

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories