You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Haroun B.HB

Haroun B.

Senior Data Engineer

450 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Haroun

Ingénieur de données et DevOps avec plus de 6 ans d’expérience dans la conception, la mise en place et la maintenance de pipelines optimisés sur Databricks et Azure. Expertise en Apache Spark, PySpark, Azure Data Factory et Delta Live Tables, Unity Catalog et orchestration via Databricks Workflows, Python et Git, avec des pratiques IaC et CI/CD pour assurer qualité et conformité. Autonome et orienté production, je couvre l’intégralité du cycle de vie des données, du design au monitoring et à la gouvernance.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Allemand

    Notions

Accepte de travailler sur site
Paris (jusqu’à 50 km), Strasbourg (jusqu’à 50 km)

Expériences

  • SNCF
    Senior Data Engineer
    TRANSPORTS
    décembre 2025 - avril 2026 (4 mois)
    Paris, France
    En tant que Data Engineer & IA , j'ai conçu une application qui vise à illustrer les capacités de monitoring et d'amélioration de la qualité des données. J'ai développé des pipelines multisources via Delta Live Tables avec une architecture Medallion et des mécanismes de Change Data Capture pour la synchronisation en temps réel. J'ai mis en place des contrôles de qualité déclaratifs à chaque couche de transformation, ainsi que la gouvernance des données via Unity Catalog. J'ai également développé des dashboards interactifs de data quality avec Python et Streamlit, et intégré un LLM (Llama-3) capable d'interroger les données en langage naturel, d'appliquer dynamiquement des contraintes de qualité et de générer automatiquement des dashboards à la demande. Enfin, j'ai conçu une architecture hybride combinant données structurées et capacités LLM pour des assistants IA orientés action, le tout en Squad Agile avec rédaction de documentation technique et préparation des packages de livraison.
    Databricks PySpark Streamlit LLM Delta Lake
  • Sodexo
    Ingénieur Data Platform & DevOps
    RESSOURCES HUMAINES
    janvier 2024 - novembre 2025 (1 an et 10 mois)
    Paris, France
    Au sein d'un programme RH stratégique et international, j'ai piloté la modernisation et l'industrialisation des flux de données RH pour accompagner la montée en charge du programme. J'ai conçu et mis en œuvre des pipelines de données en temps réel avec Azure Data Factory, Databricks et Delta Lake, et développé des jobs PySpark orchestrés via Databricks Workflows pour l'ingestion, la transformation et l'exposition des données. J'ai implémenté une automatisation complète du cycle de vie CI/CD avec Azure DevOps (Git, YAML, déploiements automatisés) dans un environnement multi-niveaux (dev, pré-production, production). J'ai collaboré avec une équipe internationale architectes data en Europe, ingénieurs en Amérique pour définir l'architecture technique, garantir la sécurité et dimensionner les ressources. J'ai également assuré la conception, le développement, le test et la maintenance de composants Big Data et BI dans un contexte de volume et de performance élevés, tout en rédigeant la documentation technique et en collaborant étroitement avec les métiers pour traduire leurs besoins en architectures de données robustes.
    Microsoft Azure PySpark Databricks Azure DevOps SQL
  • ICDC
    Ingénieur Big Data
    BANQUE & ASSURANCES
    janvier 2013 - juin 2023 (10 ans et 5 mois)
    Paris, France
    J'ai contribué à la migration de l'écosystème Big Data vers une plateforme modernisée visant à améliorer la performance analytique et l'accessibilité des données. J'ai élaboré des flux ETL sur Apache Spark et Apache Impala pour remplacer Hadoop classique via Python/PySpark, et piloté l'extraction de données depuis les systèmes Legacy PostgreSQL. J'ai développé et automatisé les traitements avec Python, Sqoop et Spark, intégrés via Jenkins et Bitbucket. J'ai garanti la stabilité du système via le Maintien en Condition Opérationnelle (MCO), incluant l'identification, l'analyse et la résolution de bugs en production. J'ai travaillé sur une infrastructure complexe comprenant plusieurs environnements (dev, pré-prod, prod) avec plusieurs datawarehouses et datamarts, tout en participant activement aux cérémonies Agiles et en collaborant directement avec les Product Owners pour la maturation des besoins analytiques.
    PySpark ETL Hadoop Spark SQL

Recommandations

Soyez le premier à recommander Haroun

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Data Engineering&Devops
    OPC
    2020
    Data Engineering&Devops
  • Master of Engineering
    NATIONAL COLLEGE OF ENGINEERS SOUTH ALSACE
    2019
    Master's Degree in Engineering

Certifications

Compétences

Catégories