À propos de Lorena
Français
Bilingue ou natif
Anglais
Bilingue ou natif
Expériences
- DecathlonDATA ENGINEER CONSULTANTmai 2023 - novembre 2024 (1 an et 6 mois)Paris, France
Contexte :
- Mission stratégique pilotée par Decathlon centre : migration complète de 50+ pipelines critiques depuis Redshift vers Databricks et décommissionnement de l’infrastructure legacy.
- Enjeux : réduction des coûts d’infrastructure, amélioration des performances et unification sur la stack Databricks groupe.
Tâches réalisées :
- Implémentation des pipelines de données dans l’architecture Lakehouse existante (médaillon Bronze/Silver/Gold)
- Analyse du mapping de l’existant : audit des 50+ pipelines Redshift, identification des dépendances.
- Modélisation des données en zone Gold : création de dimensions optimisées selon le standard Kimball adaptés au retail.
- Migration et adaptation de 50+ pipelines legacy vers les différentes couches Delta Lake avec dbt ou pyspark selon la complexité
- Refactoring de la logique métier complexe
- Mise en place des techniques d’optimisation Spark avancées : Z-ordering, broadcast joins
- Mise en place des pipelines CI/CD avec GitHub Actions : tests automatisés, déploiement multi-environnements (dev/preprod/prod)
- Migration de l’orchestration basées sur des tâches cron/schedulers AWS vers MWAA.
- Mise en place de tests de qualité de données avec dbt tests et contrôles PySpark custom sur Databricks.
- Formation des équipes locales sur les nouvelles technologies et best practices.
Stack Technique : Databricks, Delta Lake, dbt Core, PySpark, Airflow (MWAA), GitHubActions, s3, AWS ECR - MichelinDATA ENGINEER CONSULTANTdécembre 2024 - avril 2025 (4 mois)
Contexte :
- Mission de consulting spécialisé pour accompagner les équipes Michelin (France + Inde) sur l’adoption de dbt et Databricks.
- Capitalisation sur l’expertise acquise lors de la mission Decathlon pour transférer les best practices Modern Data Stack
- Objectif : montée en compétences des équipes et explorations des possibilités technique via des PoCs.
Tâches réalisées :
- • Accompagnement des équipes sur l’utilisation avancée de dbt (modélisation, tests, documentation)
- Réponses aux besoins techniques spécifiques et résolution de blocages complexes
- Développement de PoCs pour démontrer les capacités avancées de dbt
- Benchmark et comparatif technique des solutions d’orchestration (Airflow vs Dagster vs Prefect) via des PoCs pratiques
- Implémentation de pattern avancés : lineage, data quality checks automatisés (Great Expectations, Elementary)
Stack technique : dbt core (Jinja templating avancé, macro custom), Airflow,Dagster, Prefect, Python, SQL, Great Expectations, Elementary - PSADATA ENGINEER CONSULTANTnovembre 2022 - avril 2023 (5 mois)
Contexte :
- Traitement de 1TB+ de données financières (Belgique et Pays-Bas) avec des
exigences de disponibilités et de performances élevéesTâches réalisées :
- Développement et optimisation de pipelines Spark (Pyspark) pour le traitement de volume importants de données financières
- Mise en place de nouveaux pipelines de données selon les besoins métiers évolutifs
- Maintenance préventive et corrective du Datalake : surveillance des performances, résolution de dysfonctionnements.
Stack technique : Apache Spark, SQL, DBeaver, Python
Recommandations
Soyez le premier à recommander Lorena
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Diplôme d'ingénieurESIGELEC2020Data Ingenierie, DevOps, Architecture et services cloud, Big Data
Certifications
- Databricks Certified Data Engineer AssociateDatabricks2023
- Databricks Certified Associate Developer for Apache SparkDatabricks2025