You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Patrick ChepiPC

Patrick Chepi

Senior data engineer AWS - Snowflake, DBT, Spark

650 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Patrick

Data engineer ayant plus de 8 ans d'expérience sur des sujets autour de la données aussi bien en mode batch qu'en streaming sur les plateformes on premise et cloud (AWS notamment). J'implémente constamment l'agilité et les process CICD pour garantir la disponibilité, l'auto scalabilité et la fiabilité de la donnée. En terme de domaines fonctionnels, j'ai eu à travailler dans la Banque/Finance, l'industrie, le transport, les médias et l'énergie.
  • Français

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Believe
    Data engineer
    DIVERTISSEMENTS & LOISIRS
    janvier 2024 - Aujourd'hui (2 ans et 5 mois)
    Data engineer dans une équipe chargée de collecter les données provenant des différents stores de streaming et de téléchargement, et de les traiter dans le but de proposer des services aux labels et aux artistes tels que le payement des royalties ou le suivi d’audience. L’équipe était aussi chargée de répondre aux besoins des filiales TUNECORE et SENTRIC.
    Amazon Web Services (AWS) Développeur Python Scala Apache Spark Snowflake Gitlab CI/CD Sonar Apache Kafka Databricks Amazon S3 AWS Batch AWS Step Functions AWS Secret Manager sqitch
  • RATP Dev
    Data Engineer Senior
    avril 2023 - janvier 2024 (9 mois)
    Descriptif mission ou enjeux et contexte du projet :
    Data Plateform Sénior data engineer dans une équipe chargée de rationnaliser et harmoniser les données en provenance de différentes filiales, et générer un socle commun et suffisamment flexible afin que les applications cibles et les utilisateurs finaux (Data Analyst, Data Scientists) puissent les exploiter à bon escient.
    Activités / Rôle :
    ❖ Accompagnement de la filiale RATP CAP dans la mise en place de sa plateforme data
    3

    ❖ Proposition et Participation à l'architecture pour le projet d'intégration de la filiale TootBus
    ❖ Retroengineering des jobs existants de la partie OPERATIONS et TICKETING sous Talend
    ❖ Implémentation et Optimisation des jobs à migrer vers Python et Airflow
    ❖ Implémentation des flux de données de l'extraction à l'exposition des données via Snowpark pour le projet GTFS
    ❖ Developpement d'API pour récupérer des taux de change de la Banque de France et des données de ventes
    ❖ Code review et documentation sous Confluence
    ❖ Accompagnement de collaborateurs dans leur montée en compétences Environnement technique : Outils : Pycharm, cmder Ordonnanceur : Apache Airflow Environnement : Gitlab, AWS (S3, Lambda), Snowflake, Talend, Docker, Kafka, Google (Ads, Analytics), API, SFTP, Oracle, Microsoft SQL Server, Jira, Confluence Langages : Snowpark, Python, Shell, SQL Environnement fonctionnel : Transport
    Talend Cloud Snowflake Python (Programming Language) Gitlab CI/CD ETL Modélisation Analyse de données
  • DECATHLON
    Data Engineer Senior
    juillet 2022 - mars 2023 (8 mois)
    Descriptif mission ou enjeux et contexte du projet :
    Data Domain Forecast AI Membre de l'équipe Forecast AI au sein de la BU DATA Domain ayant pour objectif de mettre à disposition les données de prédiction permettant au Retail Supply de commander des articles dans les entrepôts et dans les magasins
    Activités / Rôle :
    ❖ Proposition et Participation à l'architecture de projets sous AWS
    ❖ Développement et optimisation de jobs Pyspark sous AWS EMR et Databricks
    ❖ Mise en place d'outil de data quality (Great Expectations)
    ❖ Validation des développements par des revues de code avec l'équipe
    ❖ Développement de pipelines de CICD (git actions, AWS CodeArtefact, AWS ECR)
    ❖ Migration et orchestration des différents jobs vers Airflow
    ❖ Accompagnement de collaborateurs dans leur montée en compétences Environnement technique : Outils : Pycharm, cmder Ordonnanceur : Jenkins, Apache Airflow Environnement : GitHub, AWS (S3, Redshift, EMR, CodeaArtifact, ECR), YAML, Jira, Confluence, DataDog, Docker, Databricks, Kafka, Sagemaker, Make Langages : Spark, Python, Shell, SQL Environnement fonctionnel : Retail
    4
    Optimisation Apache Spark Python (Programming Language) VBA Amazon Web Services (AWS) DBT Databricks Shell Scripting Apache Kafka Docker

Recommandations

Soyez le premier à recommander Patrick

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master Finance
    Sorbonne Business School
    2023
    Finance de marche, Finance d'entreprise, Gestion des risques, Gestion d'actifs, Evaluation et politique financière des entreprises.
  • Master of Engineering (MEng), Technologie informatique / technologie des systèmes informatiques
    ESIGELEC
    2016
    Master of Engineering (MEng), Technologie informatique / technologie des systèmes informatiques

Certifications

Compétences

Catégories