You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Donald BatokaDB

Donald Batoka

Data Engineer

555 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Donald

Bonjour,

Je suis issue d'une formation d'intelligence artificiel et de big data avec un Mastère Spécialisé de Telecom Paris. J'ai donc une très bonne connaissance des outils Big Data et la programmation Python. J'interviens donc en tant que Data Engineer et Data Ops.

Je suis donc disponible pour une prestation en tant que Data Engineer pour le traitement traitement des données à grande échelle (dans le cloud ou sur un infrastructure on-premise). Mes compétence en programmation vont de la programmation séquentiel à la programmation orientée objet. J'ai une bonne maitrise des principaux outils et librairies de traitement Big Data : Spark (PySpark), Pandas, Numpy, Scikit-Learn, Matplotlib, Seaborn et bien d'autres encore.

Je suis habitué à travailler dans des environnement agile, utilisant des outils de gestion et de versioning de code comme Git (Azure DevOps, Gitlab, Github).

J'ai également des compétences en traitement de données sur des clouds providers tels que Azure/AWS (Databricks, ADLS Gen2).

Je reste disponible pour un échange.

CV sur demande.

Merci d'avance pour nos futurs collaborations
  • Anglais

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Open Value
    Data Engineer
    juillet 2024 - Aujourd'hui (1 an et 11 mois)
    Neuilly-sur-Seine, France
    Recruter pour une mission en tant que Data Engineer mon travail consiste à :
    - Créer une librairie d'ingestion des données depuis diverses source (Oracle, Minio, Postgres, fichiers Excel, CSV)
    - Traiter et stocker les données suivant une architecture medallion
    - Preparer les données pour les utilisateurs finaux sur Postgres
    - Réaliser de diverses transformation sur les dataframes : jointure, changement de type, aggregation, filtres, vérification des règles de qualité et diverses opérations
    Spark Minio Oracle Jupyter notebooks PySpark
  • AXA France
    Data Engineer, Data Ops
    BANQUE & ASSURANCES
    novembre 2023 - mai 2024 (6 mois)
    Nanterre, France
    - Traitement des données en PySpark sur Azure Databricks
    - Traitement des données avec la solution Databricks SQL
    - Industrialisation de l'offre Databricks SQL au sein de la plateforme Big Data
    - Modification des pipelines CI/CD
    - Programmation PowerShell
    Databricks Azure Databricks Azure Data Engineer Git Azure DevOps PySpark Python
  • Veolia
    Data Scientist
    ENERGIE
    novembre 2022 - Aujourd'hui (3 ans et 7 mois)
    Paris, France
    - Nettoyage, Préparation et Visualisation des données
    - Analyse des séries temporelles (Time Series)
    - Algorithmes de détection de changement de tendance
    Python Pandas Numpy Matplotlib Plotly

Recommandations

Soyez le premier à recommander Donald

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Mastère Big Data et Intelligence Artificielle
    Telecom Paris
    2023
    - Modélisation statistique : Régression linéaire, tests statistiques - Machine/Deep Learning (Théorie et pratique) : Régression, classification, clustering - Manipulation des données volumineuses - Utilisation des principales solutions de stockages des fichiers et données

Compétences

Catégories