Description

Bonjour,

Je suis issue d'une formation d'intelligence artificiel et de big data avec un Mastère Spécialisé de Telecom Paris. J'ai donc une très bonne connaissance des outils Big Data et la programmation Python. J'interviens donc en tant que Data Engineer et Data Ops.

Je suis donc disponible pour une prestation en tant que Data Engineer pour le traitement traitement des données à grande échelle (dans le cloud ou sur un infrastructure on-premise). Mes compétence en programmation vont de la programmation séquentiel à la programmation orientée objet. J'ai une bonne maitrise des principaux outils et librairies de traitement Big Data : Spark (PySpark), Pandas, Numpy, Scikit-Learn, Matplotlib, Seaborn et bien d'autres encore.

Je suis habitué à travailler dans des environnement agile, utilisant des outils de gestion et de versioning de code comme Git (Azure DevOps, Gitlab, Github).

J'ai également des compétences en traitement de données sur des clouds providers tels que Azure/AWS (Databricks, ADLS Gen2).

Je reste disponible pour un échange.

CV sur demande.

Merci d'avance pour nos futurs collaborations

Langues

Anglais
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

Open Value
Data Engineer
juillet 2024 - Aujourd'hui (1 an et 11 mois)
Neuilly-sur-Seine, France
Recruter pour une mission en tant que Data Engineer mon travail consiste à :
- Créer une librairie d'ingestion des données depuis diverses source (Oracle, Minio, Postgres, fichiers Excel, CSV)
- Traiter et stocker les données suivant une architecture medallion
- Preparer les données pour les utilisateurs finaux sur Postgres
- Réaliser de diverses transformation sur les dataframes : jointure, changement de type, aggregation, filtres, vérification des règles de qualité et diverses opérations
Spark Minio Oracle Jupyter notebooks PySpark
AXA France
Data Engineer, Data Ops
BANQUE & ASSURANCES
novembre 2023 - mai 2024 (6 mois)
Nanterre, France
- Traitement des données en PySpark sur Azure Databricks
- Traitement des données avec la solution Databricks SQL
- Industrialisation de l'offre Databricks SQL au sein de la plateforme Big Data
- Modification des pipelines CI/CD
- Programmation PowerShell
Databricks Azure Databricks Azure Data Engineer Git Azure DevOps PySpark Python
Veolia
Data Scientist
ENERGIE
novembre 2022 - Aujourd'hui (3 ans et 7 mois)
Paris, France
- Nettoyage, Préparation et Visualisation des données
- Analyse des séries temporelles (Time Series)
- Algorithmes de détection de changement de tendance
Python Pandas Numpy Matplotlib Plotly

Consulter toutes les expériences de Donald

Soyez le premier à recommander Donald

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Mastère Big Data et Intelligence Artificielle
Telecom Paris
2023
- Modélisation statistique : Régression linéaire, tests statistiques - Machine/Deep Learning (Théorie et pratique) : Régression, classification, clustering - Manipulation des données volumineuses - Utilisation des principales solutions de stockages des fichiers et données

Ingénieur logiciel

Donald Batoka

Data Engineer

À propos de Donald

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences

Catégories