Description

Bienvenue sur mon profil Malt 🙂!

Data engineer avec plus de 6 ans d'expériences, j'ai travaillé pour diverses grandes entreprises telles que le Groupe Seb, Sanofi, FDJ, Atos.

Ma mission est d'aider mes clients à concevoir et développer leur modèle de données, pipelines de données et l'architecture de données🛢⚙📊.

Ce que je peux faire pour vous autour de la data de manière industrielle:

👉 Ingestion de la donnée

J'implémente des jobs/pipelines qui vont ingérer vos données quelque soit le volume et le format(csv, json, avro...), je peux aussi ingérer vos données en étant conforme à la RGPD.

👉Transformation et Agrégation de la donnée

J'implémente des jobs/pipelines qui vont filtrer, nettoyer, transformer, enrichir vos données afin d'offrir de la donnée exploitable.

J'implémente aussi des calculs d'agrégation pour vos KPI.

👉Exposition de la donnée

Des scripts seront industrialisé pour exposer vos données sous forme de vue ou table SQL, Hive(ces tables constituerons votre Datawarehouse)

👉Architecture de données

Je conseille et accompagne pour la mise en place de votre data plateforme(architecture de stockage et de traitement)

👉Industrialisation data science

N'hésitez pas à me contacter 🙂!

Langues

Français
Bilingue ou natif
Anglais
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 20 km), Lyon (jusqu’à 20 km)

Groupe Seb
Data engineer
DIVERTISSEMENTS & LOISIRS
avril 2021 - Aujourd'hui (5 ans et 2 mois)
Au sein de l'équipe PCM (Professional coffee machine) je suis amené à concevoir et implémenter des pipelines data et jobs spark afin d'alimenter le datawarhouse et construire des Dashboard/rapports dataviz pour les différents clients qui utilsent ces machines à café pro.

👉Data engineering tech lead
• Interface avec l’équipe backend pour gérer les changements au niveau de la source de données et anticiper les impacts techniques
• Accompagnement des nouveaux DE entrants
• Rédaction des technical story
• Pair programming
• Révision des pull request
• Release delivery (bran

👉Data pipelines
• Design et développement des jobs spark d’ingestion pour les télémétries et les twins et les données de référence
• Design et développement des jobs spark(mode full-process) de transformation selon les règles de gestion métier et exposition via des tables SQL/Synapse pour les Dashboard PBI
• Design et développement job spark pour l’entité management
• Design et Développement des jobs spark de transformation (mode delta-process) (pipeline d’initialisation + pipeline delta-process)
• Design et Développement des pipelines data pour les tables agrégées : pipeline préparation golden-data, pipeline calcul d’agrégation (Daily, Monthly, Weekly), pipeline d’exposition des tables agrégées
• Optimisation des jobs de transformation

👉Data stack
• Intégration de Azure Synapse avec l’ARM sur la platforme de données
• Upgrade des versions spark (projet spark + run-time spark)
• Dimensionnement du Sparkpool selon le cas d’usage pour le run-time des pipelines data
• Configuration du transfert des logs spark vers log Analytics
• Mise en place du monitoring pour les pipelines data/spark
• Intégration delta Lake au niveau des jobs spark et implémentation de la pipeline Vaccum
Spark Scala Microsoft Azure Azure DevOps PySpark Git Gitflow CI/CD ARM Azure Synapse
Ynov Campus
Juré et évaluateur - Projet de fin d'études (Data & AI)
EDUCATION & E-LEARNING
août 2023 - septembre 2023 (1 mois)
J'ai intervenu en tant que professionnel de la donnée afin d'évaluer les soutenances des projets de fin d'études (Bac+5) Data et intelligence artificiel
Française des Jeux
Data engineer
DIVERTISSEMENTS & LOISIRS
janvier 2019 - mars 2021 (2 ans et 2 mois)
Data Engineer au sein de l’équipe DataLake

👉Data Pipelines
👉👉Traitement Batch :
• Design et développement des jobs d’ingestion Spark/scala
• Design et développement des jobs Spark/scala de la RGPD (Génération de clés, cryptage, droit à l’oublie)
• Design et Développement des DAG Airflow pour les jobs d’ingestion (RGPD conforme)
• Développement des formules Salt pour la création des Tables et Vues Hive
• Développement des formules Salt pour la création des Tables Phoenix/Hbase
• Développement du job Spark pour le compactage des blocs HDFS de petite taille
👉👉Traitement streaming :
• Développement des workflow Nifi pour la collecte des events (données référentielles sport) puis buffering dans topic kafka et traitement en Spark streaming ainsi que la restitution dans Hbase
• Développement d’un job Spark streaming pour l’enrichissement des alertes sport par les données référentielles

👉Data stack
Modélisation et implémentation de la couche batch du DataLake sur l’env de DEV
• Modélisation et implémentation de la plateforme data science (Jupyter, Hue) sur l’env de DEV
• Modélisation et implémentation de la couche speed(nifi/kafka/elastic) du DataLake sur l’env de DEV et Pre-prod
• Etude et Migration du DataLake Prod (couche batch) vers un nouveau VLAN
• Développement/MEP des Formules Salt pour l’arrêt et démarrage de l’ensemble des services de la couche batch
• Développement/MEP des formules Salt pour le test unitaire des services de la couche batch du DataLake
• Troubleshooting et Correction des Anomalies et incidents

👉Industialisation Data science
• Développement d’un modèle de projet data science pyspark industrialisé (projet modulaire + test unitaire + CI/CD)
• Démo pour les data scientiste sur l’industrialisation de la Data science
Spark PySpark Scala setuptools Python Anaconda Hadoop Apache Kafka ELK RGPD Conformité RGPD Openstack Infrastructure as code Saltstack logisland Hive Gitlab CI/CD Git Gitflow Docker

Consulter toutes les expériences de Mohammed

Soyez le premier à recommander Mohammed

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master 2 Data mining
Université lyon 2
2017
Ingénieur génie informatique - option génie logiciel
Ecole nationale d'informatique et d'analyse des systèmes
2016

Consultez la formation qu'a suivie Mohammed

Building Resilient Streaming Systems on Google Cloud Platform
coursera
2018
https://www.coursera.org/account/accomplishments/verify/JXQBX6ANHDG6
Serverless Machine Learning with Tensorflow on Google Cloud Platform
coursera
2018
https://www.coursera.org/account/accomplishments/verify/65WA9H9VRWEK

Les certifications de Mohammed sont accessibles uniquement aux membres Malt

Mohammed T.

Senior Data engineer (Python-SQL-Spark-Scala)

À propos de Mohammed

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories