You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mohammed T.MT

Mohammed T.

Senior Data engineer (Python-SQL-Spark-Scala)

725 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Mohammed

Bienvenue sur mon profil Malt 🙂!

Data engineer avec plus de 6 ans d'expériences, j'ai travaillé pour diverses grandes entreprises telles que le Groupe Seb, Sanofi, FDJ, Atos.
Ma mission est d'aider mes clients à concevoir et développer leur modèle de données, pipelines de données et l'architecture de données🛢⚙📊.

Ce que je peux faire pour vous autour de la data de manière industrielle:

👉 Ingestion de la donnée
J'implémente des jobs/pipelines qui vont ingérer vos données quelque soit le volume et le format(csv, json, avro...), je peux aussi ingérer vos données en étant conforme à la RGPD.

👉Transformation et Agrégation de la donnée
J'implémente des jobs/pipelines qui vont filtrer, nettoyer, transformer, enrichir vos données afin d'offrir de la donnée exploitable.
J'implémente aussi des calculs d'agrégation pour vos KPI.

👉Exposition de la donnée
Des scripts seront industrialisé pour exposer vos données sous forme de vue ou table SQL, Hive(ces tables constituerons votre Datawarehouse)

👉Architecture de données
Je conseille et accompagne pour la mise en place de votre data plateforme(architecture de stockage et de traitement)

👉Industrialisation data science

N'hésitez pas à me contacter 🙂!





  • Français

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 20 km), Lyon (jusqu’à 20 km)

Expériences

  • Groupe Seb
    Data engineer
    DIVERTISSEMENTS & LOISIRS
    avril 2021 - Aujourd'hui (5 ans et 2 mois)
    Au sein de l'équipe PCM (Professional coffee machine) je suis amené à concevoir et implémenter des pipelines data et jobs spark afin d'alimenter le datawarhouse et construire des Dashboard/rapports dataviz pour les différents clients qui utilsent ces machines à café pro.

    👉Data engineering tech lead
    • Interface avec l’équipe backend pour gérer les changements au niveau de la source de données et anticiper les impacts techniques
    • Accompagnement des nouveaux DE entrants
    • Rédaction des technical story
    • Pair programming
    • Révision des pull request
    • Release delivery (bran

    👉Data pipelines
    • Design et développement des jobs spark d’ingestion pour les télémétries et les twins et les données de référence
    • Design et développement des jobs spark(mode full-process) de transformation selon les règles de gestion métier et exposition via des tables SQL/Synapse pour les Dashboard PBI
    • Design et développement job spark pour l’entité management
    • Design et Développement des jobs spark de transformation (mode delta-process) (pipeline d’initialisation + pipeline delta-process)
    • Design et Développement des pipelines data pour les tables agrégées : pipeline préparation golden-data, pipeline calcul d’agrégation (Daily, Monthly, Weekly), pipeline d’exposition des tables agrégées
    • Optimisation des jobs de transformation

    👉Data stack
    • Intégration de Azure Synapse avec l’ARM sur la platforme de données
    • Upgrade des versions spark (projet spark + run-time spark)
    • Dimensionnement du Sparkpool selon le cas d’usage pour le run-time des pipelines data
    • Configuration du transfert des logs spark vers log Analytics
    • Mise en place du monitoring pour les pipelines data/spark
    • Intégration delta Lake au niveau des jobs spark et implémentation de la pipeline Vaccum
    Spark Scala Microsoft Azure Azure DevOps PySpark Git Gitflow CI/CD ARM Azure Synapse
  • Ynov Campus
    Juré et évaluateur - Projet de fin d'études (Data & AI)
    EDUCATION & E-LEARNING
    août 2023 - septembre 2023 (1 mois)
    J'ai intervenu en tant que professionnel de la donnée afin d'évaluer les soutenances des projets de fin d'études (Bac+5) Data et intelligence artificiel
  • Française des Jeux
    Data engineer
    DIVERTISSEMENTS & LOISIRS
    janvier 2019 - mars 2021 (2 ans et 2 mois)
    Data Engineer au sein de l’équipe DataLake

    👉Data Pipelines
    👉👉Traitement Batch :
    • Design et développement des jobs d’ingestion Spark/scala
    • Design et développement des jobs Spark/scala de la RGPD (Génération de clés, cryptage, droit à l’oublie)
    • Design et Développement des DAG Airflow pour les jobs d’ingestion (RGPD conforme)
    • Développement des formules Salt pour la création des Tables et Vues Hive
    • Développement des formules Salt pour la création des Tables Phoenix/Hbase
    • Développement du job Spark pour le compactage des blocs HDFS de petite taille
    👉👉Traitement streaming :
    • Développement des workflow Nifi pour la collecte des events (données référentielles sport) puis buffering dans topic kafka et traitement en Spark streaming ainsi que la restitution dans Hbase
    • Développement d’un job Spark streaming pour l’enrichissement des alertes sport par les données référentielles

    👉Data stack
    Modélisation et implémentation de la couche batch du DataLake sur l’env de DEV
    • Modélisation et implémentation de la plateforme data science (Jupyter, Hue) sur l’env de DEV
    • Modélisation et implémentation de la couche speed(nifi/kafka/elastic) du DataLake sur l’env de DEV et Pre-prod
    • Etude et Migration du DataLake Prod (couche batch) vers un nouveau VLAN
    • Développement/MEP des Formules Salt pour l’arrêt et démarrage de l’ensemble des services de la couche batch
    • Développement/MEP des formules Salt pour le test unitaire des services de la couche batch du DataLake
    • Troubleshooting et Correction des Anomalies et incidents

    👉Industialisation Data science
    • Développement d’un modèle de projet data science pyspark industrialisé (projet modulaire + test unitaire + CI/CD)
    • Démo pour les data scientiste sur l’industrialisation de la Data science
    Spark PySpark Scala setuptools Python Anaconda Hadoop Apache Kafka ELK RGPD Conformité RGPD Openstack Infrastructure as code Saltstack logisland Hive Gitlab CI/CD Git Gitflow Docker

Recommandations

Soyez le premier à recommander Mohammed

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 Data mining
    Université lyon 2
    2017
  • Ingénieur génie informatique - option génie logiciel
    Ecole nationale d'informatique et d'analyse des systèmes
    2016

Certifications

Compétences

Catégories