You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Reb M.RM

Reb M.

Data Scientist

400 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Reb

I am eager to design and implement solutions using the forefront of technology. I am Interested by Big Data problematic, I attach importance to contribute to open-source projects.
Self-reliant in applying math and machine-learning techniques in a business context, making data-driven decisions. Creative and deadline-driven person.

Specialties:
Distributed systems, Spark/Hadoop, Event-Processing/Streaming/Batch, Machine Learning,
Big Data Analytics, Communication, Data-Driven Decision Making, Statistical Modeling.
  • Français

    Capacité professionnelle complète

  • Anglais

    Capacité professionnelle complète

  • Arabe

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km), Puteaux (jusqu’à 80 km)

Expériences

  • Atlas Finance Solutions | Talan
    Consultante Big data
    AGENCE & SSII
    juillet 2018 - juin 2019 (11 mois)
    Tunis, Tunisie
    Amélioration et maintenance d’une plateforme big data sur Hortonworks (HDP) pour la détection des cyberattaques en temps réel en analysant le trafic réseau.
    Tâches effectuées :
    ▪ Collection et ingestion des données:
    o Capture des données à la volée à l’aide de wireshark
    o Stockage des données en format texte en local
    o Communication automatique entre l’outil de messagerie Kafka et wireshark
    o Création et exécution des scripts avec Cron sous Linux
    ▪ Traitement des données en temps réel :
    o Re-configuration d’apache Storm pour améliorer le parallélisme (nombre de Workers, d’exécuteurs Spout et Bolt et de tâches)
    o Modification et Création des nouveaux bolts storm afin d'améliorer la performance de la plateforme
    o Implémentation des nouveaux algorithmes pour la détection des attaques à la plateforme codée en Java8
    o Ajout d’une fonctionnalité, en Python 3, de machine Learning et NLP (analyse sémantique) qui permet de détecter la validité d’un DNS
    o Gestion d’adéquation entre les librairies python et la plateforme Big Data au niveau déploiement
    o Création d’une Topologie apache Storm en mode production pour la plateforme Big data
    ▪ Stockage des résultats:
    o Gestion de stockage synchronisé Storm et HBase
    o Utilisation Apache Phoenix pour requêtage analytique coté HBase
    o Veiller à ce que les résultats sont bien stockés dans HBase
    ▪ Maîtrise de la distribution Hortonworks HDP déployée sur Microsoft Azure
    ▪ Maîtrise Linux : commandes et des scripts Shell
    ▪ Administration et supervision de l’infrastructure Big Data
    Apache Kafka hdfs Spark Apache Spark MLlib Elasticsearch Hortonworks HDP Spark Streaming Linux
  • Elitech
    Consultante Big data
    TÉLÉCOMMUNICATIONS
    juillet 2019 - Aujourd'hui (6 ans et 11 mois)
    Montrouge, France
    Réalisation d’une solution Big data sur Cloudera (CDH) qui permet de faire la correspondance entre des offres d'emploi disponibles sur Internet et les compétences des candidats de Elitech. Ce projet permet d’aider les recruteurs de Elitech dans l’étape de pré-sélection des candidats.
    Tâches effectuées : Collection et ingestion des données:
    o Exécution quotidienne de code de web Scrapping pour la collecte des offres d'emploi.
    o Ingestion des données capturées en format Json vers HDFS sur la plateforme Big Data Cloudera.
    o Alimentation automatique de tables Hive.
    ▪ Traitement des données en lots:
    o Extraire les données stockées en HDFS à l'aide de Spark.
    o Transformation des données en appliquant des opérations de nettoyage et d'agrégation.
    o Indexation des offres de travail avec Elasticsearch pour faciliter la recherche de données dans leurs contenus.
    o Analyse du contenu des offres de travail.
    o Stockage des résultats dans des tables Hive interrogeables par Impala sous Cloudera.
    o Correspondance automatique avec les CV des candidats qui sont déposés sur HDFS.
    ▪ Reporting
    o Affichage des indicateurs à l'aide des outils de reporting PowerBI Desktop et Tableau software.

    Cloudera Spark Scala Elasticsearch Microsoft Power BI Tableau software Linux Hive

Recommandations

Soyez le premier à recommander Reb

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Diplôme National d’Ingénieur en Informatique
    enicarthage
    2018

Certifications

  • IBM Data Science Professional Certificate
    coursera
    2017
  • Python for Data Science : Coursera Data science and Analytics Intro
    coursera
    2017

Compétences

Catégories