You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Jean-Christophe CazesJC

Jean-Christophe Cazes

Data Scientist, Msc Statistics and ML

750 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Jean-Christophe

Je suis diplômé d'un Master de Mathématiques spécialité Statistiques et Machine Learning de l'Université Paris 6.

J'ai travaillé sur de nombreux modèles allant du traitement de texte (NLP, NLU) à la vision par ordinateur (Computer Vision) ainsi que sur des modèles beaucoup plus statistiques (notamment séries temporelles) au cours de mes expériences avec des résultats qui ont été actionnables pour l'entreprise.

Mes expériences vont du projet de R&D de détection de fraude sur la blockchain, en passant par un modèle de détection de doublons dans les annonces de Seloger par analyse de textuelle et des photo jusqu'à la transformation d'un site d'annonce à une marketplace par des modèles de scoring.

Ma curiosité me pousse a essayer énormément et à itérer rapidement afin de trouver une solution qui satisfaisante et élégante

Je suis un Data Scientist qui sait s'adapter aux différentes stacks technologiques, aux environnements nouveaux et travailler avec les différents métiers et surtout je suis passionné par ce que je fais!
  • Français

    Bilingue ou natif

En télétravail uniquement
Travaille majoritairement à distance

Expériences

  • Onfido
    Data Scientist
    septembre 2022 - Aujourd'hui (3 ans et 9 mois)
    Paris, France
  • Groupe SeLoger
    Data Scientist
    IMMOBILIER
    décembre 2019 - septembre 2022 (2 ans et 9 mois)
    Île-de-France, France
    Travail d'identification de biens immobiliers au sein des annonces:

    Elaboration de modèles de Machine Learning dans un contexte de graphes avec mesures de similarité (MinHashing LSH, Bucketed RandomProjection LSH)
    Utilisation de modèles de représentation de textes (BERT, camemBERT) et Transport Optimal entre représentations
    Utilisation de modèles basés sur la similarité d'images (SIFT, ResNet, Faiss, NetVlad)
    Calculs parallélisés et traitement de volumes de données important sur AWS avec Spark
    Mise en production de modèle
    Analyse Business de la fraude aux duplicats d'annonces

    Travail sur la modélisation de la performance annonce:

    Mise en place de tests statistiques et inférence
    Usage de méthodes de bootstrapping, estimation par méthodes de Monte Carlo
    Modélisation par séries temporelles, modèles autorégressifs
    Analyse canonique des corrélations
    Analyse et segmentation des marchés par méthodes statistiques
    Aggrégation de métriques (Modélisation par Expert Advice Problem)

    Produit BoostExtend:
    Modélisation de la visibilité et de la compétitivité des marchés immobiliers des annonces par méthodes statistiques
    Développement, Analyse Offline et Industrialisation de 3 Produits : Boost Performance
    Proof Product, Boost Recommender System et Boost Performance Prediction à l'aide de notre
    modèle de visibilité

    Operationnal Lead de la Team Scoring AVIV

    Lead Valuation Model:
    Modélisation de la valeur incrémentale d'un lead sur les sites immobiliers du Groupe AVIV par modèle probabiliste.

    Lead Opérationnel sur son implémentation:
    Montée en compétence de l'équipe
    Segmentation du marché immobilier allemand et son évaluation
    Estimation du nombre de leads avant transaction immobilière au sein des segments
    Calcul de la valeur incrémentale d'un lead pour chaque annonce
    Modélisation de la tension des marchés immobiliers à partir du modèle Property Identification
    Sélection les annonces les plus pertinentes à mettre en avant et Marketing Mix Modelling à l'aide de celle-ci.
  • Nexeo Groupe
    Stage Machine Learning
    BANQUE & ASSURANCES
    avril 2019 - octobre 2019 (6 mois)
    Machine Learning dans la Blockchain au sein du Nex' Lab
    (Graphes, Apprentissage Semi Supervisé, Analyse Statistique de Graphes, AML KYC)

    Stage de fin d’études sur la détection de schémas de Ponzi sur la blockchain ETHEREUM et
    regroupement d’adresses frauduleuses via des modèles de Machine Learning (NLP / Deep Learning / Analyse Statistique de Graphes)

    Réalisations:

    Requêtes, Parsing et Preprocessing des données
    Optimisation des calculs lors du prétraitement des données
    Analyse statistique de la distribution des données
    Elaboration de modèles de Machine Learning dans un contexte d’imbalanced dataset et
    d’apprentissage semi-supervisé sur des graphes
    Déploiement de calculs parallélisés dans un contexte de volume de données important sur Google
    Cloud Platform avec Spark

    Environnement:
    Git (flow), numpy, Python, Pandas, Scikit-Learn, Tensorflow 2.0, keras, graph-tool, networkx, SMOTE,
    node2vec, word2vec, nltk

Recommandations

Soyez le premier à recommander Jean-Christophe

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 (M2), Mathématiques, Statistiques et Machine Learning
    Université Pierre et Marie Curie
    2019
    Master 2 (M2), Mathématiques, Statistiques et Machine Learning
  • Master 1, Mathématiques et Applications
    Université Pierre et Marie Curie
    2018
    Master 1, Mathématiques et Applications

Compétences (7)

Catégories