Description

Je suis diplômé d'un Master de Mathématiques spécialité Statistiques et Machine Learning de l'Université Paris 6.

J'ai travaillé sur de nombreux modèles allant du traitement de texte (NLP, NLU) à la vision par ordinateur (Computer Vision) ainsi que sur des modèles beaucoup plus statistiques (notamment séries temporelles) au cours de mes expériences avec des résultats qui ont été actionnables pour l'entreprise.

Mes expériences vont du projet de R&D de détection de fraude sur la blockchain, en passant par un modèle de détection de doublons dans les annonces de Seloger par analyse de textuelle et des photo jusqu'à la transformation d'un site d'annonce à une marketplace par des modèles de scoring.

Ma curiosité me pousse a essayer énormément et à itérer rapidement afin de trouver une solution qui satisfaisante et élégante

Je suis un Data Scientist qui sait s'adapter aux différentes stacks technologiques, aux environnements nouveaux et travailler avec les différents métiers et surtout je suis passionné par ce que je fais!

Langues

Français
Bilingue ou natif

Préférences en matière de lieu de travail

En télétravail uniquement

Travaille majoritairement à distance

Onfido
Data Scientist
septembre 2022 - Aujourd'hui (3 ans et 9 mois)
Paris, France
Groupe SeLoger
Data Scientist
IMMOBILIER
décembre 2019 - septembre 2022 (2 ans et 9 mois)
Île-de-France, France
Travail d'identification de biens immobiliers au sein des annonces:

Elaboration de modèles de Machine Learning dans un contexte de graphes avec mesures de similarité (MinHashing LSH, Bucketed RandomProjection LSH)
Utilisation de modèles de représentation de textes (BERT, camemBERT) et Transport Optimal entre représentations
Utilisation de modèles basés sur la similarité d'images (SIFT, ResNet, Faiss, NetVlad)
Calculs parallélisés et traitement de volumes de données important sur AWS avec Spark
Mise en production de modèle
Analyse Business de la fraude aux duplicats d'annonces

Travail sur la modélisation de la performance annonce:

Mise en place de tests statistiques et inférence
Usage de méthodes de bootstrapping, estimation par méthodes de Monte Carlo
Modélisation par séries temporelles, modèles autorégressifs
Analyse canonique des corrélations
Analyse et segmentation des marchés par méthodes statistiques
Aggrégation de métriques (Modélisation par Expert Advice Problem)

Produit BoostExtend:
Modélisation de la visibilité et de la compétitivité des marchés immobiliers des annonces par méthodes statistiques
Développement, Analyse Offline et Industrialisation de 3 Produits : Boost Performance
Proof Product, Boost Recommender System et Boost Performance Prediction à l'aide de notre
modèle de visibilité

Operationnal Lead de la Team Scoring AVIV

Lead Valuation Model:
Modélisation de la valeur incrémentale d'un lead sur les sites immobiliers du Groupe AVIV par modèle probabiliste.

Lead Opérationnel sur son implémentation:
Montée en compétence de l'équipe
Segmentation du marché immobilier allemand et son évaluation
Estimation du nombre de leads avant transaction immobilière au sein des segments
Calcul de la valeur incrémentale d'un lead pour chaque annonce
Modélisation de la tension des marchés immobiliers à partir du modèle Property Identification
Sélection les annonces les plus pertinentes à mettre en avant et Marketing Mix Modelling à l'aide de celle-ci.
Nexeo Groupe
Stage Machine Learning
BANQUE & ASSURANCES
avril 2019 - octobre 2019 (6 mois)
Machine Learning dans la Blockchain au sein du Nex' Lab
(Graphes, Apprentissage Semi Supervisé, Analyse Statistique de Graphes, AML KYC)

Stage de fin d’études sur la détection de schémas de Ponzi sur la blockchain ETHEREUM et
regroupement d’adresses frauduleuses via des modèles de Machine Learning (NLP / Deep Learning / Analyse Statistique de Graphes)

Réalisations:

Requêtes, Parsing et Preprocessing des données
Optimisation des calculs lors du prétraitement des données
Analyse statistique de la distribution des données
Elaboration de modèles de Machine Learning dans un contexte d’imbalanced dataset et
d’apprentissage semi-supervisé sur des graphes
Déploiement de calculs parallélisés dans un contexte de volume de données important sur Google
Cloud Platform avec Spark

Environnement:
Git (flow), numpy, Python, Pandas, Scikit-Learn, Tensorflow 2.0, keras, graph-tool, networkx, SMOTE,
node2vec, word2vec, nltk

Consulter toutes les expériences de Jean-Christophe

Soyez le premier à recommander Jean-Christophe

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master 2 (M2), Mathématiques, Statistiques et Machine Learning
Université Pierre et Marie Curie
2019
Master 2 (M2), Mathématiques, Statistiques et Machine Learning
Master 1, Mathématiques et Applications
Université Pierre et Marie Curie
2018
Master 1, Mathématiques et Applications

Consultez la formation qu'a suivie Jean-Christophe

Data Scientist

Jean-Christophe Cazes

Data Scientist, Msc Statistics and ML

À propos de Jean-Christophe

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences (7)

Catégories