You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Côme ArvisCA

Côme Arvis

Machine Learning Engineer | certifié GCP

800 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Côme

Présentation générale
Data Scientist et Machine Learning Engineer avec huit années d'expérience, dont cinq en freelance. Diplômé de l’École Polytechnique et certifié Professional Machine Learning Engineer par Google Cloud. Co-fondateur de Neuronest, une entreprise de services en Data Science.

Agréé CIR.

Expérience en Startup
J'ai débuté ma carrière dans une startup, me concentrant sur la R&D et la mise en production d'algorithmes proche de l'état de l'art. Dans ce contexte, j'ai porté un intérêt particulier pour l'utilisation du Deep Learning pour le traitement du langage naturel (NLP).

Expérience en Conseil
Je suis ensuite devenu consultant en Data Science dans un cabinet de conseil spécialisé en data. J'ai pu me rapprocher davantage des thématiques métiers et réaliser des projets de bout en bout au sein de différents secteurs d’activité (transport, assurance, énergie, marketing, luxe). J'ai également pu perfectionner mes compétences dans la mise en production des projets réalisés, via notamment les technologies Cloud et les méthodes d'intégration continue.

Enseignement
J'ai enseigné pendant plusieurs années des cours de Deep Learning pour différentes écoles d’ingénieurs, adressé aux étudiants de dernière année.

Compétences en bref
- Machine Learning & Deep Learning, spécialisé en Computer Vision et NLP
- MLOps
- Technologies Cloud
- Intégration Continue

Ce qui me distingue
Je porte un intérêt pour le développement et l'intégration de solutions sur mesure dans un environnement cloud, ainsi qu'une attention particulière sur la maintenabilité et la robustesse de tous les projets sur lesquels je travaille.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Servier
    Senior Data Scientist
    INDUSTRIE PHARMACEUTIQUE
    août 2024 - Aujourd'hui (1 an et 10 mois)
    Suresnes, France
    Rôle :
    o Participation au développement d’un assistant intelligent pour la rédaction médicale via recherche contextuelle et génération LLM
    o Conception d’un système scalable pour comprendre les requêtes, agréger les sources, structurer les réponses
    o Co-construction d’un cadre d’évaluation métier (exactitude, complétude…)
    o Contribution à la modularité du système pour benchmarker facilement modèles et composants

    Détails techniques :
    o Pipeline PDF basé sur Docling, séparant texte/visuels (tables, figures) pour améliorer la recherche
    • Parsing → Chunking → Embedding → Indexation
    • Orchestration via Cloud Workflows, déclenchée par Cloud Storage, Eventarc, Pub/Sub
    o Pipeline RAG agentique : décomposition des requêtes + multi-hop retrieval via LLM + synthèse finale avec citations
    o Plateforme d’évaluation sur Vertex AI Pipelines : déclenchements automatisés, datasets versionnés (GitLab CI + BigQuery), comparaison rapide entre LLMs et rerankers
  • SNCF
    AI Engineer
    TRANSPORTS
    janvier 2024 - juillet 2024 (5 mois)
    Saint-Denis, France
    Rôle :
    o Accompagnement stratégique et technique des différentes initiatives métiers sur l’IA / l’IA Générative
    o Implémentation d’un pattern général de RAG via l’utilisation de services managés Azure et AWS
    o Capitalisation et diffusion des expériences acquises pour enrichir la base de connaissances au sein du CDC Cloud
    o Support stratégique sur l’IA / l’IA générative, cartographie des différentes solutions et architectures


    Initiatives et projets concernés :
    o Chatbot sur une base documentaire contenant des référentiels métiers (textes, figures, tableaux, schémas)
    o Reconnaissance des visages des personnes sur les voies et floutage de ces derniers
    o Aide à la supervision dans la recherche d’informations synthétiques au sein d’une base documentaire en cas d’incident
    LLM Microsoft Azure Amazon Web Services Opensearch RAG
  • Mindlytix
    Machine Learning Engineer
    EDITION DE LOGICIELS
    juillet 2023 - novembre 2023 (5 mois)
    Paris, France
    Rôle :
    o Utilisation et déploiement d’un modèle d’image captioning via un Large Language Model (LLM) multimodal
    o Conception et développement de pipelines de clustering et de classification d’images et de vidéos selon une taxonomie en plusieurs niveaux propre à chaque industrie
    o Design et implémentation d’un data warehouse conçu pour soutenir divers cas d'utilisation métiers
    o Enrichissement de la donnée via l’appel à des API externes, notamment la reconnaissance de célébrités, la détection de labels et de la colorimétrie

    Détails techniques :
    o Traitement des vidéos via la détection puis l’exploitation des keyframes obtenues via l’API GCP Video Intelligence shot change detection
    o Image captioning (image to text) : benchmark des différentes solutions open source puis utilisation du modèle LLaVa basé sur le LLM Vicuna
    o Implémentation des deux principaux modules de la pipeline :
    • Classification en zero-shot des images vers une taxonomie sur deux niveaux propre à chaque industrie. Utilisation de CLIP pour les images brutes et BART préentraîné sur MNLI pour les descriptions obtenues via le image to text
    • Topic modeling sur les images : embedding des descriptions, clustering via HDBSAN et naming automatique des clusters via TF-IDF et Llama 2
    o Déploiement et orchestration des modules sur GCP Vertex AI Pipelines
    o Postprocessing et agrégation des résultats sur BigQuery via l’utilisation de dbt
    Python LLM Google cloud Vertex AI Clustering

Recommandations

Jean-David FiquetJF
MP
Jean-David Fiquet et 1 autre personne recommandent Côme

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 Data Science
    École Polytechnique
    2017
    Sujets : • Machine Learning - from Theory to Practice • Optimization for Data Science • Methods for Big Data Analytics • Deep Learning • Data Camp • Learning for Text and Graph Data • Big Data Frameworks • Structured Data - Learning, Prediction, Dependency, Testing • Machine Learning - Business case • Systems for Big Data Analytics
  • Diplôme d'ingénieur
    ECE Paris
    2017
    Systèmes d'information, Cybersécurité et Big Data

Certifications

Compétences

Catégories