Tony W. - ECIR 2026 | LinkedIn (original) (raw)
About
🧑🏻‍💻 Core Team Researcher at H Company
🔬 Research interests: multimodal LLMs…
Experience & Education
ECIR 2026
View Tony’s full experience
See their title, tenure and more.
Licenses & Certifications
Courses
Algorithmique et Complexité / Algorithms and Complexity
-
Automatique / Automation
-
BigData & Santé / BigData & Health
-
Cloud computing et informatique distribuée / Cloud computing and distributed information
-
Convergence, Intégrales, Probabilités / Convergence, Integers, Probabilities
-
Economie / Economy
-
Energie Electrique / Electrical Energy
-
Equations aux Dérivées Partielles / Partiel Derivative Equation
-
Finance d'Entreprise / Finance
-
Gestion d'Entreprise / Management
-
Ingénierie des Ondes / Wave Engineering
-
Intelligence Artificielle et Reinforcement Learning / Artificial Intelligence and Reinforcement Learning
-
Introduction au Droit / Introduction to Law
-
Machine Learning
-
Modélisation des Systèmes Complexes / Modeling of Complex Systems
-
Mécanique des Milieux Continus / Continuum Mechanics
-
Optimisation / Optimization
-
Optimisation de Systèmes de Transport Passagers / Optimization of Passenger Transport Systems
-
Philosophie / Philosophy
-
Physique Quantique et Statistique / Quantum & Statistical Physics
-
Programmation et Systèmes d'Information / Programming and Information Systems
-
Propagation Virale & Epidémiologie / Viral Propagation & Epidemiology
-
Science des Transferts / Fluid Mechanics
-
Social Science: Defying authority / Science Humaines et Sociales: Défier l'autorité
-
Sociologie des Organisations / Sociology of Organizations
-
Statistiques & Apprentissage / Statistics & Learning
-
Stratégie Marketing Organisation / Strategy Marketing Organization
-
Systèmes critiques à logiciels prépondérants / Critical systems with preponderant software
-
Traitement du Signal / Signal Processing
-
Projects
ColPali: Efficient Document Retrieval with Vision Language Models
May 2024 - Jun 2024
Research work that has lead to the submission of a paper to EMNLP. The paper introduces a groundbreaking approach to large-scale visual document analysis. By leveraging Vision Language Models (VLMs), we have created a new framework for document retrieval that's both powerful and efficient.
Other creators
May 2023 - Aug 2023
• Distilled ASR Whisper model. Obtained a 19x smaller model with 95% of the original model's performance.
• Implemented continual learning with Elastic Weight Consolidation for fine-tuning multilingual Whisper. Reduced WER on non-English out-of-distribution by 25% compared to vanilla fine-tuning.
Jan 2023 - Apr 2023
• Replicated the Conditional Neural Processes and the Neural Processes papers by Garnelo et al.
• Worked on Gaussian Processes-based regression and image completion using Tensorflow
• Prepared and presented an academic poster on Neural Processes
Other creators
Oct 2020 - Jun 2021
In different parts of the world, hospitals were full and it was very difficult to handle the number of new cases each day. That’s why, it is so important to make accurate predictions about the number of new cases. With this project, we are trying to explore new ways of predicting the evolution of the virus. We are using non-medical data in various manners to predict this evolution.
My work involved gathering more precise and frequent insightful data by analyzing local newspaper articles…
In different parts of the world, hospitals were full and it was very difficult to handle the number of new cases each day. That’s why, it is so important to make accurate predictions about the number of new cases. With this project, we are trying to explore new ways of predicting the evolution of the virus. We are using non-medical data in various manners to predict this evolution.
My work involved gathering more precise and frequent insightful data by analyzing local newspaper articles in Colorado. I used newspaper3k and Question Answering to extract the number of cases and deaths and used the date and the name of the local to obtain the approximated temporal and geographical data. I also used Sentiment Analysis in order to get a temporal and geographical evolution of the global emotion from each journal and used it as a proxy for the feelings of the locals. Eventually, I handled Topic Modelling with gensim in order to analyze the sentiment data with respect to each found topic (e.g., hospital overload, economic downturn, …).
Other creators
Mar 2021 - Apr 2021
Le projet présenté est un travail réalisé dans le cadre du cours d'Optimisation de Systèmes de Transport Passagers à CentraleSupélec. Nous sommes arrivés en 1ère place parmi 16 groupes de 5 élèves chacun après un vote du jury et du public.
Objectifs
- Le projet vise à résoudre un problème d'optimisation visant à placer des passagers dans un avion de ligne de telle sorte à maximiser la satisfaction client tout en respectant un lot de consignes de sécurité obligatoires
- Un second…
Le projet présenté est un travail réalisé dans le cadre du cours d'Optimisation de Systèmes de Transport Passagers à CentraleSupélec. Nous sommes arrivés en 1ère place parmi 16 groupes de 5 élèves chacun après un vote du jury et du public.
Objectifs
- Le projet vise à résoudre un problème d'optimisation visant à placer des passagers dans un avion de ligne de telle sorte à maximiser la satisfaction client tout en respectant un lot de consignes de sécurité obligatoires
- Un second objectif est bien évidemment de résoudre le problème en un temps minimum.
Other creators
Dec 2020 - Jan 2021
This project is the work of the GroundTruth team for the Kaggle Challenge of the Machine Learning course at CentraleSupélec. Our team ended up 6th out of 61 teams.
Description of the challenge:
We often face the problem of searching meaningful emails from thousands of promotional emails. This challenge focuses on creating a multi-label classifier that can classify an email into eight classes based on the metadata extracted from the email.
Other creators
Dec 2020 - Dec 2020
L’étude de cas présente pour client une entreprise française opérant principalement en région parisienne du nom de LivraisonCo. Le CEO de cette firme désire optimiser le processus de livraison de colis. La première étape consistait à prédire l’état de trafic, puis dans un deuxième temps d'exploiter cette donnée pour définir une stratégie d’optimisation. Avec une équipe de profils diversifiés, nous avons commencé par définir nos objectifs et à spécifier le besoin. Sur le plan technique, nous…
L’étude de cas présente pour client une entreprise française opérant principalement en région parisienne du nom de LivraisonCo. Le CEO de cette firme désire optimiser le processus de livraison de colis. La première étape consistait à prédire l’état de trafic, puis dans un deuxième temps d'exploiter cette donnée pour définir une stratégie d’optimisation. Avec une équipe de profils diversifiés, nous avons commencé par définir nos objectifs et à spécifier le besoin. Sur le plan technique, nous avons fait un nettoyage des données et une intégration de données externes jugées utiles (météo, mesures sanitaires…) puis un test de différents modèles naïfs et complexes qui ont fourni des résultats variables. Enfin, nous avons décidé du modèle à garder et avons généré les prédictions demandées du 11 décembre au 16 décembre 2020.
Ce Datathon résulte d'une collaboration entre BCG Gamma et CentraleSupélec.
Other creators
-
See project Time Constraints of TCAS II - Critical systems with preponderant software
Nov 2020 - Nov 2020
The volume of air traffic in the airspace is increasing rapidly so that a major efficiency overhaul to manage air traffic flows is warranted to maintain normal operation. The new procedures needed to satisfy this requirement have to increase capacity without affecting safety. Safety has to be analyzed considering that operations are the result of interactions between many entities (e.g., group of aircraft) and at multiple locations.
In such cases, a system known as the Airborne Collision…
The volume of air traffic in the airspace is increasing rapidly so that a major efficiency overhaul to manage air traffic flows is warranted to maintain normal operation. The new procedures needed to satisfy this requirement have to increase capacity without affecting safety. Safety has to be analyzed considering that operations are the result of interactions between many entities (e.g., group of aircraft) and at multiple locations.
In such cases, a system known as the Airborne Collision Avoidance System (ACAS, also called TCAS) comes into action to avoid collision. This one-week long project focuses on modeling and verifying time constraints of TCAS II.
Other creators
Nov 2020 - Nov 2020
This project is a 2nd-year project for the elective course "Introduction to Blockchain" at CentraleSupélec.
It aims to implement a secure blockchain system that could be used to trace medecine in order to bring more transaprency and security to the supply chain. It allows to:
- Append transactions to the blockchain using Proof of Work
- Identify transactions with elliptic curve signature
- Check if the current chain is valid
- Solve conflicts by replacing the current…
This project is a 2nd-year project for the elective course "Introduction to Blockchain" at CentraleSupélec.
It aims to implement a secure blockchain system that could be used to trace medecine in order to bring more transaprency and security to the supply chain. It allows to:
- Append transactions to the blockchain using Proof of Work
- Identify transactions with elliptic curve signature
- Check if the current chain is valid
- Solve conflicts by replacing the current chain with the longest one in the network
- And more!
It also features a web-based frontend that allows the client to easily interact with the blockchain :
- Create wallets (a wallet is a container for private and public keys)
- Add new transactions while checking that they are possible
NB: To add initial items in the blockchain process, use the admin keys
- Fetch and display the current blocks
- Track the transaction history of a given batch.
Other creators
-
See project Projet Analyse et Intégration de données du projet « Milieu Intérieur », coordonné par l’Institut Pasteur
Jun 2020 - Jun 2020
Le projet « Milieu Intérieur », coordonné par l’Institut Pasteur, a été développé pour mieux comprendre la diversité des réactions immunes au sein de la population dans le but plus large de contribuer au développement de la médecine de précision.
Dans le cadre de ce projet, une cohorte de 1000 individus a été constituée et plusieurs grands jeux de données ont été générés, notamment des données socio-démographiques et cliniques, des données de composition cellulaires sanguines, ainsi que…
Le projet « Milieu Intérieur », coordonné par l’Institut Pasteur, a été développé pour mieux comprendre la diversité des réactions immunes au sein de la population dans le but plus large de contribuer au développement de la médecine de précision.
Dans le cadre de ce projet, une cohorte de 1000 individus a été constituée et plusieurs grands jeux de données ont été générés, notamment des données socio-démographiques et cliniques, des données de composition cellulaires sanguines, ainsi que des données d’expression géniques dans différentes conditions de stimulation immunes pour chacun des individus.
Durant cette session, il nous a été proposé d’analyser et de croiser ces données entre elles afin d’identifier les facteurs qui différencient les individus dans leurs réponses aux stimulations immunes et éventuellement d’expliquer et de prédire ces réactions. L’objectif a été d’appliquer des méthodes d’analyse statistique descriptives et prédictives afin d’extraire de ces données des informations biologiques pertinentes.
Other creators
Feb 2020 - Jun 2020
While the Internet made it easier to share information, image theft has become a real plague. We decided to go with a 2-step solution involving fine-tuning ResNet-50 on the BAM! dataset and using a random vector LSH strategy for search.
Results:
• 88% accuracy on the validation split of BAM! for the classification task
• The approximate LSH-based image retrieval takes a few seconds against about an hour using the naive exact search.
Other creators
Feb 2020 - Mar 2020
Projet dans le cadre du cours de 1ère année d'Equations Différentielles Partielles (EDP) à CentraleSupélec.
Ce notebook a pour but de montrer la résolution pratique d'Equations Différentielles Partielles avec le module feniCS. Le phénomène physique donnant les le système d'équation est la résonance au sein d'un corps de guitare, donnant naissance à des figures plus connues sous le nom de Figures de Chladni.
Il contient en outre :
- une preuve des équations d'onde qui régissent…
Projet dans le cadre du cours de 1ère année d'Equations Différentielles Partielles (EDP) à CentraleSupélec.
Ce notebook a pour but de montrer la résolution pratique d'Equations Différentielles Partielles avec le module feniCS. Le phénomène physique donnant les le système d'équation est la résonance au sein d'un corps de guitare, donnant naissance à des figures plus connues sous le nom de Figures de Chladni.
Il contient en outre :
- une preuve des équations d'onde qui régissent la formation des Figures de Chladni
- de nombreuses visualisations du phénomène physique
- la prise en compte de défauts aléatoires dans le corps de guitare
- un widget interractif permettant de simuler plus finement les figures.
See project
Projet d'épidémiologie sur le SRAS avec l'Institut Pasteur
Dec 2019 - Dec 2019
Prédiction de l'évolution d'une épidémie et des effets de mesures préventives.
Approches différentielles et stochastiques (algorithme de Gillespie).
Other creators
Nov 2019 - Nov 2019
Création de jeux simples autour de la musique pour que des élèves apprenant le solfège ou/et des instruments puissent développer leur oreille en s'amusant.
Ce projet fait partie de la semaine de CodingWeeks organisée en 1ère année à CentraleSupélec.
Other creators
-
See project TIPE: Etude d'un fibroscope dans le cadre du contrôle non destructif d'un système industriel
Feb 2018 - Jun 2019
Travaux d'Initiative Personnelle Encadrés (TIPE)
Other creators
Honors & Awards
3rd place at the International Conference on Autonomous Systems (ICAS) Challenge from IEEE
IEEE Signal Processing Society
Aug 2021
Tackle the unresolved field today in present autonomous systems which is the autonomous understanding by the observation of the environment. The subject was about the detection of the anomaly of a drone responsible of following a moving subject using video and inertial data.
https://2021.ieee-icas.org/challenge/
Finaliste du Concours Bibliographique De CentraleSupélec
Pôle de Modélisation Mathématique de CentraleSupélec
Apr 2021
Présentation d'un article avec une vidéo de 180 secondes dans un cadre de vulgarisation scientifique.
Article choisi : "Neural Machine Translation By Jointly Learning To Align And Translate" (traite des modèles de réseaux de neurones avec "Attention" utilisés en Natural Language Processing)
Bourse d'excellence de la Fondation Vallet
Fondation Vallet
Dec 2018
Bourse remise aux étudiants émérites en classe préparatoire aux lycées Louis-le-Grand, Henri IV et Jean-Baptiste Say.
Médaille d'argent au concours Kangourou des mathématiques
Concours Kangourou des mathématiques
2010
Classé 25ème sur 82038 classés au concours national de mathématiques des collèges.
Languages
Français
Native or bilingual proficiency
Anglais
Full professional proficiency
Chinois (traditionnel)
Limited working proficiency
Chinois (simplifié)
Limited working proficiency
Allemand
Limited working proficiency
Other similar profiles
Explore top content on LinkedIn
Find curated posts and insights for relevant topics all in one place.