Tony W. - ECIR 2026 | LinkedIn (original) (raw)

About

🧑🏻‍💻 Core Team Researcher at H Company
🔬 Research interests: multimodal LLMs…

Experience & Education

View Tony’s full experience

See their title, tenure and more.

Licenses & Certifications

Courses

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

Projects

May 2024 - Jun 2024

Research work that has lead to the submission of a paper to EMNLP. The paper introduces a groundbreaking approach to large-scale visual document analysis. By leveraging Vision Language Models (VLMs), we have created a new framework for document retrieval that's both powerful and efficient.
Other creators

May 2023 - Aug 2023

• Distilled ASR Whisper model. Obtained a 19x smaller model with 95% of the original model's performance.
• Implemented continual learning with Elastic Weight Consolidation for fine-tuning multilingual Whisper. Reduced WER on non-English out-of-distribution by 25% compared to vanilla fine-tuning.

Jan 2023 - Apr 2023

• Replicated the Conditional Neural Processes and the Neural Processes papers by Garnelo et al.
• Worked on Gaussian Processes-based regression and image completion using Tensorflow
• Prepared and presented an academic poster on Neural Processes
Other creators

Oct 2020 - Jun 2021

In different parts of the world, hospitals were full and it was very difficult to handle the number of new cases each day. That’s why, it is so important to make accurate predictions about the number of new cases. With this project, we are trying to explore new ways of predicting the evolution of the virus. We are using non-medical data in various manners to predict this evolution.
My work involved gathering more precise and frequent insightful data by analyzing local newspaper articles…
In different parts of the world, hospitals were full and it was very difficult to handle the number of new cases each day. That’s why, it is so important to make accurate predictions about the number of new cases. With this project, we are trying to explore new ways of predicting the evolution of the virus. We are using non-medical data in various manners to predict this evolution.
My work involved gathering more precise and frequent insightful data by analyzing local newspaper articles in Colorado. I used newspaper3k and Question Answering to extract the number of cases and deaths and used the date and the name of the local to obtain the approximated temporal and geographical data. I also used Sentiment Analysis in order to get a temporal and geographical evolution of the global emotion from each journal and used it as a proxy for the feelings of the locals. Eventually, I handled Topic Modelling with gensim in order to analyze the sentiment data with respect to each found topic (e.g., hospital overload, economic downturn, …).
Other creators

Mar 2021 - Apr 2021

Le projet présenté est un travail réalisé dans le cadre du cours d'Optimisation de Systèmes de Transport Passagers à CentraleSupélec. Nous sommes arrivés en 1ère place parmi 16 groupes de 5 élèves chacun après un vote du jury et du public.
Objectifs
- Le projet vise à résoudre un problème d'optimisation visant à placer des passagers dans un avion de ligne de telle sorte à maximiser la satisfaction client tout en respectant un lot de consignes de sécurité obligatoires
- Un second…
Le projet présenté est un travail réalisé dans le cadre du cours d'Optimisation de Systèmes de Transport Passagers à CentraleSupélec. Nous sommes arrivés en 1ère place parmi 16 groupes de 5 élèves chacun après un vote du jury et du public.
Objectifs
- Le projet vise à résoudre un problème d'optimisation visant à placer des passagers dans un avion de ligne de telle sorte à maximiser la satisfaction client tout en respectant un lot de consignes de sécurité obligatoires
- Un second objectif est bien évidemment de résoudre le problème en un temps minimum.
Other creators

Dec 2020 - Jan 2021

This project is the work of the GroundTruth team for the Kaggle Challenge of the Machine Learning course at CentraleSupélec. Our team ended up 6th out of 61 teams.
Description of the challenge:
We often face the problem of searching meaningful emails from thousands of promotional emails. This challenge focuses on creating a multi-label classifier that can classify an email into eight classes based on the metadata extracted from the email.
Other creators

Dec 2020 - Dec 2020

L’étude de cas présente pour client une entreprise française opérant principalement en région parisienne du nom de LivraisonCo. Le CEO de cette firme désire optimiser le processus de livraison de colis. La première étape consistait à prédire l’état de trafic, puis dans un deuxième temps d'exploiter cette donnée pour définir une stratégie d’optimisation. Avec une équipe de profils diversifiés, nous avons commencé par définir nos objectifs et à spécifier le besoin. Sur le plan technique, nous…
L’étude de cas présente pour client une entreprise française opérant principalement en région parisienne du nom de LivraisonCo. Le CEO de cette firme désire optimiser le processus de livraison de colis. La première étape consistait à prédire l’état de trafic, puis dans un deuxième temps d'exploiter cette donnée pour définir une stratégie d’optimisation. Avec une équipe de profils diversifiés, nous avons commencé par définir nos objectifs et à spécifier le besoin. Sur le plan technique, nous avons fait un nettoyage des données et une intégration de données externes jugées utiles (météo, mesures sanitaires…) puis un test de différents modèles naïfs et complexes qui ont fourni des résultats variables. Enfin, nous avons décidé du modèle à garder et avons généré les prédictions demandées du 11 décembre au 16 décembre 2020.
Ce Datathon résulte d'une collaboration entre BCG Gamma et CentraleSupélec.
Other creators

Nov 2020 - Nov 2020

The volume of air traffic in the airspace is increasing rapidly so that a major efficiency overhaul to manage air traffic flows is warranted to maintain normal operation. The new procedures needed to satisfy this requirement have to increase capacity without affecting safety. Safety has to be analyzed considering that operations are the result of interactions between many entities (e.g., group of aircraft) and at multiple locations.
In such cases, a system known as the Airborne Collision…
The volume of air traffic in the airspace is increasing rapidly so that a major efficiency overhaul to manage air traffic flows is warranted to maintain normal operation. The new procedures needed to satisfy this requirement have to increase capacity without affecting safety. Safety has to be analyzed considering that operations are the result of interactions between many entities (e.g., group of aircraft) and at multiple locations.
In such cases, a system known as the Airborne Collision Avoidance System (ACAS, also called TCAS) comes into action to avoid collision. This one-week long project focuses on modeling and verifying time constraints of TCAS II.
Other creators

Nov 2020 - Nov 2020

This project is a 2nd-year project for the elective course "Introduction to Blockchain" at CentraleSupélec.
It aims to implement a secure blockchain system that could be used to trace medecine in order to bring more transaprency and security to the supply chain. It allows to:
- Append transactions to the blockchain using Proof of Work
- Identify transactions with elliptic curve signature
- Check if the current chain is valid
- Solve conflicts by replacing the current…
This project is a 2nd-year project for the elective course "Introduction to Blockchain" at CentraleSupélec.
It aims to implement a secure blockchain system that could be used to trace medecine in order to bring more transaprency and security to the supply chain. It allows to:
- Append transactions to the blockchain using Proof of Work
- Identify transactions with elliptic curve signature
- Check if the current chain is valid
- Solve conflicts by replacing the current chain with the longest one in the network
- And more!
It also features a web-based frontend that allows the client to easily interact with the blockchain :
- Create wallets (a wallet is a container for private and public keys)
- Add new transactions while checking that they are possible
NB: To add initial items in the blockchain process, use the admin keys
- Fetch and display the current blocks
- Track the transaction history of a given batch.
Other creators

Jun 2020 - Jun 2020

Le projet « Milieu Intérieur », coordonné par l’Institut Pasteur, a été développé pour mieux comprendre la diversité des réactions immunes au sein de la population dans le but plus large de contribuer au développement de la médecine de précision.
Dans le cadre de ce projet, une cohorte de 1000 individus a été constituée et plusieurs grands jeux de données ont été générés, notamment des données socio-démographiques et cliniques, des données de composition cellulaires sanguines, ainsi que…
Le projet « Milieu Intérieur », coordonné par l’Institut Pasteur, a été développé pour mieux comprendre la diversité des réactions immunes au sein de la population dans le but plus large de contribuer au développement de la médecine de précision.
Dans le cadre de ce projet, une cohorte de 1000 individus a été constituée et plusieurs grands jeux de données ont été générés, notamment des données socio-démographiques et cliniques, des données de composition cellulaires sanguines, ainsi que des données d’expression géniques dans différentes conditions de stimulation immunes pour chacun des individus.
Durant cette session, il nous a été proposé d’analyser et de croiser ces données entre elles afin d’identifier les facteurs qui différencient les individus dans leurs réponses aux stimulations immunes et éventuellement d’expliquer et de prédire ces réactions. L’objectif a été d’appliquer des méthodes d’analyse statistique descriptives et prédictives afin d’extraire de ces données des informations biologiques pertinentes.
Other creators

Feb 2020 - Jun 2020

While the Internet made it easier to share information, image theft has become a real plague. We decided to go with a 2-step solution involving fine-tuning ResNet-50 on the BAM! dataset and using a random vector LSH strategy for search.
Results:
• 88% accuracy on the validation split of BAM! for the classification task
• The approximate LSH-based image retrieval takes a few seconds against about an hour using the naive exact search.
Other creators

Feb 2020 - Mar 2020

Projet dans le cadre du cours de 1ère année d'Equations Différentielles Partielles (EDP) à CentraleSupélec.
Ce notebook a pour but de montrer la résolution pratique d'Equations Différentielles Partielles avec le module feniCS. Le phénomène physique donnant les le système d'équation est la résonance au sein d'un corps de guitare, donnant naissance à des figures plus connues sous le nom de Figures de Chladni.
Il contient en outre :
- une preuve des équations d'onde qui régissent…
Projet dans le cadre du cours de 1ère année d'Equations Différentielles Partielles (EDP) à CentraleSupélec.
Ce notebook a pour but de montrer la résolution pratique d'Equations Différentielles Partielles avec le module feniCS. Le phénomène physique donnant les le système d'équation est la résonance au sein d'un corps de guitare, donnant naissance à des figures plus connues sous le nom de Figures de Chladni.
Il contient en outre :
- une preuve des équations d'onde qui régissent la formation des Figures de Chladni
- de nombreuses visualisations du phénomène physique
- la prise en compte de défauts aléatoires dans le corps de guitare
- un widget interractif permettant de simuler plus finement les figures.
See project

Dec 2019 - Dec 2019

Prédiction de l'évolution d'une épidémie et des effets de mesures préventives.
Approches différentielles et stochastiques (algorithme de Gillespie).
Other creators

Nov 2019 - Nov 2019

Création de jeux simples autour de la musique pour que des élèves apprenant le solfège ou/et des instruments puissent développer leur oreille en s'amusant.
Ce projet fait partie de la semaine de CodingWeeks organisée en 1ère année à CentraleSupélec.
Other creators

Feb 2018 - Jun 2019

Travaux d'Initiative Personnelle Encadrés (TIPE)
Other creators

Honors & Awards

IEEE Signal Processing Society

Aug 2021
Tackle the unresolved field today in present autonomous systems which is the autonomous understanding by the observation of the environment. The subject was about the detection of the anomaly of a drone responsible of following a moving subject using video and inertial data.
https://2021.ieee-icas.org/challenge/

Pôle de Modélisation Mathématique de CentraleSupélec

Apr 2021
Présentation d'un article avec une vidéo de 180 secondes dans un cadre de vulgarisation scientifique.
Article choisi : "Neural Machine Translation By Jointly Learning To Align And Translate" (traite des modèles de réseaux de neurones avec "Attention" utilisés en Natural Language Processing)

Fondation Vallet

Dec 2018
Bourse remise aux étudiants émérites en classe préparatoire aux lycées Louis-le-Grand, Henri IV et Jean-Baptiste Say.

Concours Kangourou des mathématiques

2010
Classé 25ème sur 82038 classés au concours national de mathématiques des collèges.

Languages

Native or bilingual proficiency

Full professional proficiency

Limited working proficiency

Limited working proficiency

Limited working proficiency

Other similar profiles

Explore top content on LinkedIn

Find curated posts and insights for relevant topics all in one place.

View top content

Add new skills with these courses