New England Computer Vision Workshop (original) (raw)

[34] Binding Touch to Everything: Learning Unified Multimodal Tactile Representations
Fengyu Yang* (Yale University), Chao Feng*, Ziyang Chen*, Hyoungseob Park, Daniel Wang, Yiming Dou, Ziyao Zeng, Xien Chen, Rit Gangopadhyay, Andrew Owens, Alex Wong
[33] DISCount: Counting in Large Image Collections with Detector-Based Importance Sampling
Gustavo Perez (UMass Amherst), Subhransu Maji, Daniel Sheldon
[15] GauFRe: Gaussian Deformation Fields for Real-time Dynamic Novel View Synthesis
Yiqing Liang (Brown University), Numair Khan, Zhengqin Li, Thu Nguyen-Phuoc, Douglas Lanman, James Tompkin, Lei Xiao
[11] AnyHome: Open-Vocabulary Generation of Structured and Textured 3D Homes
Rao Fu (Brown University), Zehao Wen, Zichen Liu, Srinath Sridhar
[01] Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation
William Shen*, Ge Yang* (MIT), Alan Yu, Jansen Wong, Leslie Pack Kaelbling, Phillip Isola
[02] Language-Driven Appearance and Physics Editing via Feature Splatting
Rizhao Qiu*, Ge Yang* (MIT), Weijia Zeng, Xiaolong Wang
[05] Snapshot Lidar: Fourier embedding of amplitude and phase for single-image depth reconstruction
Sarah Friday (Dartmouth College), Yunzi Shi, Yaswanth Kumar Cherivirala, Vishwanath Saragadam, Adithya Pediredla
[06] The GAN is dead; long live the GAN!
Nick Huang (Brown University), Aaron Gokaslan, James Tompkin
[07] Underwater Camera Calibration: N-Sphere Camera Model and Extensions
Monika Roznere (Dartmouth College), Adithya K. Pediredla, Samuel E. Lensgraf, Yogesh Girdhar, and Alberto Quattrini Li
[08] On Human-like Biases in Convolutional Neural Networks for the Perception of Slant from Texture
Yuanhao Wang, Qian Zhang (Brown University), Celine Aubuchon, Jovan Kemp, Fulvio Domini, James Tompkin
[09] Toward Physically-based 360° Intrinsic Decomposition from RGBD Images
Qian Zhang (Brown University), James Tompkin
[13] Direct Superpoints Matching for Robust Point Cloud Registration
Aniket Gupta (Northeastern University), Yiming Xie, Hanumant Singh, Huaizu Jiang
[14] FT2TF: First-Person Statement Text-To-Talking Face Generation
Xingjian Diao (Dartmouth College), Ming Cheng, Wayner Barrios, SouYoung Jin
[18] OmniControl: Control Any Joint at Any Time for Human Motion Generation
Yiming Xie, Varun Jampani, Lei Zhong, Deqing Sun, Huaizu Jiang (Northeastern University)
[19] PlatoNeRF: 3D Reconstruction in Plato’s Cave via Single-View Two-Bounce Lidar
Tzofi Klinghoffer (MIT), Xiaoyu Xiang*, Siddharth Somasundaram*, Yuchen Fan, Christian Richardt, Ramesh Raskar, Rakesh Ranjan
[20] Preserving Tumor Volumes for Unsupervised Medical Image Registration
Qihua Dong (Northeastern University), Hao Du, Ying Song, Yan Xu, Jing Liao
[21] SPASM: Small PArallax Structure from Motion
Fabien Delattre (UMass Amherst), David Dirnfeld, Zhipeng Tang, Pedro Miraldo, Erik Learned-Miller
[22] SurfsUp: learning fluid simulation for novel surfaces
Arjun Mani*, Ishaan Chandratreya* (MIT), Elliot Creager, Carl Vondrick, Richard Zemel
[23] Toward Perceptually-guided Environment-adaptive AR Visualization
Hojung (Ashley) Kwon (Brown University), Yuanbo Li, Xiaohan (Chloe) Ye, Praccho Muna-McQuay, Liuren Yin, James Tompkin
[25] ViHOPE: Visuotactile In-Hand Object 6D Pose Estimation with Shape Completion
Hongyu Li (Brown University), Snehal Dikhale, Soshi Iba, Nawid Jamali
[26] Vision Beyond Borders: Transforming Single-View inputs into Multi-View vision
Mingyuan Zhang (Northeastern University), Chang Liu, Yue Bai, Yun Fu
[27] TASK2BOX: Box Embeddings for Modeling Asymmetric Task Relationships
Rangel Daroya (UMass Amherst), Aaron Sun, Subhransu Maji
[28] Self-supervised Learning using Hypercube Embeddings
Deep Chakraborty (UMass Amherst), Erik Learned-Miller
[29] Rewrite the Stars
Xu Ma (Northeastern University), Xiyang Dai, Yue Bai, Yizhou Wang, Yun Fu
[30] Latent Graph Inference with Limited Supervision
Jianglin Lu (Northeastern University), Yi Xu, Huan Wang, Yue Bai, Yun Fu
[32] FLARE: Film Language and Audiovisual Representation Engine for Movie Audio Description
Wayner Barrios (Dartmouth College), Henry Scheible, SouYoung Jin
[35] A Unified Framework for Domain Adaptive Object Detection
Justin Kay (MIT), Timm Haucke, Suzanne Stathatos, Siqi Deng, Erik Young, Pietro Perona, Sara Beery, Grant Van Horn
[36] Improved Zero-Shot Classification by Adapting VLMs with Text Descriptions
Oindrila Saha, Grant Van Horn, Subhransu Maji (UMass Amherst)
[37] Is CLIP Fooled by Optical Illusions?
Jerry Ngo (MIT), Swami Sankaranarayanan, Phillip Isola
[38] Frame Flexible Network
Yitian Zhang (Northeastern University), Yue Bai, Chang Liu, Huan Wang, Sheng Li, Yun Fu
[39] See Beyond Vision: Layout Trajectory Sequence Prediction From Noisy Mobile Modality
Haichao Zhang (Northeastern University)