Label-Attention Transformer with Geometrically Coherent Objects for Image Captioning (original) (raw)

Text-Guided Attention Model for Image Captioning

Minsu Cho

2017

View PDFchevron_right

Imageability- and Length-controllable Image Captioning

Yasutomo Kawanishi

IEEE Access, 2021

View PDFchevron_right

Image Captioning using Deep Learning

Vrushali Pagire

International Journal for Research in Applied Science and Engineering Technology, 2020

View PDFchevron_right

Data-driven image captioning via salient region discovery

Ruken Cakici

IET Computer Vision, 2017

View PDFchevron_right

Image Captioning Using Deep Learning and NLP Techniques

Sahilpreet Singh

International Journal for Research in Applied Science and Engineering Technology

View PDFchevron_right

On combining image features and word embeddings for image captioning

Marcin Iwanowski

Annals of Computer Science and Information Systems

View PDFchevron_right

IMAGE CAPTIONING USING TRANSFORMER: VISIONAID

IRJET Journal

IRJET, 2022

View PDFchevron_right

Text-to-Image Synthesis Based on Machine Generated Captions

Carlo Tasso

Communications in Computer and Information Science, 2020

View PDFchevron_right

TransforMatcher: Match-to-Match Attention for Semantic Correspondence

Minsu Cho

2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2022

View PDFchevron_right

Image Captioning using Multiple Transformers for Self-Attention Mechanism

Shikha Dubey

ArXiv, 2021

View PDFchevron_right

Crossmodal spatial attention

Charles Spence

Annals of the New York Academy of Sciences, 2010

View PDFchevron_right

Video captioning using transformer network

Soumya Varma

THE 2ND UNIVERSITAS LAMPUNG INTERNATIONAL CONFERENCE ON SCIENCE, TECHNOLOGY, AND ENVIRONMENT (ULICoSTE) 2021

View PDFchevron_right

Visual attention for efficient high-fidelity graphics

Veronica Sundstedt

Proceedings of the 21st spring conference on Computer graphics - SCCG '05, 2005

View PDFchevron_right

Image captioning model using attention and object features to mimic human image understanding

Nada Ghneim

Journal of Big Data, 2022

View PDFchevron_right

ACORT: A compact object relation transformer for parameter efficient image captioning

Jia Huei Tan

Neurocomputing, 2022

View PDFchevron_right

Panoptic Segmentation-Based Attention for Image Captioning

Xianfang Sun

Applied Sciences

View PDFchevron_right

Efficient Image Captioning Based on Vision Transformer Models

Samar Elbedwehy

Computers, Materials & Continua

View PDFchevron_right

Human Attention in Image Captioning: Dataset and Analysis

Ali Borji

2019 IEEE/CVF International Conference on Computer Vision (ICCV)

View PDFchevron_right

A Position-Aware Transformer for Image Captioning

Amr Tolba

Computers, Materials & Continua

View PDFchevron_right

Longer Version for "Deep Context-Encoding Network for Retinal Image Captioning

Marcel Worring

arXiv (Cornell University), 2021

View PDFchevron_right

Enhanced Modality Transition for Image Captioning

Yadan Luo

arXiv (Cornell University), 2021

View PDFchevron_right

Multimodal Image Captioning for Marketing Analysis

Rene Schallner

2018 IEEE Conference on Multimedia Information Processing and Retrieval (MIPR)

View PDFchevron_right

Image Caption Generator Using Attention Based Neural Networks

Ashwini Mahendiran

International Journal for Research in Applied Science and Engineering Technology, 2023

View PDFchevron_right

Crowdsourcing Thumbnail Captions via Time-Constrained Methods

Amama Mahmood

27th International Conference on Intelligent User Interfaces

View PDFchevron_right

Deep Learning based, a New Model for Video Captioning

Sümeyye turan

International Journal of Advanced Computer Science and Applications, 2020

View PDFchevron_right

Inserting Faces inside Captions: Image Captioning with Attention Guided Merging

Yannis Tevissen

2024

View PDFchevron_right

Geometry-aware Relational Exemplar Attention for Dense Captioning

Julius Wang

1st International Workshop on Multimodal Understanding and Learning for Embodied Applications - MULEA '19, 2019

View PDFchevron_right

Attention to Form and Meaning Revisited

Nina Moreno

Language Learning, 2008

View PDFchevron_right

Encoder-Decoder Based Long Short-Term Memory (LSTM) Model for Video Captioning

TOSIN IGE

arXiv (Cornell University), 2023

View PDFchevron_right

IRJET- Image Captioning using Attention Mechanism with ResNet, VGG and Inception Models

IRJET Journal

IRJET, 2020

View PDFchevron_right

End-to-End Attention-based Image Captioning

mahak sarin

ArXiv, 2021

View PDFchevron_right

Transformative Fusion: Vision Transformers and GPT-2 Unleashing New Frontiers in Image Captioning within Image Processing

IJIREM JOURNAL

International Journal of Innovative Research in Engineering and Management (IJIREM), 2023

View PDFchevron_right

Deep learning for image captioning: an encoder-decoder architecture with soft attention

Mario Gómez Martínez

2019

View PDFchevron_right

Integrated text and image understanding for document understanding

Deborah Dahl

Proceedings of the workshop on Human Language Technology - HLT '94, 1994

View PDFchevron_right

Label-Attention Transformer with Geometrically Coherent Objects for Image Captioning (original) (raw)

Related papers