RelNet-MAM: Relation Network with Multilevel Attention Mechanism for Image Captioning

Text present in an image contains rich semantic information which is crucial for the understanding of an image. For example, a signboard having the text “deep water” conveys the danger involved in the image. The current image captioning models do not effectively utilize this useful semantic informat...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Srivastava, Swati [verfasserIn]

Sharma, Himanshu [verfasserIn]

Format:

E-Artikel

Sprache:

Englisch

Erschienen:

2023

Schlagwörter:

Attention

Spatial

Image captioning

Multilevel

Semantic

Übergeordnetes Werk:

Enthalten in: Microprocessors and microsystems - Amsterdam [u.a.] : Elsevier, 1979, 102

Übergeordnetes Werk:

volume:102

DOI / URN:

10.1016/j.micpro.2023.104931

Katalog-ID:

ELV065101014

Nicht das Richtige dabei?

Schreiben Sie uns!