Cross-language information retrieval models based on latent topic models trained with document-aligned comparable corpora

Abstract In this paper, we study different applications of cross-language latent topic models trained on comparable corpora. The first focus lies on the task of cross-language information retrieval (CLIR). The Bilingual Latent Dirichlet allocation model (BiLDA) allows us to create an interlingual, l...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Vulić, Ivan [verfasserIn]

De Smet, Wim

Moens, Marie-Francine

Format:

E-Artikel

Sprache:

Englisch

Erschienen:

2012

Schlagwörter:

Cross-language information retrieval

Unsupervised cross-language lexicon extraction

Probabilistic latent topic models

Evidence-rich retrieval models

Anmerkung:

© Springer Science+Business Media, LLC 2012

Übergeordnetes Werk:

Enthalten in: Information Retrieval Journal - Dordrecht [u.a.] : Springer Science + Business Media B.V., 1999, 16(2012), 3 vom: 05. Mai, Seite 331-368

Übergeordnetes Werk:

volume:16 ; year:2012 ; number:3 ; day:05 ; month:05 ; pages:331-368

Links:

Volltext

DOI / URN:

10.1007/s10791-012-9200-5

Katalog-ID:

SPR013242334

Nicht das Richtige dabei?

Schreiben Sie uns!