Unsupervised document structure analysis of digital scientific articles

Abstract Text mining and information retrieval in large collections of scientific literature require automated processing systems that analyse the documents’ content. However, the layout of scientific articles is highly varying across publishers, and common digital document formats are optimised for...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Klampfl, Stefan [verfasserIn]

Granitzer, Michael [verfasserIn]

Jack, Kris [verfasserIn]

Kern, Roman [verfasserIn]

Format:

E-Artikel

Sprache:

Englisch

Erschienen:

2014

Schlagwörter:

Document structure analysis

Machine learning

Clustering

PDF extraction

Text mining

Übergeordnetes Werk:

Enthalten in: International journal on digital libraries - Berlin : Springer, 1997, 14(2014), 3-4 vom: 08. Juni, Seite 83-99

Übergeordnetes Werk:

volume:14 ; year:2014 ; number:3-4 ; day:08 ; month:06 ; pages:83-99

Links:

Volltext

DOI / URN:

10.1007/s00799-014-0115-1

Katalog-ID:

SPR007876505

Nicht das Richtige dabei?

Schreiben Sie uns!