Effect of garbage collection in iterative algorithms on Spark: an experimental analysis

Abstract Spark is one of the most widely used systems for the distributed processing of big data. Its performance bottlenecks are mainly due to the network I/O, disk I/O, and garbage collection. Previous studies quantitatively analyzed the performance impact of these bottlenecks but did not focus on...
Ausführliche Beschreibung

Gespeichert in:
Autor*in:

Kang, Minseo [verfasserIn]

Lee, Jae-Gil [verfasserIn]

Format:

E-Artikel

Sprache:

Englisch

Erschienen:

2020

Schlagwörter:

Spark

Garbage collection

Iterative algorithms

Distributed processing

Storage level

Übergeordnetes Werk:

Enthalten in: The journal of supercomputing - Dordrecht [u.a.] : Springer Science + Business Media B.V, 1987, 76(2020), 9 vom: 16. Jan., Seite 7204-7218

Übergeordnetes Werk:

volume:76 ; year:2020 ; number:9 ; day:16 ; month:01 ; pages:7204-7218

Links:

Volltext

DOI / URN:

10.1007/s11227-020-03150-z

Katalog-ID:

SPR040477894

Nicht das Richtige dabei?

Schreiben Sie uns!