Szczegóły publikacji

Opis bibliograficzny

Fast prediction of job execution times in the ALICE grid through GPU-based inference with quantization and sparsity techniques / Tomasz LELEK, Szymon MAZUREK, Maciej WIELGOSZ, Bartosz BALIŚ // W: Computational Science – ICCS 2025 : 25th international conference : Singapore, Singapore, July 7–9, 2025 : proceedings, Pt. 4 / eds. Michael H. Lees [et al.]. — Cham : Springer Nature Switzerland, cop. 2025. — (Lecture Notes in Computer Science ; ISSN 0302-9743 ; LNCS 15906). — ISBN: 978-3-031-97634-6; e-ISBN: 978-3-031-97635-3. — S. 97–105. — Bibliogr., Abstr. — Publikacja dostępna online od: 2026-07-06. — Sz. Mazurek, M. Wielgosz - dod. afiliacja: ACC Cyfronet AGH

Autorzy (4)

Dane bibliometryczne

ID BaDAP161043
Data dodania do BaDAP2025-07-31
DOI10.1007/978-3-031-97635-3_12
Rok publikacji2025
Typ publikacjimateriały konferencyjne (aut.)
Otwarty dostęptak
WydawcaSpringer
KonferencjaInternational Conference on Computational Science 2025
Czasopismo/seriaLecture Notes in Computer Science

Abstract

We propose a latency-optimized neural network model to dynamically predict job execution times for the ALICE experiment at CERN, replacing static Time-To-Live (TTL) allocations. Utilizing Nvidia A100 GPUs, we optimize inference latency via FP16 and INT8 quantization, 2:4 sparsity, quantization-aware training, and graph compilation. Results show that FP16 and sparsity reduce latency for larger batches, while INT8 is optimal for single-sample predictions. For single-sample online inference, static INT8 quantization achieves a median 0.38 ms prediction time, a 1.8x improvement over the 0.71 ms baseline. The model achieves a 1.9-hour RMSE, improving on the 14.23-hour RMSE of current TTL assignments. With sub-40ms inference latency on GPU hardware, this work demonstrates how NN optimization can help achieve performance demands of large-scale distributed computing systems.

Publikacje, które mogą Cię zainteresować

fragment książki
#161036Data dodania: 18.7.2025
Improving object detection quality in football through super-resolution techniques / Karolina Seweryn, Gabriel Chęć, Szymon ŁUKASIK, Anna Wróblewska // W: Computational Science – ICCS 2025 : 25th international conference : Singapore, Singapore, July 7–9, 2025 : proceedings , Pt. 1 / eds. Michael H. Lees [et al.]. — Cham : Springer Nature Switzerland, cop. 2025. — ( Lecture Notes in Computer Science ; ISSN  0302-9743 ; LNCS 15903 ). — ISBN: 978-3-031-97625-4; e-ISBN: 978-3-031-97626-1. — S. 151–163. — Bibliogr., Abstr. — Publikacja dostępna online od: 2025-06-30. — Sz. Łukasik - dod. afiliacja: NASK - National Research Institute, Warsaw
fragment książki
#161046Data dodania: 18.7.2025
Optimizing U-Net architecture using differential evolution for brain tumor segmentation / Shoffan SAIFULLAH, Rafał DREŻEWSKI // W: Computational Science – ICCS 2025 : 25th international conference : Singapore, Singapore, July 7–9, 2025 : proceedings, Pt. 4 / eds. Michael H. Lees [et al.]. — Cham : Springer Nature Switzerland, cop. 2025. — (Lecture Notes in Computer Science ; ISSN 0302-9743 ; LNCS 15906). — ISBN: 978-3-031-97634-6; e-ISBN: 978-3-031-97635-3. — S. 403–411. — Bibliogr., Abstr. — Publikacja dostępna online od: 2025-07-06. — S. Saifullah - dod. afiliacja: Universitas Pembangunan Nasional Veteran Yogyakarta, Yogyakarta, Indonesia