Szczegóły publikacji

Opis bibliograficzny

Underwater image enhancement with deep learning: a MOS-guided, multi-criteria loss function approach — Ulepszanie obrazów podwodnych z użyciem głębokiego uczenia: podejście z wielokryterialną funkcją strat sterowaną wynikami MOS / Mehr Un NISA, Lallouani Bouchakour, Dawid JUSZKA, Yi Zhang, Mikołaj LESZCZUK // Przegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne ; ISSN 1230-3496. — 2025 — R. 98 nr 4, s. 503–506. — Bibliogr. s. 506, Streszcz., Abstr. — Błędny zapis nazwiska: Mehrunnisa. — KRiT 2025 : Konferencja Radiokomunikacji i Teleinformatyki : Gdańsk, 10–12 września 2025

Autorzy (5)

Słowa kluczowe

EN: MSE LPIPS Learned Perceptual Image Patch Similarity mean opinion scores mean squared error SSIM Structural Similarity Index Measure MOS

PL: średni błąd kwadratowy MSE LPIPS MOS średnia ocena subiektywna uczona percepcyjna miara podobieństwa łatek obrazu strukturalny indeks podobieństwa SSIM

Dane bibliometryczne

ID BaDAP	161992
Data dodania do BaDAP	2025-09-04
Tekst źródłowy	URL
DOI	10.15199/59.2025.4.115
Rok publikacji	2025
Typ publikacji	referat w czasopiśmie
Otwarty dostęp
Creative Commons
Czasopismo/seria	Przegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne

Abstract

This study proposes a deep learning-based framework for underwater image enhancement. We utilized an encoder-decoder generator optimized through a composite loss function. Conventional pixel-wise loss functions, such as Mean Squared Error (MSE), often result in blurred output and suboptimal perceptual quality. To address these limitations, we have introduced a multicriteria loss function that integrates MSE with perceptual similarity measures such as the Learned Perceptual Image Patch Similarity (LPIPS) and the Structural Similarity Index Measure (SSIM). The relative weights of each component are systematically adjusted using Mean Opinion Scores (MOS) to better align the optimization process with human visual perception. Empirical evaluations show that the proposed method significantly improves visual fidelity and structural accuracy. Our model achieves a high SSIM score of 0.95, validating the effectiveness of the model in underwater image enhancement.

Streszczenie

Artykuł przedstawia oparty na głębokim uczeniu framework do ulepszania obrazów podwodnych. Zastosowano generator typu enkoder–dekoder trenowany przy użyciu złożonej, wielokryterialnej funkcji strat. Konwencjonalny pikselowy błąd średniokwadratowy (MSE) czesto prowadzi do rozmytych rezultatów i niskiej jakości percepcyjnej. Dlatego zaproponowana funkcja strat łączy MSE z percepcyjnymi miarami podobieństwa LPIPS i SSIM. Wagi poszczególnych składników są dobierane na podstawie średnich ocen subiektywnych (MOS), dzięki czemu proces optymalizacji lepiej odzwierciedla ludzką percepcję wzrokową. Badania eksperymentalne pokazują, że proponowane rozwiązanie istotnie poprawia zarówno wierność wizualną, jak i dokładność strukturalną; model osiągnął średni SSIM równy 0,95, co potwierdza jego skuteczność w zadaniu ulepszania obrazów podwodnych.