Szczegóły publikacji

Opis bibliograficzny

Underwater image enhancement with deep learning: a MOS-guided, multi-criteria loss function approach — Ulepszanie obrazów podwodnych z użyciem głębokiego uczenia: podejście z wielokryterialną funkcją strat sterowaną wynikami MOS / Mehr Un NISA, Lallouani Bouchakour, Dawid JUSZKA, Yi Zhang, Mikołaj LESZCZUK // Przegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne ; ISSN 1230-3496. — 2025 — R. 98 nr 4, s. 503–506. — Bibliogr. s. 506, Streszcz., Abstr. — Błędny zapis nazwiska: Mehrunnisa. — KRiT 2025 : Konferencja Radiokomunikacji i Teleinformatyki : Gdańsk, 10–12 września 2025

Autorzy (5)

Słowa kluczowe

EN: mean squared errorMSEStructural Similarity Index MeasureMOSLearned Perceptual Image Patch Similaritymean opinion scoresLPIPSSSIM
PL: uczona percepcyjna miara podobieństwa łatek obrazustrukturalny indeks podobieństwaSSIMśrednia ocena subiektywnaMOSLPIPSśredni błąd kwadratowyMSE

Dane bibliometryczne

ID BaDAP161992
Data dodania do BaDAP2025-09-04
Tekst źródłowyURL
DOI10.15199/59.2025.4.115
Rok publikacji2025
Typ publikacjireferat w czasopiśmie
Otwarty dostęptak
Creative Commons
Czasopismo/seriaPrzegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne

Abstract

This study proposes a deep learning-based framework for underwater image enhancement. We utilized an encoder-decoder generator optimized through a composite loss function. Conventional pixel-wise loss functions, such as Mean Squared Error (MSE), often result in blurred output and suboptimal perceptual quality. To address these limitations, we have introduced a multicriteria loss function that integrates MSE with perceptual similarity measures such as the Learned Perceptual Image Patch Similarity (LPIPS) and the Structural Similarity Index Measure (SSIM). The relative weights of each component are systematically adjusted using Mean Opinion Scores (MOS) to better align the optimization process with human visual perception. Empirical evaluations show that the proposed method significantly improves visual fidelity and structural accuracy. Our model achieves a high SSIM score of 0.95, validating the effectiveness of the model in underwater image enhancement.

Streszczenie

Artykuł przedstawia oparty na głębokim uczeniu framework do ulepszania obrazów podwodnych. Zastosowano generator typu enkoder–dekoder trenowany przy użyciu złożonej, wielokryterialnej funkcji strat. Konwencjonalny pikselowy błąd średniokwadratowy (MSE) czesto prowadzi do rozmytych rezultatów i niskiej jakości percepcyjnej. Dlatego zaproponowana funkcja strat łączy MSE z percepcyjnymi miarami podobieństwa LPIPS i SSIM. Wagi poszczególnych składników są dobierane na podstawie średnich ocen subiektywnych (MOS), dzięki czemu proces optymalizacji lepiej odzwierciedla ludzką percepcję wzrokową. Badania eksperymentalne pokazują, że proponowane rozwiązanie istotnie poprawia zarówno wierność wizualną, jak i dokładność strukturalną; model osiągnął średni SSIM równy 0,95, co potwierdza jego skuteczność w zadaniu ulepszania obrazów podwodnych.