Szczegóły publikacji
Opis bibliograficzny
Underwater image enhancement with deep learning: a MOS-guided, multi-criteria loss function approach — Ulepszanie obrazów podwodnych z użyciem głębokiego uczenia: podejście z wielokryterialną funkcją strat sterowaną wynikami MOS / Mehr Un NISA, Lallouani Bouchakour, Dawid JUSZKA, Yi Zhang, Mikołaj LESZCZUK // Przegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne ; ISSN 1230-3496. — 2025 — R. 98 nr 4, s. 503–506. — Bibliogr. s. 506, Streszcz., Abstr. — Błędny zapis nazwiska: Mehrunnisa. — KRiT 2025 : Konferencja Radiokomunikacji i Teleinformatyki : Gdańsk, 10–12 września 2025
Autorzy (5)
- AGHNisa Mehr Un
- Bouchakour Lallouani
- AGHJuszka Dawid
- Zhang Yi
- AGHLeszczuk Mikołaj
Słowa kluczowe
Dane bibliometryczne
| ID BaDAP | 161992 |
|---|---|
| Data dodania do BaDAP | 2025-09-04 |
| Tekst źródłowy | URL |
| DOI | 10.15199/59.2025.4.115 |
| Rok publikacji | 2025 |
| Typ publikacji | referat w czasopiśmie |
| Otwarty dostęp | |
| Creative Commons | |
| Czasopismo/seria | Przegląd Telekomunikacyjny, Wiadomości Telekomunikacyjne |
Abstract
This study proposes a deep learning-based framework for underwater image enhancement. We utilized an encoder-decoder generator optimized through a composite loss function. Conventional pixel-wise loss functions, such as Mean Squared Error (MSE), often result in blurred output and suboptimal perceptual quality. To address these limitations, we have introduced a multicriteria loss function that integrates MSE with perceptual similarity measures such as the Learned Perceptual Image Patch Similarity (LPIPS) and the Structural Similarity Index Measure (SSIM). The relative weights of each component are systematically adjusted using Mean Opinion Scores (MOS) to better align the optimization process with human visual perception. Empirical evaluations show that the proposed method significantly improves visual fidelity and structural accuracy. Our model achieves a high SSIM score of 0.95, validating the effectiveness of the model in underwater image enhancement.
Streszczenie
Artykuł przedstawia oparty na głębokim uczeniu framework do ulepszania obrazów podwodnych. Zastosowano generator typu enkoder–dekoder trenowany przy użyciu złożonej, wielokryterialnej funkcji strat. Konwencjonalny pikselowy błąd średniokwadratowy (MSE) czesto prowadzi do rozmytych rezultatów i niskiej jakości percepcyjnej. Dlatego zaproponowana funkcja strat łączy MSE z percepcyjnymi miarami podobieństwa LPIPS i SSIM. Wagi poszczególnych składników są dobierane na podstawie średnich ocen subiektywnych (MOS), dzięki czemu proces optymalizacji lepiej odzwierciedla ludzką percepcję wzrokową. Badania eksperymentalne pokazują, że proponowane rozwiązanie istotnie poprawia zarówno wierność wizualną, jak i dokładność strukturalną; model osiągnął średni SSIM równy 0,95, co potwierdza jego skuteczność w zadaniu ulepszania obrazów podwodnych.