Szczegóły publikacji
Opis bibliograficzny
Zastosowanie sieci Kohonena do rozpoznawania mowy patologicznej — The usage of the Kohonen neural networks for the pathological speech recognition / Marcin KAPUSTA, Mirosław GAJER, Adel Shomali // Pomiary, Automatyka, Kontrola / Stowarzyszenie Inżynierów i Techników Mechaników Polskich. Sekcja Metrologii, Polskie Stowarzyszenie Pomiarów Automatyki i Robotyki POLSPAR ; ISSN 0032-4140. — 2000 — nr 7, s. 10–15. — Bibliogr. s. 14–15, Streszcz., Abstr.
Autorzy (3)
Dane bibliometryczne
| ID BaDAP | 4264 |
|---|---|
| Data dodania do BaDAP | 2001-04-18 |
| Tekst źródłowy | URL |
| Rok publikacji | 2000 |
| Typ publikacji | artykuł w czasopiśmie |
| Otwarty dostęp | |
| Czasopismo/seria | Pomiary Automatyka Kontrola |
Streszczenie
Sygnał mowy posiada bardzo skomplikowana naturę, która sprawia że jago zobrazowanie oraz dalsza analiza bez operacji wstępnego przetworzenia sygnałów są trudne i nie zawsze przynoszą pożądane efekty. W wielu pracach sygnał mowy przedstawiony jest w postaci wideogramów, będących wykresami czsowo-częstotliwościowymi, jednakże analiza tych obrazów nie jest łatwa ze względu na ich trudną interpretację. W pracy niniejszej zaproponowano wykorzystanie sieci neuronowej Kohonena do generacji obrazów sygnałów mowy patologicznej, występujacej u dzieci z rozszczepem podniebienia. Opisano sposób przekształcenia sygnału mowy do postaci macierzy widm chwilowych, stanowiącej zbiór danych wejściowych dla układu sieci neuronowej Kohonena. Nastepnie omówiono metodę generacji obrazu przez sieć neuronową oraz zaproponowano przykladowy obraz pozyskanych sygnałów mowy. Ponadto zaproponowano metodę identyfikacji mowy patologicznej na podstawie otrzymanych obrazów, opierającą się na pomiarze długości linii.
Abstract
The nature of speech signal is very complicated, that causes its visualisation and further analysis, without some initial pre-processing, is very complicated and doesnát always bring the desired effects. Speech signal in most cases is represented by videograms. The analysis of these forms of signal visualisation is not easy because of difficulties is their interpretation. In this article the usage of Kohonen neural network for visualising speech signals uttered by children with a cleft palate, was proposed. Speech signal is converted to its spectrum matrices representation, which in tern constitutes the input for Kohonen neural network. Further a method for generating a simplified form of speech signal (a poly-line figure) based on the networkás output, was discused. In addition , a method for pathological speech signal recognition was proposed. Tests results based on utterances obtained form children with a cleft palate were also presented.