Szczegóły publikacji
Opis bibliograficzny
Wykorzystanie techniki obliczeń neuronowych do przetwarzania i rozpoznawania sygnałów mowy — Applying the neural network technique to transforming and recognition of speech signals / Marcin KAPUSTA, Mirosław GAJER, Adel Shomali // Pomiary, Automatyka, Kontrola / Stowarzyszenie Inżynierów i Techników Mechaników Polskich. Sekcja Metrologii, Polskie Stowarzyszenie Pomiarów Automatyki i Robotyki POLSPAR ; ISSN 0032-4140. — 2000 — nr 7, s. 16–18. — Bibliogr. s. 18, Streszcz., Abstr. — A. Shomali - afiliacja: Motorola
Autorzy (3)
- AGHKapusta Marcin
- AGHGajer Mirosław
- Shomali Adel
Dane bibliometryczne
| ID BaDAP | 4265 |
|---|---|
| Data dodania do BaDAP | 2001-04-18 |
| Tekst źródłowy | URL |
| Rok publikacji | 2000 |
| Typ publikacji | artykuł w czasopiśmie |
| Otwarty dostęp | |
| Creative Commons | |
| Czasopismo/seria | Pomiary Automatyka Kontrola |
Streszczenie
Sygnał mowy posiada bardzo skomplikowaną naturę, która sprawia że jego zobrazowanie oraz dalsza analiza bez operacji wstępnego przetworzenia sygnałów są trudne i nie zawsze przynoszą pożądane efekty. Wcześniej sygnał mowy przedstawiany był w postaci wideogramów, będących wykresami czasowo-częstotliwościowymi, jednakże analiza tych obrazów nie była łatwa ze względu na ich trudną interpretację. W pracy niniejszej zaproponowano wykorzystanie sieci neuronowej Kohonena do generacji obrazów sygnałów mowy patologicznej, wystepującej u dzieci z rozszczepem podniebienia. Opisano sposób przekształcenia sygnału mowy do postaci macierzy widm chwilowych, stanowiącej zbiór danych wejściowych dla układu sieci neuronowej Kohonena. Następnie omówiono metodę generacji obrazu przez sieć neuronową oraz zaprezentowano przykladowe obrazy pozyskanych sygnałów mowy.
Abstract
The nature of speech signal is very complicated, that causes that its visualisation and further analysis, without some in intial pre-processing, is very complicated and doesnát always bring the desired effects. Speech signal in most cases in represented by videograms. The analysis of these forms of signal visualisation is not easy because of difficulties in their interpretation. In this article the usage of Kohonen neural network for visualising speech signals uttered by children with a cleft palate was proposed. Speech signal is converted to its spectrum matrices representation, which constitues the input for Kohonen neural network. Further a method for generating a simplified form of speech signal (a poly-line figure) based on the networkásoutput was presented. In addition a method for pathological speech signal recognition was presented. The results based on utterances obtained from children with a cleft palate were presented.