ČÍSLICOVÉ SPRACOVANIE REČI
Školský rok 2021/2022
Školský rok 2021/2022
Cieľom predmetu je, aby študent nadobudol prehľad a porozumenie technológiám používaným v oblasti spracovania reči. Po úspešnom absolvovaní predmetu sa študent naučí špecifické vlastnosti rečových signálov v čase a frekvencií a bude schopný používať základné parametrizácie signálu na jeho analýzu ako: prechody nulou, autokorelácia,AMDF, banky filtrov, LPC model reči, MFCC koeficienty a ich modifikácie. Bude vedieť realizovať jednoduché systémy spracovania reči typu rozpoznanie a verifikácie hovoriaceho, rozpoznanie reči, syntéza reči, kompresia reči, a to s využitím nasledovných techník: K-NN, VQ, GMM, DTW, HMM a NN. Okrem teoretických poznatkov. Študent získa aj praktické skúsenosti s používaním spomenutých metód na reálnych dátach, ktoré sa dajú použiť aj v iných oblastiach.
Osoba zodpovedná za predmet: Doc. Ing. Juraj Kačur, PhD., juraj.kacur@stuba.sk
Úvod do spracovania reči a aplikácie spracovania reči.
Vlastnosti rečových signálov v čase a frekvencií.
Základné parametrizácie rečových signálov.
Modely tvorby reči LPC analýza.
Banky filtrov, psychoakustické frekvenčné mierky.
MFCC koeficienty a ich modifikácie.
Vektorová kvantizácia.
Gaussov zmesový model.
Rozpoznávanie reči: Dynamické programovanie, algoritmus DTW.
Rozpoznávanie reči: Diskrétne skryté Markovove modely.
Rozpoznávanie reči: Spojité skryté Markovove modely.
Rozpoznávanie reči : Založené na Neurónových sieťach.
Aktívna účasť na cvičeniach, úspešné odovzdanie semestrálneho zadania a úspešné absolvovanie skúšky.
Celková známka na skúške bude odvodená od bodového vyjadrenia nasledovne:
Cvičenia 40 bodov (semestrálne zadanie 40 bodov), minimálny počet bodov pre pripustenie na skúšku je 20 a je podmienený max. 2 ospravedlnenými absenciami.
Písomná skúška 60 bodov.
Minimálny celkový počet bodov pre absolvovanie predmetu je 56.
Základné:
PSUTKA, J. Komunikace s počítačem mluvenou rečí. Praha : Academia, 1995.
KOTULIAKOVÁ, J. – ROZINAJ, G. Číslicové spracovanie signálov 1. Bratislava : Vyd. FABER, 1996. 163 s. ISBN 80-967503-2-1.
Odporúčaná:
E. Keller, Fundamentals of Speech Synthesis and Speech Recognition, John Wiley&Sons, 1994
G. Rozinaj, J. Polec, J. Kotuliaková, P. Podhradský, A. Marček, S. Merchevský a kolektív : Číslicové spracovanie signálov II, FABER Bratislava, 1997
X. D. Huang, Y. Ariki, M. A. Jack, Hidden Markov Models for Speech Recognition, Edinburg university press, 1990