Naključni procesi in signali

Študij: Elektrotehnika, UN 3 stopnja

Predavatelj: izr. prof. dr. Vitomir Štruc


Cilji predmeta

Cilj predmeta je seznaniti študenta z naprednimi metodami obravnave naključnih procesov in obdelave naključnih signalov. Posebej bodo obravnavani primeri iz obdelave govornih in slikovnih signalov.

Vsebina

Vsebina predmeta se predstavi tekom predavanj, ki so razdeljena v naslednje vsebinske sklope:

  • Uvod: definicija naključnega procesov in signalov; uvedba ključnih matematičnih orodij verjetnostnega računa in statistike.
  • Obdelava naključnih signalov: časovna in vzorčna povprečja, filtriranje naključnih signalov (Winnerjev in Kalmanov filter), ocenjevanje verjetnostnih porazdelitev (postopki »Expectation-Maximization« (EM), »Maximum A Posteriori« (MAP) in »Maximum Likelihood Linear Regression« (MLLR)).
  • Modeliranje stacionarnih in nestacionarnih naklučnih procesov: Gaussov proces, Poissonov proces, Gauss-Markov proces, Opis nestacionarnih procesov s Prikritimi Markovovimi modeli (HMM), nevronskimi mrežami z dolgim kratkoročnim spominom (LSTM), konvolucijskimi mrežami (CNN), rekurzivnimi mrežami.
  • Primeri modeliranja tvorjenja, percepcije in obdelave govornega signala: model tvorjenja govora »vir-filter«, perceptivini model in dekonvolucija govornega signala, časovno-frekvenčne parametrične predstavitve govornega signala, detekcija govornega signala, modeliranje govornega signala s HMM.
  • Obdelava in modeliranje slikovnih signalov z nevronskimi mrežami, generativni problemi obdelave slik, prevladujoče topologije konvolucijskih mrež, predstavitev problemov obdelave slikovnih signalov za globoko učenje

Literatura

  • Robert M.G., Lee D.D. (2004) An Introduction to Statistical Signal Processing. Cambridge University Press
  • Shlomo E. (2007) Random signals and noise: a mathematical introduction. CRC Press
  • Rabiner L., Schafer R. (2010) Theory and Applications of Digital Speech Processing. Prentince Hall
  • Pieraccini R. (2012) The Voice in the Machine: Building Computers That Understand Speech. MIT Press
  • Gonzales R. C., Woods, R.E. (2007) Digital Image Processing, 3 izdaja, Prentice Hall.
  • Goodfellow, I., Bengio, Y., Courville, A. and Bengio, Y. (2016) Deep learning (Vol. 1). Cambridge: MIT press.