Πληροφορίες
Κωδικός Μαθήματος EIP220
Εξάμηνο 2ο
Κατηγορία Επιλογής
Μονάδες ECTS 7
Eclass Μαθήματος
Διδάσκων

Σγάρμπας Κ.
Φακωτάκης Ν.

Προτεινόμενη Βιβλιογραφία
  • Deller, J., J. Proakis, and J. Hansen. “Discrete-Time Processing of Speech Signals”. New York: Macmillan, 1993.
  • Gersho, A. and R. M. Gray. “Vector Quantization and Signal Compression”. Boston: Kluwer, 1992.
  • Jayant, N. S. and P. Noll. “Digital Coding of Waveforms: Principles and Applications to Speech and Video”. Signal Processing Series, ed.A. V. Oppenheim. Englewood Cliffs: Prentice-Hall, 1984.
  • Kleijn, W. B. and K. K. Paliwal, ed. “Speech Coding and Synthesis”. Amsterdam: Elsevier, 1995.
  • Lee, C.-H., F. K. Soong, and K. K. Paliwal, ed. “Automatic Speech & Speaker Recognition: Advanced Topics. International Series in Engineering & Computer Science, Natural Language Processing & Machine Translation: Multimedia Systems & Applications”. Boston:Kluwer Academic Publishers, 1996.
  • Owens, F. J. “Signal Processing of Speech”. New York: McGraw-Hill, 1993.
  • Rabiner, L. and B.-H. Juang. “Fundamentals of Speech Recognition. Signal Processing”, ed. A. Oppenheim. Englewood Cliffs: Prentice Hall, 1993.
Περιγαφή Μαθήματος
  • Μοντελοποίηση ήχου. Κωδικοποίηση κυματομορφής PCM, ADPCM, Διαμόρφωση Δέλτα, VQ, βέλτιστη κβάντιση. Γραμμική πρόβλεψη. Αναλογικοί κωδικοποιητές φωνής. Ψηφιακοί κωδικοποιητές φωνής, (LPC, CELP).
  • Ομομορφική επεξεργασία φωνής. Σύνθεση φωνής. Αναγνώριση φωνής, αναγνώριση ομιλητή. Μαρκοβιανά μοντέλα, Νευρωνικά δίκτυα .
  • Υλικό ψηφιακής επεξεργασίας φωνής (digital signal processing (DSP) chips – TI, AT&T, Motorola and Motorola CVSD and ADPCM chips). Πρότυπα στάνταρ κωδικοποίησης φωνής. Μετασχηματισμός φωνής.