Μαθήματα Επεξεργασίας

Σημάτων

Ε.Μ.Π. | ΗΜΜΥ
Προπτυχιακά | Μεταπτυχιακά | Διπλωματικές
Εγγραφή | Αποστολή | Συμπεριφορά | Συντομογραφίες | Παράδειγμα
Ομάδα Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων
Vision | Speech
2003 | 2002 | 2001 | 2000 | 1999 | pre-1999
Undergraduate | Postgraduate | Diploma Projects | Mailing Lists
subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link

Διεπιστημονικό – Διαπανεπιστημιακό Πρόγραμμα Μεταπτυχιακών Σπουδών

«Τεχνογλωσσία VIΙΙ» - Επεξεργασία Σημάτων Φωνής

Πληροφορίες
«Τεχνογλωσσία VIΙΙ» - Επεξεργασία Σημάτων Φωνής
Α' Εξάμηνο
Διδάσκοντες: Πέτρος Μαραγκός (http://cvsp.cs.ntua.gr/maragos)
Αλέξανδρος Ποταμιάνος (Αν. Καθ. Πολ. Κρήτης) ([email protected])
Σπύρος Ράπτης (Ερευνητής Α' ΙΕΛ/ Ε.Κ. «Αθηνά») ([email protected])

Χρόνος/Τόπος: Τρίτη 12.00-15.00
ΕΜΠ: Νέα Κτήρια Σχολής ΗΜ&ΜΥ, Αίθουσα 010
Έναρξη: Τρίτη 09-04-2013
 
Στόχοι
Εισαγωγή στην θεωρία των θεμελιωδών εννοιών και προβλημάτων της επεξεργασίας σημάτων φωνής από άνθρωπο και Η/Υ, καθώς και σε επιλεγμένες εφαρμογές όπως κωδικοποίηση, αναγνώριση και σύνθεση φωνής από Η/Υ.
 
Περιεχόμενα
Τα θέματα του μαθήματος θα καλυφθούν από δέκα (10) τρίωρες διαλέξεις. Θέματα-Διαλέξεις:
  • Εισαγωγή στην Επεξεργασία Φωνής+ Νόηση/ Αντίληψη
  • Φυσικοί Νόμοι της Παραγωγής Φωνής + Φωνητική/Φωνολογία
  • Ανάλυση και Μοντελοποίηση Φωνής
  • Μοντελοποίηση (συνέχεια) και Κωδικοποίηση Φωνής
  • Αναγνώριση Φωνής Ι
  • Αναγνώριση Φωνής ΙΙ
  • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής Ι
  • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής ΙΙ
  • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής ΙΙΙ
  • Συστήματα Φωνητικού Διαλόγου και άλλες Εφαρμογές Φωνής.
 
Εκπαιδευτικό Υλικό
Επιπρόσθετο εκπαιδευτικό υλικό θα διατίθεται από την ηλεκτρονική ιστοσελίδα του μαθήματος.

Βιβλιογραφία
  • P.B. Denes and E.N. Pinson,
    The Speech Chain: The Physics and Biology of Spoken Language,
    Anchor Press, Doubleday, Garden City, N.Y., 1973

  • G. Fant,
    Acoustic Theory of Speech Production,
    Mouton, the Hague, 1960, 1970

  • J.L. Flanagan,
    Speech Analysis, Synthesis and Perception,
    Springer-Verlag, Berlin, 1965, 1972

  • K.N. Stevens,
    Acoustic Phonetics,
    MIT Press, Massachusetts, 1998

  • L. R. Rabiner and R.W. Schafer,
    Digital Processing of Speech Signals,
    Prentice-Hall, 1978 (Νέα έκδοση: 2010)

  • L.R. Rabiner and Β.Η. Juang,
    Fundamentals of Speech Recognition,
    Prentice-Hall, Englewood Cliffs, NJ, 1993

  • D. Jurafsky and J.H. Martin,
    Speech and Language Processing: An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition,
    Prentice-Hall, Upper Saddle River, NJ, 2000

  • B. Gold and N. Morgan,
    Speech and Audio Signal Processing,
    Wiley, 2000.

  • D. O'Shaughnessy,
    Speech Communication: Human and Machine,
    Addison-Wesley, Reading, Massachusetts, 1987

  • T. F. Quatieri,
    Discrete-time Speech Signal Processing,
    Pentice-Hall, Upper Saddle River, NJ, 2002

  • Γ. Καραγιάννης και Μ. Ραγκούση,
    Ψηφιακή Επεξεργασία Σήματος,
    Ε.Μ.Π., Εκδόσεις Συμεών

Τελευταία Αλλαγή:  Monday, 15 April 2013 | Δημιουργοί: Νάσος Κατσαμάνης, Γιώργος Παπανδρέου | Search is powered by