Technologia mowy

Sylabus

Oceny 2013/2014

Oceny 2014/2015

Oceny 2016/2017

Egzamin 1. - wyniki, Konsultacje i wgląd do prac możliwy w środę 1. lutego 2017 w godz: 13:30-14:30 w pok. C2-419. Oceny wystawione będą zgodnie z paragrafem 13. regulaminu studiów AGH.

Podsumowanie oceny przedmiotu przez studentów

Plugin Adobe Flash Plugin jest niezbędny do obejrzenia tej zawartości.

Wykłady

Laboratorium

TTS

Materiały do laboratorium 26.11.2015 (TTS_laboratory.pdf, beep.zip, TIMIT.zip) pobierz

HTK

  • Rozpoczęcie pracy z HTK
  • rejestracja w HTK (http://htk.eng.cam.ac.uk/),
  • ściągnięcie dokumentacji (HTK Book),
  • zaznajomienie się z dokumentacją i zapisanie się na listę użytkowników,
  • ustalenie zadania ASR na kolejne tygodnie laboratoriów (około 30 słów, np. zestaw krótkich komend takich jak zamawianie pizzy),
  • sporządzenie plików gramatyk i słownika (patrz HTK Book).
  • Nagrania (3 minuty różnorodnych nagrań realizujących ustaloną gramatykę)
  • Anotowanie nagrań (1 lub 2 zajęcia). Program do ściągnięcia na UPEL wyłącznie na potrzeby przedmiotu TMo
  • Opracowanie ASR z wykorzystaniem HTK (około 3 zajęć) na podstawie tutorialu z HTK book i uwag z wykładu.
  • Całokształt wyników pracy z HTK należy wysłać emailem lub udostępnić na serwerze wraz ze sprawozdaniem
Przykłady sprawozdań z ubiegłych lat

Ćwiczenia

Wyniki kolokwium 1: PNG. Wgląd do prac i wyjaśnienia w C2-419, w środę 16.12.2015 w godz: 14:00-14:30. (JG)

Przeskalowane punkty z kolokwium 1, prezentacji i ocen uzyskanych w trakcie ćwiczeń

Tematy prezentacji 2014:

Tematy prezentacji 2015:

Plugin Adobe Flash Plugin jest niezbędny do obejrzenia tej zawartości.

Polecane materiały

  • B. Ziółko, M. Ziółko, Przetwarzanie mowy, Wydawnictwa AGH, 2011
  • D. Jurafsky, J. H. Martin, SPEECH and LANGUAGE PROCESSING. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Second Edition”, Pearson Prentice Hall, 2008
  • L. R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition PDF
  • HMM w MIT, week #5, lecture #10: www.ocw.mit.edu
  • W. Kwiatkowski, Metody automatycznego rozpoznawania wzorców, BEL Studio, Warszawa 2007 (28 zł)
  • J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, Wyd 2., EXIT, Warszawa 2008 (45 zł)
  • M. Krzyśko, W. Wołyński, T. Górecki, M. Skorzybut, Systemy uczące się, WNT, Warszawa 2008 (47 zł)
  • W. Kasprzak, Rozpoznawanie obrazów i sygnałów mowy, WPW, Warszawa 2009 (28 zł)
  • S. Theodoridis, K. Koutroumbas, Pattern Recognition, Academic Press, San Diego 2009
  • (!) R. O. Duda, P. E. Hart, D. G. Stork, Pattern Classification, 2nd Edition, Wiley & Sons 2000
  • J. P. Marques de Sa, Pattern Recognition, Springer 2001
  • Andy Field, Discovering Statistics Using SPSS
  • Studenckie mapy skojarzeń dla hasła Technologia Mowy (PDF) (JG).

Stara strona przedmiotu z dodatkowymi materiałami

filtrymfcc.jpg

Copyright © Zespół Przetwarzania Sygnałów AGH 2011-2014