ANOTATOR

Anotator AGH jest oprogramowaniem przeznaczonym do przygotowywania zbiorów nagrań mowy przeznaczonych do wykorzystywania w korpusach mowy. Takie korpusy muszą zawierać nie tylko pliki dźwiękowe, ale także odpowiadające im transkrypcje wraz z czasami wystąpień poszczególnych jednostek, takich jak zdania, słowa lub fonemy. Z tego powodu korpusy mowy są zasobami kosztownymi i czasochłonnymi w przygotowywaniu.

anotator-scr.jpg

Program umożliwia szybkie i tanie generowanie korpusów. Można to osiągnąć na przykład poprzez wykorzystanie istniejących audiobooków i ich tekstowych odpowiedników, albo nagrań odczytów dokumentów, przemówień itd. Oczywiście nic nie stoi na przeszkodzie aby robić własne nagrania i je anotować opisywanym programem. Jednakże intencją twórców programu, było ominięcie kosztów związanych z płaceniem mówcom, zakupem sprzętu nagraniowego itp. Dodatkowo, program anotuje w taki sposób, aby użytkownik mógł wykonać swoją pracę jak najmniejszą liczbą kliknięć, a więc jak najszybciej. W przeprowadzonych pracach średnio poświęcono 17 minut na 1 minutę korpusu. Jest to bardzo dobry wynik, gdyż w literaturze ocenia się ten czas na 20 do 40 minut. Program eksportuje dane w standardzie plików MLF, używanych w wielu systemach technologii mowy, w tym najbardziej znanym – HTK.

Artykuł i praca inżynierska o anotatorze.

Twórcy systemu zapraszają do skorzystania z oferty techmo.pl. Techmo jest spółką spin-off która specjalizuje się w przetwarzaniu mowy i audio.

Copyright © Zespół Przetwarzania Sygnałów AGH 2011-2014