Úvod

BUT Speech@FIT group is a proud coordinator of the Brno Speech Cluster.

Výzkumná skupina BUT Speech@FIT byla vytvořena v roce 1997 na Fakultě elektrotechniky a komunikačních technologií, VUT a připojila se k Ústavu počítačové grafiky a multimédií, FIT v době vzniku Fakulty informačních technologií v lednu 2002. Poradcem skupiny je Prof. Hynek Heřmanský, výkonným ředitelem je Doc. Dr. Ing. Jan Černocký a jejím ředitelem výzkumu je Ing. Lukáš Burget, PhD.

Hlavní specializací skupiny je identifikace řečníka a jazyka, rozpoznávání jazyka a detekce klíčových slov. K jejím nejvýznamnějším úspěchům patří nejlepší fonémový rozpoznávač na světě a vynikající výsledky v evaluacích NIST (americký Národní institut pro standardizaci a technologie) evaluacích v oblasti rozpoznávání jazyka a řečníka. Skupina je také známa svou prací v oblasti extrakce řečových příznaků a v oblasti akustického modelování pro rozpoznávání mluvené řeči s velkým slovníkem (posteroirní příznaky, diskriminativní trénování a transformace). Výzkumníci řečové skupiny Speech@FIT jsou pravidelně zváni na prestižní akce, jako je např. JHU (Johns Hopkins University summer research workshops).

Skupina BUT Speech@FIT se zúčastnila řady významných projektů financovaných z prostředků Evropské komise, sahajících od sběru řečových databází (SpeechDat-E - FP4, No. 977017, SpeeCon - IST-1999-10003), přes rozpoznávání meetingů (M4 - FP5, IST-2001-34485, AMI - FP6, 506811, AMIDA - FP6, IST-033812) až k mobilní biometrii (MOBIO - FP7, 214324) a detekci řídkých audiovizuálních podnětů jak na bázi základního výzkumu (DIRAC – FP6, 027787) tak v průmyslových bezpečnostních aplikacích (CareTaker - FP6, 027231). Skupina je také financována prostřednictvím národních výzkumných projektů (především z MŠMT, MPO, MO a MV), místními a mezinárodními průmyslovými partnery a vládou USA.

Skupina BUT Speech@FIT je rovněž aktivní ve vývoji open-source softwaru a její STK toolkit, fonémový rozpoznávač PHNREC a SNet pro trénování neuronových sítí jsou využívány v několika světových laboratořích.

Skupina disponuje zařízením, které jí umožňuje provádět důležité experimenty v oblasti rozpoznávání řeči: více jak 700 CPU jednotek včetně 3 IBM-Blade center, všechny provozovány na softwaru Linux, datovými servery s celkovou kapacitou více než 100 TeraBytů a řečovými a jazykovými databázemi.