České řečové technologie pomáhají vědcům z celého světa

Ve dnech 22.- 27. května se v Pražském Kongresovém centru uskuteční mezinárodní konference ICASSP, která se zaměřuje na zpracování řeči, audia, obrazu, videa, a dalších signálů. Této konference se zúčastní více než 2000 vědců a zástupců firem z celého světa.

Videozáznamy příspěvků z této konference budou zpracovány pomocí nové unikátní technologie indexace řeči, kterou vyvinuli vědci z výzkumné skupiny zpracování řeči, Fakulty informačních technologií VUT v Brně.

Záznamy budou automaticky přepsány rozpoznávačem řeči na text, indexovány a zpřístupněny spolu s doprovodným materiálem na internetu. „Pro nalezení zajímavého místa v přednášce již nebudete muset několik hodin zdlouhavě prohlížet video, ale bude Vám stačit zadat jednoduchý dotaz à la Google. Budete si tak moci poslechnout, co o nových poznatcích říká sám autor.“, vysvětluje Igor Szöke, vedoucí výzkumného projektu www.superlectures.com, kde budou záznamy z konference umístěny. „Technologii jsme již testovali v loňském roce na menší konferenci - Odyssey 2010: The Speaker and Language Recognition Workshop - s velmi pozitivním ohlasem", dodává Szöke.

Kromě vědců z akademické sféry bude na konferenci prezentovat vlastní výzkum a vývoj také celá řada světově známých firem, které mají blízko k tomuto oboru. Z českých firem se bude konference účastnit Phonexia s.r.o., která úzce spolupracuje s FIT VUT a úspěšně dodává řečové technologie firmám z celého světa (call-centra, zpravodajské složky, firmy s audioarchivy). Její ředitel, Pavel Matějka, nám prozradil, proč je o tuto vědeckou konferenci tak velký zájem ze strany komerčních společností: „Firmy, které se této akce účastní, vyšlou zástupce svých výzkumných týmů, aby se pochlubili svými výsledky a také, aby zjistili jak probíhá výzkum a vývoj jinde. V neposlední řadě budou chtít oslovit mladé talentované vědce a získat tak nové členy do svých výzkumných týmů. To je i naším cílem.“

"Odhadujeme, že zpracované záznamy konference této velikosti mohou oslovit až 10 000 vědců. Možnosti aplikačního nasazení této technologie jsou ale podstatně širší. Již druhým rokem mají studenti Fakulty informačních technologií VUT v Brně možnost se na přednášky podívat ze záznamu a v záznamech vyhledávat důležité informace – klíčová slova. Naše video servery portálu www.prednasky.com jsou hojně vytíženy hlavně před zkouškami. V budoucnu by mohly tyto technologie zásadně změnit přístup ke vzdělání", říká docent Jan Černocký, vedoucí výzkumné skupiny zpracování řeči (Speech@FIT) na Fakultě informačních technologií VUT v Brně. Kladně se vyjadřuje také o státní podpoře spolupráce vysokých škol a inovativních firem: „Nerad vidím, když se bádá stylem ‘napište článek a zapomeňte’, v naší skupině se snažíme pracovat na věcech, které mají praktické využití. Jsem rád, že to instituce jako Ministerstvo průmyslu a obchodu nebo Technologická agentura České republiky chápou a v takových aktivitách nás podporují.“

Praktické informace a další informační zdroje:

Tvůrce portálu SuperLectures.com mohou zástupci tisku navštívit na doprovodné výstavě konference ICASSP, kde se řečová skupina FIT VUT v Brně prezentuje na stánku společně s firmami Phonexia a Lingea. Výstava probíhá od 24. do 26. května od 09:45 - 18:15 v Pražském Kongresovém centru, 2. patro.

Přednáškový systém http://superlectures.com
ICASSP http://www.icassp2011.com
Skupina Speech@FIT http://speech.fit.vutbr.cz
Phonexia http://phonexia.com
Lingea http://lingea.com