TUL významně posouvá hlasové technologie

Novou verzi programu NEWTON Dictate 3, která vychází z nejnovějších poznatků v oblasti rozpoznávání řeči, dnes v Praze na společné tiskové konferenci představily tuzemská firma Newton Technologies a Technická univerzita v Liberci. Jedná se  o aplikaci hlasové technologie, která dokáže do počítače přepsat téměř bezchybně slovní projev a kromě elektroniky dokáže hlasovými povely ovládat třeba i domácí spotřebiče.

Program zahrnuje nové hlasové moduly, automatickou adaptaci na řečníka, ve srovnání s předchozími verzemi obsahuje výkonnější rozpoznávací jádro a rozsáhlejší slovníky, které lze snadno modifikovat. „Uživatel si může sám do slovníku i výrazy přidávat podle frekvence užívání, může si vytvořit vlastní šablony a formuláře. Systém také eliminuje rušivé zvuky z okolí, automaticky doplňuje čárky před spojkami, formátuje číselné výrazy apod, “ přiblížil novou verzi profesor Jan Nouza, který už před 18 lety na Fakultě mechatroniky, informatiky a mezioborových studií TUL vytvořil první český program na hlasové ovládání.

Na výzkumu zdokonalování programu, zavádění do praxe a dalších aplikacích spolupracuje jeho tým s firmou Newton Technologies řadu let. Mimo jiné před několika lety uvedl na trh program MyVoice, který umožňuje lidem s nepohyblivýma rukama ovládat hlasem nejen počítač, ale i další elektronická zařízení. Ovládání hlasem nabízejí přímo i někteří výrobci elektroniky, například Samsung u některých modelů televizí, ale ne pro češtinu.

Hlavní výhodou programu MyVoice je především to, že uživatel si může povely libovolně zvolit, např. tak, aby se mu dobře vyslovovaly. Další výhoda programu MyVoice spočívá v tom, že se dá jednoduše propojit s prvky takzvané domácí automatice (dálkově ovládanými zásuvkami, spínači, dveřními zámky, ovladači, apod.), čímž se dá vytvořit byt vhodný pro osoby s různými zdravotními problémy a postiženími.  V oblasti přepisu češtiny se nová verze programu NewtonDictate svou přesností již blíží hranici, která může konkurovat profesionálním písařkám. Například u právnických textů lze po krátkém zaučení dosáhnout úspěšnost nad 97 %. To bylo vidět i při vlastní prezentaci, kdy byly různými lidmi diktovány náhodně vybrané články z aktuálního vydání denního tisku. Profesor Nouza také předvedl, že programy vyvinuté na TUL zvládají přepis i dalších slovanských jazyků – polštiny, chorvatštiny a dokonce i ruštiny v azbuce.

Oba partneři dnes také ukázali, že po dalším zdokonalení umožňuje program My Voice ovládat hlasem prakticky jakýkoliv spotřebič s dálkovým ovládáním.  „Funkce dálkového ovladače se jednou nahrají do počítače a každému tlačítku se přiřadí jeden hlasový příkaz, který danou funkci spustí. Systém může kromě televizí nebo hi-fi věží ovládat i další zařízení prostřednictvím spínačů nebo zásuvek ovládaných na dálku. Schopnější informatik si pomocí našeho programu dokáže zařízení ovládající TV, lampičku nebo věž sestavit sám,“ uvedl ředitel společnosti Petr Herian.

Na trh chce firma podle Heriana v příštích dnech uvést tři aplikace programu Dictate 3 a sice od základní verze pro diktování textu až po profesionální sestavu, v níž je i speciální mikrofon a zařízení pro usnadnění přehrávání. Cena se bude pohybovat od 5000 do 35.000 korun. „Diktovat lze do osobních počítačů, tabletů nebo mobilních telefonů. Systém rozpoznává různé řečníky, poradí si i s méně spisovnou mluvou a do značné míry eliminuje rušivé zvuky,“ konstatoval profesor Nouza.

Speciální aplikací hlasových technologií vyvinutých ve spolupráci TUL a Newtonu je program sloužící pro kontrolu kvality výroby, kdy zaměstnanec identifikuje výrobek prostřednictvím čárového kódu a hlasem označí stav výrobku. Výsledky se ukládají do podnikové databáze a údaje pak slouží jako podklad pro podnikový informační systém.První nasazení se připravuje v jednom velkém libereckém výrobním podniku.

Na všech aplikacích úzce spolupracujeme s univerzitou. Někdy konečnou verzi ještě upravujeme podle konkrétních podmínek,“ upřesnil Petr Herian. 

Tým profesora Jana Nouzy se na Technické univerzitě v Liberci počítačovým rozpoznáváním řeči zabývá dlouhodobě. V roce 1994 vyvinul první český hlasem ovládaný program a v roce 2006 dokončil technologii pro plynulé diktování do počítače. V současné době má výzkumný tým profesora Nouzy 15 odborných pracovníků.  Je zapojen v národních i evropských programech výzkumu (GAČR, TAČR, NAKI, COST). Jedním z největších projektů, na kterém liberečtí vědci pracují, je kompletní přepis a zpřístupnění zvukového archivu Českého rozhlasu.

J. Kočárková
 

Další články v rubrice

Zůstaň v kontaktu s univerzitou

T-UNI Univerzitní časopis /
University Magazine

Nepřehlédněte
tipy redakce

1000012936-2.jpg

Tričko probudí usínajícího řidiče

Plíživou únavu si ještě řidič za volantem neuvědomí, ale bezpečně ji už v zárodku pozná tričko vyvíjené na katedře oděvnictví Fakulty textilní TUL. Senzory totiž neomylně změří zpomalující se dech. Smart textile tak může pomoci snížit počty nehod...

10. 4. 2025 | Věda a výzkum | 648
0052_vitezove_cWvS_2025_-0474.jpg

Cena Wernera von Siemense míří opět na TUL

Zcela unikátní metodu měření dynamiky fotoluminiscence vymyslel a ve své dizertační práci popsal doktorand Fakulty mechatroniky, informatiky a mezioborových studií TUL Jiří Junek. Metoda se využije například při analýze defektů v solárních...

27. 3. 2025 | Věda a výzkum | 358