Novou verzi programu NEWTON Dictate 3, která vychází z nejnovějších poznatků v oblasti rozpoznávání řeči, dnes v Praze na společné tiskové konferenci představily tuzemská firma Newton Technologies a Technická univerzita v Liberci. Jedná se o aplikaci hlasové technologie, která dokáže do počítače přepsat téměř bezchybně slovní projev a kromě elektroniky dokáže hlasovými povely ovládat třeba i domácí spotřebiče.
Program zahrnuje nové hlasové moduly, automatickou adaptaci na řečníka, ve srovnání s předchozími verzemi obsahuje výkonnější rozpoznávací jádro a rozsáhlejší slovníky, které lze snadno modifikovat. „Uživatel si může sám do slovníku i výrazy přidávat podle frekvence užívání, může si vytvořit vlastní šablony a formuláře. Systém také eliminuje rušivé zvuky z okolí, automaticky doplňuje čárky před spojkami, formátuje číselné výrazy apod,
“ přiblížil novou verzi profesor Jan Nouza, který už před 18 lety na Fakultě mechatroniky, informatiky a mezioborových studií TUL vytvořil první český program na hlasové ovládání.
Na výzkumu zdokonalování programu, zavádění do praxe a dalších aplikacích spolupracuje jeho tým s firmou Newton Technologies řadu let. Mimo jiné před několika lety uvedl na trh program MyVoice, který umožňuje lidem s nepohyblivýma rukama ovládat hlasem nejen počítač, ale i další elektronická zařízení. Ovládání hlasem nabízejí přímo i někteří výrobci elektroniky, například Samsung u některých modelů televizí, ale ne pro češtinu.
Hlavní výhodou programu MyVoice je především to, že uživatel si může povely libovolně zvolit, např. tak, aby se mu dobře vyslovovaly. Další výhoda programu MyVoice spočívá v tom, že se dá jednoduše propojit s prvky takzvané domácí automatice (dálkově ovládanými zásuvkami, spínači, dveřními zámky, ovladači, apod.), čímž se dá vytvořit byt vhodný pro osoby s různými zdravotními problémy a postiženími. V oblasti přepisu češtiny se nová verze programu NewtonDictate svou přesností již blíží hranici, která může konkurovat profesionálním písařkám. Například u právnických textů lze po krátkém zaučení dosáhnout úspěšnost nad 97 %. To bylo vidět i při vlastní prezentaci, kdy byly různými lidmi diktovány náhodně vybrané články z aktuálního vydání denního tisku. Profesor Nouza také předvedl, že programy vyvinuté na TUL zvládají přepis i dalších slovanských jazyků – polštiny, chorvatštiny a dokonce i ruštiny v azbuce.
Oba partneři dnes také ukázali, že po dalším zdokonalení umožňuje program My Voice ovládat hlasem prakticky jakýkoliv spotřebič s dálkovým ovládáním. „Funkce dálkového ovladače se jednou nahrají do počítače a každému tlačítku se přiřadí jeden hlasový příkaz, který danou funkci spustí. Systém může kromě televizí nebo hi-fi věží ovládat i další zařízení prostřednictvím spínačů nebo zásuvek ovládaných na dálku. Schopnější informatik si pomocí našeho programu dokáže zařízení ovládající TV, lampičku nebo věž sestavit sám,“ uvedl ředitel společnosti Petr Herian.
Na trh chce firma podle Heriana v příštích dnech uvést tři aplikace programu Dictate 3 a sice od základní verze pro diktování textu až po profesionální sestavu, v níž je i speciální mikrofon a zařízení pro usnadnění přehrávání. Cena se bude pohybovat od 5000 do 35.000 korun. „Diktovat lze do osobních počítačů, tabletů nebo mobilních telefonů. Systém rozpoznává různé řečníky, poradí si i s méně spisovnou mluvou a do značné míry eliminuje rušivé zvuky,“ konstatoval profesor Nouza.
Speciální aplikací hlasových technologií vyvinutých ve spolupráci TUL a Newtonu je program sloužící pro kontrolu kvality výroby, kdy zaměstnanec identifikuje výrobek prostřednictvím čárového kódu a hlasem označí stav výrobku. Výsledky se ukládají do podnikové databáze a údaje pak slouží jako podklad pro podnikový informační systém.První nasazení se připravuje v jednom velkém libereckém výrobním podniku.
„ Na všech aplikacích úzce spolupracujeme s univerzitou. Někdy konečnou verzi ještě upravujeme podle konkrétních podmínek,“ upřesnil Petr Herian.
Tým profesora Jana Nouzy se na Technické univerzitě v Liberci počítačovým rozpoznáváním řeči zabývá dlouhodobě. V roce 1994 vyvinul první český hlasem ovládaný program a v roce 2006 dokončil technologii pro plynulé diktování do počítače. V současné době má výzkumný tým profesora Nouzy 15 odborných pracovníků. Je zapojen v národních i evropských programech výzkumu (GAČR, TAČR, NAKI, COST). Jedním z největších projektů, na kterém liberečtí vědci pracují, je kompletní přepis a zpřístupnění zvukového archivu Českého rozhlasu.
J. Kočárková
Další články v rubrice

Když se žení student, tak na TUL
Na Technické univerzitě v Liberci se toho odehrává hodně, tak proč ne svatba? Zvlášť, když je ženich studentem a nevěsta dcerou zaměstnankyně. Svatební veselici poskytla útočiště budova G – předsálí auly i aula samotná.

»Afrika vás změní.« Aneb když liberečtí studenti učí v Tanzanii zdravovědu i podnikání
Učit děti v zapadlé africké vesnici zdravovědu, tamní pedagogy zase týmovou spolupráci a dostat za to jen úsměv a dobrý pocit. Nebo vlastně víc. Změněný život. S touto nehmotnou, ale o to větší odměnou, se vrátili z měsíční dobrovolnické mise v...

Diplomová práce, která předběhla dobu. I proto získala Cenu Wernera von Siemense
Čestným uznáním ocenila porota prestižní Ceny Wernera von Siemense 2023 diplomovou práci Věry Šramhauserové, absolventky Biomedicínského inženýrství na Fakultě zdravotnických studií TUL. Diplomantka se zaměřila na digitalizaci ve zdravotnictví....