Hol készült Stephen Hawking magyar gépi hangja?

Stephen Hawking ma is egy 1988-ban készült, az MIT professzora, Dennis Klatt kutatásain (KlattTalk majd DecTalk) alapuló angol nyelvű gépi szövegfelolvasó (TTS, text-to-speech) rendszert használ. Ma már ennél sokkal emberre emlékeztetőbben szóló megoldások is léteznek, ő azonban annyira azonosult ezzel a gépies, de érthető hangkarakterrel, hogy nem váltott újabb rendszerre.

A mindenség elmélete-05-Stephen Hawking

Mikor a Mafilm Audio Kft vezetője, Kálmán András megkeresett, hogy tudunk-e magyar gépi hangot adni a Stephen Hawkingról szóló filmhez (A mindenség elmélete), eszembe jutott, hogy a nyolcvanas években az MTA Nyelvtudományi Intézetében és a BME-n Olaszy Gábor kollégám fonetikai kutatásainak köszönhetően már elkészült a HungaroVox és a MultiVox rendszer, ami magyarul és néhány más nyelven produkált a DecTalk-hoz hasonló minőséget. Azonban ezeket a gyakorlatban már nem használjuk. Mégis, mi lehet az a hang, ami hasonlít is az angol változathoz, de elég jól érthető és ma is használt rendszerből származik? Így esett a választásunk a ProfiVox-diád technológiára. Ezt a rendszert akár hat hanggal is használják a magyar látássérült emberek a Jawsfor Windows képernyő olvasó programban már 2000 óta. Gépies hang, de nagy előnye, hogy jól érthető, kis erőforrást igényel a számítógéptől és széles határok között változtatható a beszéd sebessége.

A gépi beszéd minőségének javításán folyamatosan dolgozunk. Sok vasútállomáson (például Budapesten a Keletiben vagy Kelenföldön, Debrecenben, Keszthelyen és Nagykőrösön) a mi ProfiVox-korpusz rendszerünk szolgálja a hangos utastájékoztatást. Ez a rendszer egy professzionális rádióbemondó – Mátyus Kati – sok órányi hangfelvételén alapul. A ProfiVox-HMM technológia segítségével pedig akár 15 percnyi hangfelvétel alapján is tudunk bármely személy hangjára emlékeztető gépi szövegfelolvasót készíteni. Így akár „hang-bank”-ot is készíthetnénk.

Stephen Hawking talán a legismertebb ember, aki gép segítségével beszél, de hazánkban ma is évente több ezer ember szorulna rá, hogy hosszabb-rövidebb időre hozzájusson egy automatikus, magyar nyelvű beszédgenerátorhoz. Az ALS betegségen kívül más okok is vannak, például agysérülés miatti afázia, rákos folyamat miatti gége eltávolítás, mandulaműtét, intenzív kezelés, stb. Már 1994-ben kidolgoztunk ennek a problémának a kezelésére egy hordozható számítógépen alapuló technológiát (VoxAid majd MonddKi). Majd ezt elérhetővé tettük a legújabb „okos” eszközök számára is. Sajnos még nem sikerült elérnünk szélesebb felhasználói kört. Egyenlőre 10-15 orvos és logopédus ill. betegeik élvezhetik ennek előnyeit.

Talán ez a kis cikk segít abban, hogy egymásra találjunk olyan orvosokkal, szociális munkásokkal, finanszírozókkal és már érintettekkel, akik együttműködnének velünk ennek a kihívásnak a kezelésében.

Ha valakit mélyebben érdekel a téma, figyelmébe ajánlom a „Magyar beszéd” című könyvünket, amely az Akadémiai Kiadónál jelent meg, vagy látogasson el hozzánk, a BME Távközlési és Médiainformatikai Tanszék Beszédkommunikáció és Intelligens Interakciók Laboratóriumába.

Oszd meg!
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük