Írás és beszéd

A beszéd és írás kapcsolata, fonetikus átirat

A nyelvi kommunikáció két legfontosabb formája a beszéd és az írás. Míg a beszéd folyamatos levegőrezgés, melynek akusztikai szerkezete állandóan változik, az írás alapvetően a beszéd tartalmi rögzítésére jött létre, ennek megfelelően diszkrét, véges számú egymástól elkülöníthető elemből álló jelkészletet használ (graféma, írásjel). Az írás és a beszéd egymással szoros kapcsolatban van, ezt a kapcsolatot az adott nyelv fonéma rendszere jelenti.

A fonéma a nyelv azon eleme, amelyik megkülönböztető szereppel bír a jelentésben. A magyar nyelvnek 65 fonémája van. A fonéma hangzó megfelelője többnyire a beszédhang, az írott szöveg pedig a beszédhangot reprezentáló egy vagy több elemű graféma (betű) sorozat. A kettő közötti kapcsolatot oda-vissza biztosítja a fonetikus átirat, amely hangszimbólumok sorozatával adja meg a szöveg beszédhangjait.

A beszédtechnológiában sok esetben írott szöveget kell a gép segítségével automatikusan beszéddé alakítani, tehát a diszkrét szimbólumsorozatból kell folyamatosan változó hullámformát készíteni (beszédszintézis). A feldolgozás során a szövegből fonetikus átiratot kell készíteni, majd ebből generálják a beszédet. Ennek fordítottja pedig, amikor az elhangzott beszédből kell a gépnek meghatároznia, hogy mi volt a hangsor nyelvi tartalmát reprezentáló szöveg (gépi beszédfelismerés). Ekkor a beszédből készül el a köztes fonetikus átirat, majd abból az írott szöveg.

Írásból beszéd

A magyar nyelv többnyire fonemikus írása miatt általában elégséges ha egyes betűcsoportokra vonatkozó egyszerű kiejtési szabályokat tanulunk meg, hogy a fonetikus átiratot elkészítsük. A következő példában SAMPA hangjelekkel adjuk meg a fonetikus átirat beszédhangjait egy mondatra:

A pontos idő 13 óra. = O p o n t o S i d 2: t i z e n h A: r o m o: r O

Ebben az átiratban nincsenek jelölt szóhatárok (hiszen a beszédben sem tartunk szünetet a szavak határán), csak a központozási jeleknél (például: pont, vessző, kettőspont stb.) van szünet. A fonetikus átiratot általában mondat szinten készítik el. A mondat a nyelvi betűszókon kívül tartalmazhat más elemeket is, például számokat, mozaik szavakat, rövidítéseket, Web címeket, márka neveket stb. Ezek kiejtési formáját a fonetikus átiratnak követni kell. Az ember segít a gépnek a helyes fonetikus átirat automatikus elkészítéséhez, kivétel szótárakkal. Az ilyen szótárak készítése nehéz, véget nem érő és nagyon sokrétű feladat. Ha a fonetikus átiratot helyesen (a leendő kiejtés szerint hangról hangra) hozták létre, akkor a generált beszéd a megfelelő beszédhangfolyamot fogja tartalmazni. Az alábbi néhány példasor a Profivox magyar gépi felolvasó kivétel-szótárának Z betűvel kezdődő szavaiból való. A kiejtési formát TMIT hangszimbólumokkal adjuk meg.

Betűkép Hangalak (TMIT)
Zeiss c;e;j;s
Zeitung c;e;j;t;u;n;g
Zellweger c;e;l;v;E;g;e;r
Zeneca z;e;n;e;k;a
Zeppelin c;e;p;e;l;i;n
Zepter c;e;p;t;e;r
Zewa c;e;v;a
Zidane z;i;d,A;n
Zimmer c;i;m:;e;r
Zuschlag c;u;S,l;A:;g
Zürich c;U;r;i;h
Zwilling c;v;i;l;i;n;g

Figyelem! A fonetikus átirat nem tartalmaz információt a beszéd időszerkezetéről (hangidőtartamok, szünetek hossza, ritmus stb.). Ezt az információt párhuzamosan kell biztosítani minden beszédhangra a helyes beszédhangzás eléréséhez. A tervezett szövegfelolvasó megoldást célszerű az adott feladatra, témakörre megtervezni (például: reklám, bank, közlekedés, egészségügy, államigazgatás, informatika, kereskedelem, könyvolvasás stb.).

Beszédből írás

Az automatikus beszédfelismerő a beszédből hangról hangra fonetikus átiratot készít, ahogy az a beszédjelben volt. Hogyan alakul át ez helyes nyelvi szöveggé? A fő probléma a kiejtés egyéni változatossága (hangkiesések, hangbeillesztések, szótagkihagyások stb.). Például a miért szó ejtési variációi: mé, mér, mét, mért, mijért. A másik probléma, hogy szóhatárokat kell meghatározni a fonetikus átiratban, hogy helyes szósor legyen a szöveg kimeneten. Probléma az is, hogy a magyar ragozó nyelv, ragozott szavak esetén nehéz meghatározni a szóhatárt (például: asztal, asztalos, asztalosok, asztalosoké, asztalosokéi, asztalosokéiból). Speciális szótárak, nagy adatbázisok, jó lényegkiemelési módszerek szükségesek ezeknek a problémáknak a leküzdéséhez a gépi beszédleiratozásnál. A kiejtett nevek, márkák stb. helyes gépi átírása is gondot okozhat. Ehhez is kivétel szótárak kellenek.

Fonetikus átiratokat mutatunk be ezen a honlapon a Magyar Kiejtési Szótárban. Továbbá az alábbi címről letölthető Fonetizátor program is erre használható. http://lsa.tmit.bme.hu/products/phontrans.html