Mini szakszótár

Akusztikai vetület

Az artikuláció során kialakított képzési hely a mássalhangzóknál(például a nyelvhegy a fogmederhez tapad, a t, d, n hangok képzésénél) meghatároz egy elméleti formáns struktúrát, amihez a megelőző vagy követő magánhangzó formánsai mozogni fognak az átmeneti fázisaikban. Ez az elméleti formáns struktúra az adott képzési hely akusztikai vetülete a mássalhangzó képzési módjától (zár, rés, pergetett, zöngés zöngétlen)függetlenül. Ez más mássalhangzók képzési helyére is igaz. Tehát a t, d, n mássalhangzókat követő, illetve megelőző magánhangzókban (pédául ta, da, na vagy at, ad, an) ugyanolyan irányú formáns mozgások lesznek a mássalhangohoz kapcsolódó átmeneti fázisokban. Tehát az ugyanazon képzési helyhez tartozó mássalhangzók a magánhangzók formánsmozgásaira egyforma hatással vannak, függetlenül attól, hogy az adott mássalhangzó képzési helyéhez milyen képzési módú mássalhangzó tartozik. Ennek a beszédszintézisnél van lényeges szerepe.

Alapfrekvencia

A hangszalagok rezgésének frekvenciája a beszédben, amikor zöngés hangot ejtünk. Alaphangnak is szokták nevezni. Fonetikai jelölése F0. Értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz. Fontos megjegyzés: az F0-nak semmi köze az F1, F2, F3, F4-el jelölt formánsokhoz. Az alapfrekvenciát tudatosan tudjuk változtatni, ezzel hozzuk létre a beszéddallamot.

Aperiodikus rezgés

Szabálytalan, nem periodikus rezgés. Aperiodikus rezgés keletkezik például a zörejes beszédhangok (például: sz, s, f ) ejtésekor.

Artikuláció

A beszédképző szervek, folyamatos automatikus mozgatása a beszéd előállításához.

Artikulációs csatona

A hangszalagoktól a szájnyílásig terjedő hangképző terület. Toldalékcsőnek is nevezik. A férfiaknál az átlagos hossza 17 cm, a nőknél: 14 cm)

Artikulációs sebesség

A másodpercenként ejtett beszédhangok száma folyamatos ejtésnél (a szünettartásokat nem számítva). A magyar átlag 14 hang/s, a nyugodt beszédnél jellemzően 12 hang/s, a 18 hang/s a gyorsabb beszédnek felel meg.

Beszéddallam

A zönge frekvenciájának (F0) változtatása a mondat zöngés hangjaiban a mondat dallamának (ereszkedő, eső, emelkedő, lebegő és kombinációik) és a hangsúlyozásnak az érzékeltetésére, valamint érzelmek kifejezésére.

Beszédsebesség

A beszéd hangzásának teljes idejében (a szüneteket is beleértve) egységnyi időtartam alatt elhangzott beszédhangok száma. Mértékegysége: hang/s. Értéke kisebb, mint az artikulációs sebességé.

Beszédszintetizátor

A beszéd mesterséges előállítására szolgáló eszköz, gépi eljárás. Általában az írott alakot alakítják át ezzel a módszerrel emberi beszéddé (gépi felolvasás).

Beszédfelismerő

Az emberi beszédet géppel felismerő automatikus eszköz, gépi eljárás. A gépi beszédfelismerést statisztikai módszerek alkalmazásával végzik.
A géppel felismert beszédből automatikusan szöveget is készítenek, ezek a leiratozó eljárások. A gépi beszédfelismerésnek komoly szerepe van a beléptető rendszerekben és alkalmazzák a személy azonosításban is.

Beszédfrekvencia

A beszédben előforduló frekvencia értékek összessége, amelynek sávja: 50Hz - 12000 Hz. Ez kisebb, mint a hallás tartomány.

C

A mássalhangzók rövid jele a beszédtudományokban (Consonant). A magánhangzó rövidített jelölése a V (Vowel).

Címkézés

A beszédjelekkel párhuzamosan elhelyezett időszinkron címkék (markerek) összessége, amelyek nyelvi, akusztikai jellemzőket jelölnek. Ilyen lehet például egy szó hanghatárainak, szótaghatárainak megjelölése, vagy a zöngés periódusok jelölése egy magánhangzóban.

Diád

Beszédépítő hullámforma elem, amely két fél beszédhangot tartalmaz. A magyar beszéd max. 1600 féle diáddal lefedhető. Beszédszintézisnél használják.

Felharmonikus

A zöngés beszédhangoknak olyan frekvencia összetevői a felharmonikusok, amik az alapfrekvencia egész számú többszörösei. A felharmonikusok építik fel a zöngés beszédrészek spektrumát. A felharmonikusok jellemzően a 100Hz-4000 Hz frekvencia tartományban fordulnak elő a beszédben.

Fojtott zönge

A zöngés zárhangok (b, d, g, gy) kezdő szakaszán a zöngerész képzésekor keletkező rövid idejű zöngehang. A fojtást a zár okozza, ilyen esetben nincs hangkiáramlás a szájon át. A fojtott zönge amplitúdója kicsi, nem tartalmaz formánsokat. A zöngés zárhangokban a fojtott zöngét követi a hirtelen zárfelpattanás.

Fonéma

Elméleti nyelvészeti fogalom. Azt az elvont nyelvi egységet jelenti amely szójelentéseket különböztet meg. A fonéma hangrealizációja a beszédhang. A magyar nyelvben összesen 65 fonéma van, 15 féle magánhangzó és 50 féle mássalhangzó. A fonémáknak a nyelvi időtartam osztály szerint két csoportja van: rövid és hosszú. Például a sok és sokk szavak közötti jelentés különbséget a k hang hosszú változata hozza létre.

Formáns

A gégében keletkezett egészséges zönge hang egyszerű formájú rezgése felharmonikusokban gazdag. A gége feletti artikulációs csatorna üregrendszerének rezonancia frekvenciái felerősítik a zönge adott felharmonikusait a pillanatnyi rezonancia frekvencián és környékén. Így ezek a felerősített felharmonikus nyalábok nagyobb energiával rendelkeznek, mint a környezetük. Ezt az energiakoncentrációs részt nevezik formánsnak, hiszen ez formálja ki az adott hang hangzását. A rezonancia frekvenciák minden beszédhang esetében más-más frekvencián vannak, ez az artikulációtól függ. A formánsokat az F1, F2, F3, F4, jelekkel jelölik az emelkedő frekvenciájuk szerint. A beszédjelben a formánsok a 200-4000 Hz-es frekvenciasávban találhatók. Minden formánsnak megvan a saját előfordulási frekvencia sávja. A formánsok a nagy energiájú zöngés beszédhangokban, például magánhangzókban mutathatók ki a legjobban.

Frekvencia

A rezgés időegység alatti periódusainak gyakorisága. Mértékegysége a Hz. 1 Hz a frekvencia akkor, ha a rezgés 1 másodperc alatt egy periódust ír le. A beszédben az alapfrekvencia értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz.

Hallástartomány

Az a frekvenciatartomány, amin belül az emberi fül az akusztikus jeleket (beszédet, zenét, zajokat) érzékeli. Az ember hallástartománya 20 Hz-től 20000 Hz-ig terjed. Ezen belül van a beszédhallás tartomány, ami 50 Hz-től 12000 Hz-ig terjed. Idős korra gyakran jelentősen szűkül a hallástartomány.

Hangátmeneti fázis

A beszédhangoknak három része van: két hangátmeneti rész, valamint a tiszta fázis (a hang közepe). A beszédhangok a hangátmeneti részeikkel csatlakoznak a szomszédos beszédhanghoz. Mindezek szorosan összefüggnek az artikulációs szervek folyamatos mozgásával. A hangátmeneti fázis a koartikuláció következménye.

Hanghatár

A beszédhang kezdete és vége. Ezt általában a spektrumban vagy a hullámformában szokták megjelölni beszédtechnológiai célzattal.

Hang jelölések

A beszédhangoknak általánosan valamilyen írásjelek felelnek meg. Az írásjelek pedig nyelvfüggő egységek. Ezért vezették be a nemzetközi beszédhang jelölési rendszert 1889-ben (International Phonetic Alphabet, IPA), amelyben a hangokat függetlenül az írásjelektől egyértelműen definiálni lehet grafikai jelekkel. A számítógépes hangjelölésekre hozták létre a SAMPA hangjelölési rendszert 1989-ben.

Hangsebészet

A beszéd időfüggvényében végzett emberi beavatkozás, aminek hatására a beszéd minősége megváltozhat (például hangcserével jelentés csere jön létre). A hangsebészet számítógépes beavatkozás.

Hangspektrogram

A beszéd frekvencia- és intenzitás-összetevőinek képi megjelenítése az idő függvényében három dimenziós képen. Ezt a képi megjelenítést nevezzük hangszínképnek, vagy „látható beszéd"-nek is. A hangspektrogram vízszintes tengelye az időskála, a függőleges tengelyén látható a frekvencia. A harmadik dimenzió az adott frekvencia elem intenzitása, aminek fokát színnel fejezik ki.

Hangzósság

Egy beszédhang relatív hangereje a többi hanghoz képest az adott közlésen belül. A beszédhangok relatív intenzitását a hangzóssági skálán fejezik ki. A leghagzósabb magyar beszédhang az á magánhangzó, a legkevésbé hangós a h mássalhangzó.

IPA

Nemzetközi fonetikai abc a beszédhangok egyértelmű írott jelölésére grafikai jelekkel (International Phonetic Alphabet). Az IPA jelek ACSII átírása a SAMPA jelölési rendszer, amit számítógépes használatra fejlesztettek ki és a billentyűzettel adhatók meg.

Képzési mód

A gége és az artikulációs szervek felhasználási módjai a beszédhangok képzése során. A magyar beszédben ilyenek például: orális-, nazális zöngés képzési mód, nem zöngés képzés, rés képzés, zár képzés, a nyelvhegy pergetése, a nyelv függőleges és vízszintes helyzete, az ajkak csücsörítése, az állkapocs nyitása stb.

Képzési hely

A beszédhang képzésének jellemző helye az artikulációs csatornában. A magyar mássalhangzók képzési helyei: két ajak (bilabiális: b, p, m), alsó ajak+felső fogsor (labio-dentális: v, f), fogmeder+nyelvhegy (denti-alveoláris: d, t, sz, z, c, dz, n, l, r), a szájpad elülső része (alveoláris: s, zs, cs, dzs), kemény szájpad (palatális: ny, gy, ty, j), lágy szájpad (veláris: g, k), gége (larinx: h)

Koartikuláció

Az artikuláció a beszédképzés során folyamatos. Két beszédhangot a képzés szintjén a koartikuláció köt össze, vagyis az az artikulációs mozgássor, ami a két hangra jellemző artikulációs konfiguráció között zajlik le. A koartikulációból következik, hogy a beszédhangokra jellemző rezgésformák folyamatos átmeneti formákkal csatlakoznak egymáshoz, ezeket a beszédszakaszokat nevezik hangátmeneteknek. A hangátmenet tehát a koartikuláció következménye. A koartikuláció el is tolhatja a szomszédos hang jellemző képzési helyét. A palatális mássalhangzók ilyenek, magukhoz illesztik az őket megelőző, illetve követő egyes magánhangzók F2 formánsait.

Néma fázis

A zöngétlen zárhangok (p, t, k, ty) és zár-rés hangok (c, cs) első képzési része, amelyben nincs hangkiáramlás a zár miatt. A tüdőből kiáramlandó levegő a toldalékcsőben képzett akadály miatt feltorlódik és a zárfelpattanásig levegőáram nem hagyja el az artikulációs csatornát. Ilyenkor a beszédjel amplitúdója nulla. A néma fázis a magyar beszédhangoknál 50-150 ms között van.

Periódusidő

A periodikus hangrezgés egy periódusának időtartama (T0). Ha a beszélő személy alapfrekvenciája 100 Hz (például férfi zönge), akkor a periódusidő 10 ms. Képlettel kifejezve:T0=1/F0

Prozódia

A beszéddallam, a hangsúly és a ritmus összefoglaló kifejezése. Lényegesen járul hozzá az emberi beszéd megszokott hangzásához, a mondatfajták hangzó kialakításához.

Rezonancia-frekvencia

Az a frekvenciaérték, aminél egy test egy másik test által keltett rezgéstől saját maga is rezgésbe jön és ezzel a korábbi rezgés amplitúdója megnövekszik. Az artikulációs csatorna rezonancia frekvenciáin felerősödnek a zönge hang ugyanazon, vagy közel ugyanazon frekvenciával rendelkező felharmonikusai, ezzel intenzitásuk megnő. Ezeket a nagyobb energiájú felhang nyalábokat nevezik formánsoknak.

SAMPA

A SAMPA egy beszédhang jelölési rendszer, amely a beszédhangok egyértelmű számítógépes jelölésére szolgál ASCII kódokkal.

Specifikus időtartam

A beszédhangra jellemző elméleti időtartam, amely a hangot megelőző és követő hang függvényében alakul ki a folyamatos beszédben.

Spektrum

A beszédhang hullámforma összetevőinek frekvenciáit, amplitúdóit és fázisait meghatározó adatok összessége. A zöngés beszédhangok esetében a spektrum vonalas képet mutat. Ez azt jelenti, hogy csak a felharmonikusok frekvencia értékeinél van tartalom. A zörejes hangok esetében a spektrum folytonos, mivel ezekben a hangokban nincsenek felharmonikusok. A spektrum időbeni változását mutatja a hangspektrogram (látható beszéd).

Szegmentális szerkezet

Elméleti fogalom. A beszéd artikulációs, idő- és intenzitásszerkezetének alapformáit összegző kifejezés. Más szóval: a beszéd alapelemeit jelenti a prozódiai elemek nélkül, tehát a beszédhangok, a hangátmenetek, a specifikus hangidőtartamok és a specifikus hangintenzitások. Szegmentális szerkezetű beszéd a gyakorlatban csak beszédtechnológiai eszközökkel hozható létre.

Szupraszegmentális szerkezet

Elméleti fogalom. A komplex beszédjelnek azon része, amely a beszéd dallamát, hangsúlyviszonyait, tempóját, ritmusát, hangerősségét és hangszínezetét, vagyis a komplex prozódiai szerkezetet foglalja magában. Az emberi ejtésű beszédben a szegmentális- és a szupraszegmentális szerkezet egyszerre képződik.

Tiszta fázis

A beszédhangoknak három része van: két hangátmeneti rész, valamint a tiszta fázis (a hang középső része). Akusztikailag a tiszta fázis jellemzi legpontosabban az adott beszédhangot.

Triád

Olyan 3 elemű beszédhang kapcsolat, amelyben a középső hang egészben, a két szélső pedig felében van jelen. Beszédszintézisnél használják, mint hangsor építő elemet. Általában CVC triádokat készítenek.

V

A magánhangzó rövidített jelölése a beszéd tudományokban (Vowel). A mássalhangzóknál a C jelölést használják (Consonant).

Zárfelpattanás

A zárhangok képzésének utolsó része, amikor az artikulációs csatornában képzett zárat feloldja a beszélő. A zárfelpattanás gyorsan zajló folyamat (10-40 ms).

Zárhang

A zárhagok képzése két szakaszból áll: zárképzés és zárfeloldás. A magyar orális zárhangok a betű jeleikkel megadva a következők: b, p, d, t, g, k, gy, ty.

Zár-rés hang

Olyan másslhangzók amelyek képzése két szakaszból áll: zár képzés és rés képzés. A magyar zár-rés hangok a betű jeleikkel megadva a következők: c, dz, cs, dzs.

Zönge

A hangszalagok rezgéséből létrejött, gége szintű periodikus, trapézhoz hasonló hulláformájú jel. Alaphangnak is szokták nevezni.
A zönge megléte az alapja a beszédnek. A zönge amplitúdója határozza meg a beszéd hangerejét. A zönge mindenkori frekvenciája adja a beszélő alapfrekvenciáját. Ezt F0-al jelölik Értéke: férfi beszélőnél átlagosan 100 Hz, nőinél 180 Hz, gyermeknél 400 Hz. A zönge frekvenciájának folyamatos változtatásával hozzuk létre a beszéd dallamát. A hangsúly kialakításában is lényeges szerepe van.