PPBA magyar mondat adatbázis

Olyan párhuzamos és precíziós beszédadatbázist hoztunk létre (felolvasott beszédre), amely precíz jelölési, címkézési hátterével biztos alapot nyújt beszédkutatásokhoz, tudományos vizsgálatokhoz, fejlesztésekhez. A párhuzamosság annyit jelent, hogy az 5 nő és az 5 férfi ugyanazokat a magyar mondatokat olvasta fel ugyanolyan hangfelvételi körülmények között. A precíziós jelző azt jelenti, hogy a beszédhullám mögötti annotálási, címkézési és egyéb adatok nagy pontosságúak, gépi és manuális feldolgozás kombinálásával készültek. A manuális ellenőrzés azt jelenti, hogy az adatbázis minden mondatát (minden beszédhangját) vizuális és auditív ellenőrzésnek vetettük alá, ha szükség volt bármilyen javításra azt végrehajtottuk. A végeredmény a PPBA. Ez az egyetlen komplex akusztikai, nyelvi tartalommal rendelkező magyar beszédadatbázis. További részletek a szakcikkben olvashatók itt.

Az adatbázis szerkezeti leírása.

Az adatbázis egyik mondata a 10 beszélő felolvasásában


1. női hang
2. női hang
3. női hang
4. női hang
5. női hang



1. férfi hang
2. férfi hang
3. férfi hang
4. férfi hang
5. férfi hang