Olyan párhuzamos és precíziós beszédadatbázist hoztunk létre (felolvasott beszédre), amely precíz jelölési, címkézési hátterével biztos alapot nyújt beszédkutatásokhoz, tudományos vizsgálatokhoz, fejlesztésekhez. A párhuzamosság annyit jelent, hogy az 5 nő és az 5 férfi ugyanazokat a magyar mondatokat olvasta fel ugyanolyan hangfelvételi körülmények között. A precíziós jelző azt jelenti, hogy a beszédhullám mögötti annotálási, címkézési és egyéb adatok nagy pontosságúak, gépi és manuális feldolgozás kombinálásával készültek. A manuális ellenőrzés azt jelenti, hogy az adatbázis minden mondatát (minden beszédhangját) vizuális és auditív ellenőrzésnek vetettük alá, ha szükség volt bármilyen javításra azt végrehajtottuk. A végeredmény a PPBA. Ez az egyetlen komplex akusztikai, nyelvi tartalommal rendelkező magyar beszédadatbázis. További részletek a szakcikkben olvashatók itt.
Az adatbázis szerkezeti leírása.
Az adatbázis egyik mondata a 10 beszélő felolvasásában