Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
1
TANULMÁNY
GRÁCZI TEKLA ETELKA*, ** ‒ KREPSZ VALÉRIA* *MTA Nyelvtudományi Intézet, **MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport
[email protected], [email protected]
Gráczi Tekla Etelka–Krepsz Valéria: Intervokális réshangok akusztikai szerkezete tinédzser- és
felnőttkorban
Alkalmazott Nyelvtudomány, XVIII. évfolyam, 2018/1. szám
doi:http://dx.doi.org/10.18460/ANY.2018.1.003
Intervokális réshangok akusztikai szerkezete tinédzser- és
felnőttkorban
The acoustic characteristic of speech sounds changes throughout the life span. The question arises
around what age speech production is similar to adults’ speech. The acoustic characteristics of
fricatives have been described for children in English speakers (Nissen‒Fox, 2005). Our question was
whether there is a similarity in the spectral characteristics of fricatives in 16 year old and adult speech
production. To answer the question the spontaneous speech of twelve 16 years olds and twelve young
adults (20-30 years) was analyzed. The duration, static CoG, SD, skewness, kurtosis and dynamic
CoG and voiceless part ratio was measured in their /z/, /s/ and /ʃ/ realizations in spontaneous speech.
The results show that the three consonants show similar distinctiveness, however, the spectral features
show larger differences between the teenagers’ and the adults’ speech, and also between the genders.
These differences may arise from the differences in speech organ size and different voicing distinction
strategies of the speaker groups.
1. Bevezetés
A spiránsok képzése során a toldalékcső valamely artikulációs szervpárja
között rés keletkezik, és az ezen átáramló levegő turbulens zörejt hoz létre
(Strevens, 1960; Stevens, 1971; Stevens, et al., 1992; Jongman, et al. 1998).
A réshangok jól elkülöníthetők egymástól az akadály megjelenésének helye,
és ebből következően az eltérő akusztikai lenyomatuk alapján. Több akusztikai
paraméterrel is jellemezhető a mássalhangzók szerkezete. Ilyen lehetőség
például az egyes spiránsok jellemzésére az intenzívebb frekvenciatartományok
középértékének megadása, azaz a zörejgócok mérése (magyarra vö. pl. Magdics,
1966). A zöngétlen, alveoláris réshangnál a zörejgócok 4000 és 10.000 Hz-es
tartományban helyezkednek el, az éles, sziszegő hangzásért felelős intenzív
zörejgócok jellemzően a 6000 és 8000 Hz közötti tartományban jelennek meg. A
zöngétlen, posztalveoláris spiránsok alacsonyabb frekvenciatartományban, 2200
és 5000 Hz között fordulnak elő, az észleleti susogó érzetét pedig a 3500 Hz
körüli legintenzívebb zörejtartomány adja (Stevens, 2000). A CoG- (Centre of
Gravity) érték a beszédhang spektrális eloszlásának súlypontját, más
megfogalmazásban a frekvenciaértékek amplitúdóval súlyozott átlagát adja meg.
Az azonos zöngésségű, de különböző képzési helyű spiránsokat jellemző
zörejgócok különböző frekvenciákon jelennek meg, azaz a teljes spektrális
lenyomat eltérő CoG-értékekkel jellemezhető. Így a zörejkomponensek alapján
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
2
tudunk megközelítőleg következtetni az artikulációra. Értelemszerűen ugyanez
fordítva is igazolható, azaz az egyes réshangok CoG-értékeit elsősorban a
szájüreg elülső részének alaki és méretbeli változása (az üreg nagysága, illetve a
szűkület mértéke, elhelyezkedése és az ajkak pozíciója) határozza meg (Heinz‒
Stevens, 1961). Több kutatási eredmény egymástól függetlenül is alátámasztotta
azt az állítást, amely szerint a spiránsok időtartama és spektrális szerkezetük
értékei eltérnek a képzési helyek mentén (Jongman et al., 2000; Beke‒
Gyarmathy, 2010). Beke és Gyarmathy (2010) szignifikáns különbséget
igazoltak a vizsgált zöngétlen alveoláris és posztalveoláris réshangok
spektrumának súlypontja, eloszlása, csúcsossága és intenzitása szerint is annak
ellenére, hogy jelentős individuális eltéréseket adatoltak. Igazolódott továbbá az
is, hogy a spektrális szerkezetet befolyásolja a spiránst követő magánhangzó
minősége. A spektrális szerkezet további tényezői, hogy ehhez a súlyponthoz (CoG-hez)
képest a teljes spektrális eloszlás hogyan viszonyul. Ilyen értékek a spektrális
szóródás, a ferdeség és a csúcsosság. A spektrális szerkezet szóródása azt
mutatja meg, hogy mennyire térnek el a spektrumösszetevő frekvenciák a
súlyponttól az adott ejtésben, azaz mekkora frekvenciatartományt fog át az ejtés
során képzett hang. A ferdeség megadja, hogy mennyiben tér el vagy hasonlít a
súlypont alatti frekvenciatartomány formája az a felettihez. A csúcsossággal azt
jellemezzük, hogy mennyiben hasonlít egy CoG-központú Gauss-görbéhez a
spektrális szerkezet. Minél inkább centralizálódik egy frekvenciaérték köré az
intenzitás, annál magasabb értéket kapunk.
Eltérők voltak az eredmények a különböző képzési helyű réshangok spektrális
szerkezetre gyakorolt hatását illetően. Jongman több kutatásában (Jongman,
1998; Jongman et al., 2000) is különbséget igazolt a spektrális paraméterekben a
szibilánsok és nem szibiláns réshangok között.
A képzési hely és a zöngésség hatással van ezen értékek alakulására, de
emellett egyéb univerzális jellemzők megjelenéséhez is vezet (vö. Stevens,
1998; Maddieson, 1999). Ezek közé tartozik többek között az, hogy a zöngétlen
beszédhangok a zöngés párjukhoz viszonyítva hosszabb időtartamban
realizálódnak (Baum‒Blumstein, 1987; Docherty, 1992; Jesus‒Shadle, 2003;
magyarra: Magdics, 1966; Kassai, 1982). Ugyanakkor az egyes nyelvek között
eltérő mintázatok is megjelenhetnek a realizációkban: A zöngésség és a
spirantikus zörej egyidejű fenntartásának aerodinamikai nehézsége például a
portugálban és a magyarban ahhoz vezet, hogy minél hosszabb a zöngés
réshang, annál nagyobb arányban zöngétlenedhet, míg az amerikai angolban
más feloldási stratégiák jelennek meg (pl. Jesus‒Shadle, 2003; Gráczi, 2012).
Noha mind a hazai, mind a nemzetközi szakirodalomban egyre jelentősebb az
életkorral mint befolyásoló tényezővel kapcsolatos kutatások aránya,
ismereteink szerint csak kevés olyan vizsgálat született, amely a réshangok
spektrális szerkezetét elemezné ilyen szempontból. Magyar nyelven történt
vizsgálatban − ismereteink szerint − korábban csupán az idősek és a fiatal felnőtt
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
3
beszélők összehasonlításával foglalkoztak. Bóna és Beke (2013) 10 fiatal és 10
idős női beszélő spontán narratívájában megjelenő zöngétlen alveoláris és
zöngétlen posztalveoláris spiránsok temporális és akusztikai szerkezetének
összehasonlítása alapján a beszédhangok időtartamában nem, míg a spektrális
szerkezetben szignifikáns különbséget mutatott ki a korcsoportok között. A
statisztikai elemzés annak ellenére nem igazolt eltérést a réshangok időzítési
sajátosságaiban a mássalhangzók képzési helyének függvényében a két életkori
csoport között, hogy a beszélők artikulációs tempója szignifikánsan eltért
egymástól.
Különböző életkorú gyermekek ejtésében is elemezték a mássalhangzók
spektrális szerkezetét az angol nyelvben. Nittrouen (1995) a CoG, a spektrális
eloszlás csúcsossága és a ferdesége szempontja mentén vizsgálta a /t, k, s, ʃ/
realizációinak változását 3 és 7 éves kor között. Ezen eredmények szerint a fiatal
gyermekek ejtésében az obstruensek még nem minden képzési jegy mentén
különíthetők el, amit elsősorban a beszédképző szervek kisebb méretével, és az
ebből adódó spektrális szerkezetbeli eltérésekkel magyaráztak. Nissen és Fox
(2005) 3 és 6 év közötti gyermekek ejtésében vizsgálta a [f θ s ʃ] realizációinak
akusztikai jellemzőit. Eredményeik azt mutatták, hogy a gyermekek
beszédprodukciójában még ebben a fiatal életkorban kevésbé különülnek el
egymástól a szibilánsok a képzési helyük alapján, mint a felnőttek ejtésében,
amit a beszédhangok akusztikai szerkezetében körülbelül 5 éves korig
megfigyelhető, a felnőttek ejtésétől jelentősen eltérő spektrális jellemzők is
alátámasztanak.
Tudomásunk szerint magyar nyelven még nem készült gyermeknyelvi
vizsgálat az obstruensek akusztikai szerkezetére vonatkozóan. A
szakirodalomban evidenciaként van jelen, hogy az anyanyelv-elsajátítás
folyamata során a fiziológiai fejlődés folyamatos és ugrásszerű változásokat idéz
elő a gyermekek beszédprodukciós és beszédpercepciós működéseiben, ami
összefügg a beszédképző szervek növekedési mintázatával (l. pl. Vorperian et
al., 2009). Az artikuláció szempontjából meghatározó továbbá, hogy az életkor
előrehaladtával nő a gyermekek artikulációs mozgásainak begyakorlottsága,
fejlődik továbbá a beszédtervezés működése. Emellett a spiránsok előfordulása
relatíve gyakori, és produkciójuk eltér a felnőttekétől, gyakran logopédiai
nehézséget okoz az anyanyelv-elsajátítás során a gyermekek számára (pl.
selypesség, vö. Sebestyénné Tar, 2006).
A jelen vizsgálatban egy korcsoport beszélői, a 16 éves gyermekek
(tinédzserek) ejtésében elemezzük magyar spontán beszédben három réshang [s
z ʃ] realizációit felnőtt adatokhoz viszonyítva. Ebben a korban (pubertáskor) is
számos olyan fiziológiai módosulás következik be, amely hatást gyakorol a
beszédre, a kommunikációs folyamatokra, és amely változások mind a
szegmentális, mind a szupraszegmentális jegyekben kimutathatók. A hormonális
változások hatására a gyermeki hang felnőtt hanggá alakul át a pubertás
időszakában, általában 11 és 16 éves kor között (Hacki‒Hirschberg‒Mészáros,
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
4
2013; Hacki‒Heitmüller, 1999). A mutációs fázisok során a gége megnő (a
lányoknál vertikális, a fiúknál vertikális és horizontális irányba is), a pajzsporc
lemezei által bezárt szög 120 fokról 90 fokra szűkül. A hangszalagok hosszabbá
válnak (a fiúknál a növekedés mértéke eléri az 1 cm-t (átlagosan 16‒29 mm
hosszúak), a lányoknál mindössze 3-4 mm-rel nőnek (átlagosan 10‒21 mm
hosszúak). A hangszalagok szöveti struktúrája a pubertás során a felnőttekéhez
hasonlóvá válik. A másodlagos nemi jelleg kialakulásával elkülönülnek
egymástól a két nem jellemzői. Magyar nyelven végzett fonetikai vizsgálatok
egymásnak ellentmondó eredményekre jutottak a tinédzserek és a felnőttek
beszédhang-időtartam vizsgálatainak összevetése során. Magánhangzók
időzítési sajátosságainak, valamint formánsszerkezetének elemzése alapján
Auszmann (2016) azt igazolta, hogy a 13 éves beszélők realizációi már
nagymértékben hasonlóvá váltak a felnőttek megnyilatkozásaiban mért
értékekhez. Ezzel szemben más kutatás (Krepsz, 2015) szignifikáns különbséget
adatolt a 16 évesek és a fiatalabb gyermekek, valamint a tinédzserek és a felnőtt
beszélők spontán közléseiben megjelenő beszédhangok időtartamértékei között.
A két életkori csoport megnyilatkozásainak vizsgálata alapján a
magánhangzók időzítési sajátosságaiban igazolt különbség felveti a kérdést,
hogy van-e eltérés a 16 évesek és a felnőttek között a réshangok temporális
sajátosságaiban és akusztikai szerkezetében. A jelen kutatásban két zöngétlen
(/s/ és /ʃ/) és egy zöngés (/z/) spiráns realizációit vizsgáltuk 16 évesek és fiatal
felnőtt beszélők spontán megnyilatkozásaiban. Választ kerestünk arra a
kérdésre, hogy milyen különbséget mutatnak a spiránsok temporális és spektrális
értékei a két életkori csoportban. Hipotéziseink szerint (i) a mássalhangzók
akusztikai szerkezete a 16 éves beszélők ejtésében még eltérést mutat a
felnőttnyelvi mintától, (ii) ugyanakkor a képzéshely szerinti különbségek
mindkét korcsoport esetében kimutathatóak lesznek, azaz 16 éves korra már
kimutathatóak.
2. Módszertan A kutatásban 24 magyar anyanyelvű adatközlő spontán beszédét elemeztük. A
beszélőket két életkori csoportból választottuk ki: 12 felnőtt (20 és 29 év
közöttiek, 6 női és 6 férfi) beszélő hanganyagát a BEA adatbázisból (Gósy et al.,
2012), és 12 tinédzser (16 évesek, 6 lány és 6 fiú) hanganyagát a TiniBEA
adatbázisból (Gyarmathy‒Neuberger, 2015). A felvételeket azonos
felvételvezető azonos körülmények között rögzítette. A kiválasztott
beszédhanganyagokban manuálisan címkéztük a /z, s, ʃ/ realizációit a
hullámforma és a hangszínkép alapján folyamatos auditív visszacsatolás mellett
a Praat szoftverben (Boersma‒Weenink, 2016). Minden vizsgált réshang
intervokális helyzetű volt. A VCV hangkapcsolatokban a környező
magánhangzók minősége a spontán beszéd sajátosságaiból adódóan nem
kiegyenlítettek. A hangfájlokat 22,5 kHz-en újramintavételeztük. A
mássalhangzók határait a megelőző magánhangzó F2-jének végétől a követő
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
5
magánhangzó F2-jének kezdetéig jelöltük (1. ábra). Ez alapján számítottuk ki a
beszédhang időtartamát. Automatikusan mértük a mássalhangzókban a
zöngétlen rész arányát. A spektrális méréseket a spiránsok időtartamában 10%-
onként végeztük, 10% és 90% között (összesen 9 pontban). Az időtartam 20%-
ával egyező méretű, 10%-onként gördülő Hamming ablakot alkalmaztunk. Az 1.
ábra alján látható példán bemutatva: A mássalhangzó közepén (50%) annak
időtartamának 40%-a és 60%-a közötti szakasz átlagos CoG-értékét adtuk meg.
Egy erre a célra létrehozott Praat-szkript segítségével kinyertük a spektrális
eloszlás súlypontját (Centre of Gravity: CoG), szórását, ferdeségét és
csúcsosságát, valamint a vizsgált mássalhangzók időtartamát és zöngétlen
részük arányát. A kategoriális elemzés során zöngésnek tekintettük a
megvalósulást, ha legfeljebb az időtartamának 30%-ában volt zöngétlen,
zöngétlennek pedig legalább 70%-os érték esetében. A két érték között részben
zöngésként elemeztük a megvalósulást. A 30%-os határt az /s/ megvalósulásai
alapján választottuk. Ezek 90%-a (az összes adatot együtt elemezve beszélői
csoportbontás nélkül) legalább 70%-ban zöngétlen volt. A mérési hibákat
(kiugró értékeket) kizárva minden /s/-realizáció legalább 60%-ban zöngétlen
volt. (A viszonylag alacsony érték az időtartammal van összefüggésben:
rövidebb ejtés esetén a néhány periódusnyi zönge nagyobb arányt ad.)
A statisztikai elemzést az SPSS programban végeztük el: párosított t-próba,
Pearson-féle korrelációszámítás és ismételt méréses ANOVA. Ez utóbbiban
függő változóként a mássalhangzó-minőség, a korcsoport, a nem, ezek
páronkénti és hármas interakciója szerepelt.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
6
1. ábra. Minta a címkézés és a CoG-mérés menetére az [nɛɛm] hangsorban
3. Eredmények
A teljes mássalhangzóban mért jellemzők Az időtartam, a statikus CoG, a szóródás, a ferdeség, a csúcsosság és a
zöngétlen rész aránya, tehát a mássalhangzók teljes időtartamában mért jegyek
esetében az ismételt méréses ANOVA alapján a korcsoport és a nem
meghatározó a beszélők közötti varianciában, míg a korcsoport*nem interakció
nem. A réshangok közötti eltérés szignifikáns, és a mássalhangzó-minőség
interakciója a korral, illetve a nemmel ugyancsak meghatározónak bizonyult a
vizsgált akusztikai jellemzőkre. A hármas interakció
(mássalhangzó*korcsoport*nem) nem mutatott szignifikáns hatást. A statisztikai
eredményeket az 1. táblázatban foglaltuk össze.
1. táblázat. Az ismételt méréses ANOVA eredményei
F p
C 592,319 < 0,001
C * korcsoport 3,620 0,031
C * nem 3,242 0,043
C * korcsoport * nem 0,805 0,645
A mássalhangzók időtartama egyetlen kiugró értéktől eltekintve 27 és 213
ms között szórt. A legrövidebb realizációt mind a négy beszélői csoportban
(tinédzser fiúknál [átlag: 66 ms, SD: 17 ms) és lányoknál (átlag: 62 ms, SD: 13
ms), illetve a felnőtt férfiaknál (átlag: 71 ms, SD: 28 ms) és nőknél (átlag: 72
ms, SD: 19 ms] a /z/ esetében mértük (2. ábra). A /ʃ/ esetében hosszabb
időtartamokat adatoltunk [tinédzser fiúk (átlag: 102 ms, SD: 20 ms), lányok
(átlag: 106 ms, SD: 24ms), felnőtt férfiak (átlag: 104 ms, SD: 22 ms), nők (átlag:
116 ms, SD: 27ms], míg a leghosszabb előfordulásokat a /s/ esetében adatoltuk
[tinédzser fiúk (átlag: 111 ms, SD: 24 ms), lányok (átlag: 107 ms, SD: 18 ms),
felnőtt férfiak (átlag:118 ms, SD: 21ms), nők (átlag: 118 ms, SD: 34 ms].
A /z/ időtartama minden csoportban a zöngétlen párjához képest kb. 40%-kal,
a posztalveoláris réshanghoz képest pedig 30–40%-kal rövidebb időtartamban
valósult meg. A két zöngétlen réshang 1–12% közötti időtartambeli eltérést
mutatott: a két női csoport esetében gyakorlatilag teljesen azonos értéket
adatoltunk (1,0% és 2,0% eltérés), míg a férficsoportok esetében kismértékű
eltérést kaptunk (8,5%, 12,0%). Lényegében tehát nem volt különbség közöttük.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
7
2. ábra. Az időtartamok értékei a három vizsgált mássalhangzó, valamint a beszélők életkorának és
nemének függvényében (átlag és 95%-os CI)
A különböző típusú spiránsokat jellemző spektrális eloszlás súlypontjai
(CoG) az elvártaknak megfelelően a képzéstől függően különböző
frekvenciákon jelentek meg. Különbség mutatkozott a CoG-értékekben a
beszélők életkorától és a nemétől függően is. A legalacsonyabb CoG-értéket a
felnőtt férfiak esetében, míg a legmagasabbat a tinédzser lányok közléseiben
mértük mindhárom mássalhangzó esetében (3. ábra). A legmagasabb értékek
mind a négy csoportban a /s/ megvalósulásaiban mutatkoztak: az átlagok 6301
Hz (SD = 754 Hz) és 7995 Hz (SD = 735 Hz) között alakultak. Ennél a /ʃ/
realizációi CoG-ja jóval alacsonyabb értéket vett fel, 3449 Hz (SD = 859 Hz) és
4735 Hz (SD = 721 Hz) között alakultak a négy beszélői csoport értékei. A
csoportokon belül 32–48%-nyi eltérés volt a két hangzó között. A zöngés
alveoláris réshang megvalósulásai jóval nagyobb eltérést mutattak a két
zöngétlen réshanghoz képest. Míg a tinédzser lányok esetében ez a zöngétlen
párjához közeli értékeken realizálódott (6950 Hz ± 1813 Hz), addig a többi
beszélői csoportnál az /ʃ/-realizációkhoz hasonló CoG-értékeket mértünk erre a
beszédhangra. Két csoportban a posztalveoláris réshangnál magasabb átlagos
spektrális súlypont-értéket kaptunk (tinédzser fiúk: 4492 Hz ± 1990 Hz, felnőtt
nők: 4478 Hz ± 2657 Hz), a felnőtt férfiaknál azonban alacsonyabbat (2970 Hz
± 2286 Hz). A csoportok közötti különbségek mellett meg kell említeni a szórás
magas értékét is. Míg a két zöngétlen réshang esetében 578 Hz és 1003 Hz
között alakult a CoG-ben mért szóródás (a legtöbb esetben 760 Hz körüli
értékkel), addig a zöngés mássalhangzó ejtésében a legkisebb érték 1813 Hz
volt. Ennek oka, hogy a zönge képzése leállhat a zöngés réshang ejtése során.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
8
Ezen jelenségek hátterében feltehetően a fonológiai zöngésség fonetikai vetülete
áll elsősorban. A zönge fenntartása szájüregi rés és zár esetében nehézkes az a
mögött feltorlódó, így a szupraglottális nyomást megemelő levegőmennyiség
miatt (pl. Halle–Clements, 1983). Az emelkedő nyomás nehezíti, lassítja, majd
meg is akadályozhatja a hangszalagok felnyílását, illetve a hangszalagok között
is megemelkedő nyomás azok összezáródását akadályozza meg később (l.
Bickley‒Stevens 1986). Ennek az aerodinamikai kényszernek az elkerülésére
több lehetséges beszélői „stratégia” létezik. Egyrészt ejtheti a beszélő
rövidebben a beszédhangot, nyithatja a nazális üreg felé a toldalékcsövet, a
realizáció approximánsként jelenhet meg (approximalizálódhat) stb. (pl.
Bárkányi–Kiss, 2009) Emiatt a beszélők között, de a beszélőn belül is változó,
hogy részben (és hogy mennyire) zöngétleníti a mássalhangzót, esetleg
approximáns jelenik meg, avagy rövid – valóban réssel képzett – réshangot ejt
(magyarra l. pl. Bárkányi‒Kiss‒Mády, 2009; Gráczi, 2012; 4. ábra). A 4. ábrán a
/z/ realizációinak főbb típusait mutatjuk be. Az első minta egy teljes idejében
zöngés réshangként realizálódott beszédhang, míg a második során a résképzés
közben leáll a zöngeképzés, majd a résből a magánhangzóba való nyílás során
újraindul. A harmadik ejtésminta egy kisebb mértékben zörejes ejtést mutat, de a
képzés még réses, a zöngeképzés pedig folyamatos. A negyedik /z/-realizáció
esetében egy nagyon rövid approximáns ejtést láthatunk. Ez a megjelenés is
jellemző, ebben az esetben nem a zönge áll le, hanem a rést nem képzi meg a
beszélő, csak szűkületet hoz létre az adott (jelen esetben alveoláris) képzési
helyen. A bemutatott beszédhang rövidsége nem csak a rés-zönge párhuzamos
képzésének nehézségének feloldására utal, hanem a beszélő nem lazább,
közvetlenebb beszédmódjának is következménye.
3. ábra. A statikus CoG értékei a vizsgált mássalhangzók, valamint a beszélők életkorának és nemének
függvényében (átlag és 95%-os CI)
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
9
4. ábra. Ejtésminták a /z/ megvalósulásaira:
Zöngés [z], részben zöngés [z̯], kevésbé zörejes [z], approximáns ejtés [ɹ]
A fenti okok miatt a /z/ esetében részletesebben is elemeztük a zöngétlenedés
mértékét (5. ábra). A felnőttek átlagosan kisebb mértékben zöngétlenítették a
realizációkat, mint a tinédzserek. A fiatalabb korcsoportban a lányok, a
felnőtteknél a férfiak esetében volt nagyobb arányú a zöngétlen rész aránya. Az
egyéni különbségek jellemzőek voltak, de a csoportokra jellemző tendenciáktól
csak két személy tért el nagyobb mértékben: a felnőtt férfiak között egy esetében
jelentősen magasabb a zöngétlen rész aránya a többiekéhez képest, a tinédzser
fiúk között pedig egy személy a csoport többi tagjához képest csak kisebb
mértékben zöngétlenített. Az átlagos zöngétlenrész-arányon túl a zöngés-
zöngétlen ejtés gyakorisága is jellemző a csoportokra. Azaz nem csak az, hogy
milyen arányban zöngétlen egy-egy ejtés, hanem az is, hogy milyen
gyakorisággal jelenik meg ilyen realizáció (6. ábra).
Arra a kérdésünkre, hogy mennyiben függ össze a zöngétlenítés mértéke a
spektrális súlyponttal a /z/ megvalósulásaiban, Pearson-féle korrelációszámítás-
sal kerestük a választ. A két érték között erős szignifikáns összefüggést találtunk
(r2 = 0,809, p < 0,001). A négy csoportot külön-külön elemezve az r2 értéke a
felnőtt nőknél 0,813, a felnőtt férfiaknál 0,897, a tinédzser lányoknál 0,731, a
tinédzser fiúknál 0,842 volt, a p-é pedig minden esetben kisebb volt, mint 0,001.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
10
5. ábra. A zöngés alveoláris réshang megvalósulásaiban mért zöngétlen rész aránya (%; átlag és 95%
CI)
6. ábra. A zöngés, részben zöngés és a zöngétlen ejtés gyakorisága (%)
A spektrális szerkezet eloszlását a súlyponthoz képest a szóródás, a ferdeség
és a csúcsosság alapján jellemezhetjük.
A spektrális szerkezet szóródása, azaz a spektrumösszetevők súlyponttól
való eltérése nagy különbséget mutatott a vizsgált mássalhangzók mentén. A
vizsgálati anyagunkban a legkisebb szórást az /ʃ/, a legnagyobbat a /z/ mutatta
(/ʃ/-realizációk: 1498 Hz ±419 Hz; /s/-megvalósulások: 1861 Hz ± 515 Hz és a
/z/ ejtésének értékei: 2413 Hz ± 835 Hz; 7. ábra). A felnőttek a zöngés hangzó
esetében nagyobb átlagos eltérést mutattak a spektrális szórás értékében, mint a
tinédzserek. A felnőtt nők inkább kevésbé zöngétlenítettek, így a zörejgócokon
túl az alsóbb, a zönge következtében megjelenő zörejösszetevők is nagy
intenzitással voltak jelen a spektrumban, így a szóródás magasabb, mint a
férfiak esetében, hiszen az ejtés nagyobb frekvenciatartományt ölel fel. A
18
34
55
48
33
26
33
28
49
40
12
24
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
tinédzser lány
tinédzser fiú
felnőtt nő
felnőtt férfi
Zöngés Részben zöngés Zöngétlen
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
11
spektrális szórás átlagos eltérése ugyanakkor hasonlóan nagyobb, mindkét
csoportban, mint a tinédzsereknél, mivel a fiatalabb korcsoportra a zöngétlenebb
ejtés jellemzőbb, így kisebb variabilitást mutatnak, mint a felnőttek, akiknél a
beszélőn belül és a beszélők között is változó a zöngétlenebb és a
nagymértékben zöngés realizációk megjelenése. A zöngétlen réshangok közötti
eltérés ellentétes a felnőtt és tinédzser korcsoport között. Míg az alveoláris
esetében a felnőttek, addig a posztalveoláris ejtésében a tinédzserek
szóródásértékei magasabbak. Ennek a feltehető magyarázatához további
elemzések szükségesek.
7. ábra. A szóródás értékei a mássalhangzó minősége és a beszélők életkorának függvényében (átlag
és 95%-os CI)
Mind a három mássalhangzó esetében eltérő mintázatot találtunk a
mássalhangzók spektrális szerkezetének ferdeségében, azaz hogy a négy
beszélői csoportban milyen értékek jelennek meg (8. ábra). A posztalveoláris
réshang esetében az életkor, az alveoláris zöngétlen beszédhangok esetében
pedig a nem mentén találtunk tipikus eltérést. A posztalveoláris esetében minden
csoportban pozitív értékeket kaptunk, míg az alveoláris zöngétlen esetében
többnyire negatívat, kevés személynél 0-hoz közeli pozitívot. Azaz eltér a két
hangzó abban, hogy a spektrális súlypont alatti és feletti terület összetevői
mekkora tartományban jelennek meg milyen intenzitásviszonyokat mutatva.
Illetve a /s/ megvalósulásai esetében ez a két frekvenciatartomány hasonló is
lehet. A/z/ realizációi ebben az értékben is nagyobb variabilitást mutattak, mint
a másik két konszonáns. Egyrészt a beszélői csoportok átlaga is eltérő, másrészt
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
12
a csoportokra jellemző átlagos eltérés is, azaz kevésbé egységes az ejtés az
egyik, mint a másik esetben. Ismét a zöngésséggel kapcsolatos a magyarázat.
Míg a fiatalok gyakrabban és nagyobb arányban zöngétlenítenek, így a /s/-
realizációkhoz hasonlóan ejtve a zöngés párt is, addig a felnőttek esetében
változóbb, hogy zöngétlenítenek-e, és milyen mértékben.
8. ábra. A ferdeség értékei a vizsgált mássalhangzó, valamint a beszélők életkorának és nemének
függvényében (átlag és 95%-os CI)
A csúcsosság mentén elemezve a mássalhangzókat ismét eltérő mintázatot
találunk az egyes beszélői csoportok között (9. ábra). Az alveoláris zöngétlen
réshang esetében jellemzően a női beszélők (életkortól függetlenül) produkáltak
centralizáltabb ejtést, mint a férfiak, míg a posztalveoláris esetében ebben az
esetben is az életkor mentén volt kimutatható eltérés. A felnőttek ejtésében a /ʃ/-megvalósulások csúcsosabb intenzitáseloszlást mutattak. A tinédzserek esetében
a két zöngétlen réshang között, illetve a zöngés és a zöngétlen mássalhangzók
között nem volt jelentős eltérés, a normál eloszláshoz közel eső frekvencia-
intenzitás viszonyokat mutattak a spektrális súlyponthoz képest. A felnőttek
esetében a posztalveoláris magasabb értékei ennél jóval csúcsosabb,
centralizáltabb ejtést jelentenek.
A zöngés mássalhangzó a zöngefenntartási eltérések miatt ismét a
korcsoportok között tért el jobban. A tinédzserek esetében – mint említettük – a
zöngétlen réshangokhoz hasonló ejtés volt jellemzőbb, míg a felnőttek esetében
a gyakrabban nagymértékben zöngés ejtés, és az így nagyobb
frekvenciatartományban megvalósuló akusztikai lenyomat eredményezhetett
negatív értékeket is (azaz „laposabb” ejtést mutatott), de a pozitív értékek is
nagy arányban és nagy tartományban jellemzőek az idősebb csoportra a
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
13
zöngétlenebb ejtések jelenléte miatt. Összességében nagyobb variabilitás
jellemzi tehát a felnőtt ejtést.
9. ábra. A csúcsosság értékei a vizsgált mássalhangzó, valamint a beszélők életkorának és nemének
függvényében (átlag és 95%-os CI)
A statikus jegyek együttes elemzését beszélői csoportonként is elvégeztük,
hogy információt kapjunk, az egyes beszélői csoportokban milyen elkülönülés
jelentkezik a három mássalhangzó között. A 3. táblázatban foglaltuk össze a
párosított t-próba eredményeit. A tinédzserek és a felnőttek ejtésére kapott
adatok nem mutatnak jelentős eltérést. A zöngésségi pár esetében az időtartam, a
zöngétlen rész aránya és a statikus CoG eltért, azaz a két mássalhangzó a /z/-
realizációk gyakoribb és nagyarányú zöngétlenedése ellenére a spektrális jegyek
mentén is elkülöníthetőek akusztikai szerkezetük alapján.
A két zöngétlen réshang között minden csoportban eltér a CoG értéke és a
ferdeség, a további jegyek változó eredményt adtak. Azt mondhatjuk tehát, hogy
a fenti két érték mentén akusztikailag elkülöníthető a két konszonáns.
A /z/ és az /ʃ/ közötti eltérés a /z/-megvalósulások sokszínűsége miatt nem
mutat könnyen leírható képet. Az időtartam és a spektrális eloszlás szóródása
alapján minden csoportban elkülönül, és a legtöbb csoportban a zöngétlen rész
aránya is eltér.
3. táblázat. A statikus jegyek együttes elemzésének eredménye: párosított t-próba. A szabadságfok (df)
minden esetben 5. A szürke cellák a szignifikáns értékeket jelölik. A hármas hasonlítás miatt p <=
0,0167 esetén szignifikáns az eltérés.
Tinédzser lányok Tinédzser fiúk Felnőtt nők Felnőtt férfiak
t p t p t p t p
/ z / é s /s / Időtartam −29,439 < 0,001 −11,346 < 0,001 −9,550 < 0,001 −12,353 < 0,001
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
14
Zöngétlen rész −5,387 0,003 −5,040 0,004 −4,001 0,010 −5,067 0,004
Statikus CoG −7,114 0,001 −3,919 0,011 −3,953 0,011 −5,241 0,003
CoG SD-je 4,660 0,006 20,673 0,000 2,618 0,047 1,776 0,136
Ferdeség −0,426 0,688 0,054 0,959 1,899 0,116 2,903 0,034
Csúcsosság −0,117 0,911 0,624 0,560 1,400 0,220 2,592 0,049
/z/
és /ʃ/
Időtartam −14,889 < 0,001 −15,648 < 0,001 −11,780 < 0,001 −5,654 0,002
Zöngétlen rész −4,765 0,005 −3,924 0,011 −2,353 0,065 −4,284 0,008
Statikus CoG 7,501 0,001 0,525 0,622 0,831 0,444 −0,765 0,479
CoG SD-je 4,117 0,009 5,052 0,004 6,878 0,001 6,054 0,002
Ferdeség −18,981 0,000 −2,107 0,089 −1,469 0,202 0,496 0,641
Csúcsosság 0,498 0,639 −0,370 0,727 0,664 0,536 1,528 0,187
/s/
és /ʃ/
Időtartam −0,218 0,836 2,762 0,040 1,836 0,126 4,061 0,010
Zöngétlen rész 4,469 0,007 3,209 0,024 3,059 0,028 2,551 0,051
Statikus CoG 14,275 < 0,001 7,953 0,001 25,750 < 0,001 12,817 < 0,001
CoG SD-je 0,268 0,799 −0,414 0,696 2,845 0,036 5,083 0,004
Ferdeség −9,466 < 0,001 −4,077 0,010 −7,331 0,001 −4,235 0,008
Csúcsosság 0,907 0,406 −0,558 0,601 −1,938 0,110 −2,536 0,052
A dinamikus spektrális eloszlás elemzése
A dinamikus CoG-t, azaz a spektrális súlypont időbeli alakulását szemlélteti
a 10. ábra a négy beszélői csoport átlagértékei alapján az egyes
mássalhangzókra. A tinédzser lányok ejtésében az /s/ és a /z/ a képzés teljes
időtartama alatt közeli értékeket vesz fel, míg a többi beszélői csoportban a
zöngés alveoláris a /ʃ/ értékeihez közelebbi CoG-menetet mutat. A
mássalhangzók kezdetén és végén tapasztalt emelkedő majd ereszkedő CoG-
menet természetesen a hangkörnyezet hatása, azaz a megelőző és a követő
magánhangzó miatti hangátmenet velejárója. Ugyanakkor a zöngésségi párok
kezdeti és végső szakaszán a CoG-érték alakulása eltért, ami a fenntartott és a
leállított zöngeképzés alsó frekvenciatartományban megjelenő összetevők
következménye főként. Ezt az összefüggést alátámasztja a 10. ábra, ahol az
összes beszélő közül a legkisebb (TF4) és a legnagyobb arányban (FF6), illetve
egy átlagos mértékben zöngétlenítő beszélő (TN1) átlagos dinamikus CoG-jét
mutatjuk be. TF4 esetében a /z/ súlypontja az ejtés teljes időtartama alatt a két
zöngétlen réshangnál alacsonyabb értéket vesz fel az alsóbb
frekvenciatartományokon jelenlévő összetevők miatt, míg FF6 beszédében az
időtartam 20–60%-os pontjai között a két alveoláris mássalhangzó azonos
értékeket mutat. A kb. 70%-tól megjelenő eltérés a követő magánhangzóhoz
előbb meginduló zönge miatt jelenik meg. A kb. 45%-ban zöngétlenítő TN1
ejtésében a /z/-realizációk zöngéje kb. 20%-nyi idő után jelenik meg, és 80%-tól
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
15
indul újra. A két érték között a spektrális súlypont folyamatosan közeledik az /s/
CoG-vonulatának értékeihez.
10. ábra. A dinamikus CoG a mássalhangzó minősége és a beszélők életkorának függvényében
11. ábra. A dinamikus CoG három különböző /z/-realizációtípust alkalmazó beszélő ejtésében
Kiszámítottuk az egyes fonémák realizációjának spektrálissúlypont-menete
közötti euklideszi távolságot. Azaz az egyes időpontokban kapott átlagos
eredményeket összesítve is összevetettük a mássalhangzókat. A spektrális
súlypont eloszlásbeli euklideszi távolságok mentén kapott átfedések esetén tehát
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
16
az időtartam alapján akusztikailag megkülönböztethető maradhat a
mássalhangzópár.
Az eredményeket a 12. ábra mutatja be. A zöngésségi pár távolsága a két női
csoport esetében nagyobb szóródást mutat, és felnőttkorban magasabb értékek
jelentek meg. Ez összefügg a korábban leírtakkal, azaz a /z/-megvalósulások
változatos megjelenésével, és a 16 éves csoport gyakori és nagymértékű
zöngétlenítésével. A /z/ és a /ʃ/ közötti eltérés a női beszélők esetében magasabb
és nagyobb szóródást mutat, mint a férfiaknál, a korcsoporttól függetlenül. A
tinédzser lányok jellemzően nagyobb eltéréssel ejtették a két hangzót, mint a
felnőtt nők. Ezen két konszonáns esetében kisebb eltérést vártunk, mint a két
alveoláris között, mert a posztalveoláris jellemzően alacsonyabb
frekvenciatartományban realizálódik, mint az alveoláris zöngétlen réshang,
ugyanakkor a zöngés alveoláris zöngés megvalósulása az alacsony
frekvenciakomponensek miatt alacsonyabb CoG-értékeket mutatna. Ez a
felnőttek esetében részben átfedéssel, de megvalósul. A fiatalabb korcsoportban
az átfedés nagy, és a lányok esetében a magasabb az eltérés, mint a zöngésségi
pár esetében, hiszen nagyrészt zöngétlenek a /z/-realizációk. Ugyancsak a
fonológiai zöngésség miatt a két zöngétlen réshang között kisebb eltérést
várnánk, mint a zöngésségi pár esetében. Ez a tinédzser fiúk kivételével nem
teljesült. A nagy szóródás ebben a csoportban is megkérdőjelezi a hangzók
realizációja közötti eltérés relevanciáját.
12. ábra. A mássalhangzók dinamikus CoG-értékei közötti euklideszi távolság (Hz)
4. Következtetések A jelen tanulmány a /z, s, ʃ/ hangok temporális és spektrális jellemzőit
vizsgálta tinédzserek és felnőtt beszélők spontán beszédében. A kutatás fő
kérdése az volt, hogy kimutatható-e különbség a két életkori csoport között,
valamint a beszédhangok képzési helye szerint a vizsgált paraméterekben.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
17
A réshangok időtartama jelentősen különbözött egymástól a mássalhangzók
képzéshelye és zöngéssége szerint. A zöngés spiráns átlagosan 40 ms-mal
rövidebb időtartamban valósult meg, mint a zöngétlen réshangok, míg az /ʃ/ és
/s/ között jelentős átfedést is adatoltunk. A beszélők életkorának a
hangidőtartamokra gyakorolt hatását a jelen kutatás eredményei alátámasztják.
A magyar szakirodalmi adatok azonban gyakran ellentmondóak a tekintetben,
hogy a tinédzser beszélők hangidőtartam-értékei elkülönülnek-e a felnőtt
beszélők realizációitól (vö. Krepsz, 2015; Auszmann, 2016). A jelen vizsgálat
szignifikáns különbséget igazolt mindhárom réshang képzési helye és
zöngéssége mentén a korcsoportok között. Megjegyzendő ugyanakkor, hogy a
szakirodalmi kutatások magánhangzók időtartamát elemezték, valamint hogy
mindkét vizsgálat esetében fiatalabb gyermekek értékeit is figyelembe vették az
összehasonlítás során. Nem igazolódott különbség azonban a nemek
tekintetében sem tinédzser, sem felnőttkorban, szemben a korábbi, réshangok
időtartamát felnőttek ejtésében vizsgáló kutatás (Beke‒Gyarmathy, 2010)
eredményeivel, ahol a nők szignifikánsan hosszabban ejtették az egyes
mássalhangzókat.
A vizsgált réshangok spektrális szerkezetének elemzése alátámasztotta az
egyes beszédhangok zöngésség és a képzési hely szerinti elkülönítését a vizsgált
paraméterek alapján. A szakirodalmi adatokhoz (Beke‒Gyarmathy, 2010)
hasonlóan az alveoláris zöngétlen réshang átlagos CoG-értékei magasabban, a
posztalveoláris zöngétlen réshangé alacsonyabban jelentek meg, míg a /z/
realizációinak értékei jelentős átfedést mutattak mindkét hanggal az átlagértékek
alapján, illetve nagyobb variabilitást mutattak azoknál Ennek hátterében a
képzésük során fenntartandó rés és zönge párhuzamos képzésének nehézsége áll.
A zönge esetleges leállása, a rövidebb, de tipikus zöngés réshangként való
realizáció és az approximált (vagy ahhoz közelítő ejtés) változatossága a
spektrális szerkezetben is evidensen megmutatkozott. A spektrális eloszlás
súlypontjának elhelyezkedését meghatározta továbbá a beszélők életkora és
neme is. Míg a felnőtt férfiak esetében mutatkoztak a legalacsonyabb, és a
tinédzserkorú lányoknál a legmagasabb értékek, a tinédzser fiúk és a felnőtt nők
átlagos CoG-értékei közel azonosak voltak. Mindez valószínűsíthetően a
toldalékcső életkoronként és nemenként eltérő méreteivel magyarázható.
A szóródás legnagyobb arányban a /z/ hang esetében volt adatolható, ami
feltehetően részben ismét összefügg azzal, hogy a zöngés mássalhangzó
realizációja változatos mértékben zöngétlenedhet.
A réshangok spektrális ferdeségének és csúcsosságának variabilitása a
korábbiakhoz hasonlóan elsősorban az üregek eltérő méretével és a
mássalhangzók zöngésség szerinti elkülönülésével támasztható alá. Emellett
azonban fontos figyelembe venni a mássalhangzók közötti mintázatvariabilitás
szempontját is, amit részben a beszédhangok relatíve gyakori megjelenése,
valamint a vokális környezet változatossága is alátámaszt.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
18
Az eredmények alapján további vizsgálati kérdések is felmerülnek. Ilyen
például, hogy hogyan változik a spiránsok spektrális szerkezete a fiatalabb és
idősebb beszélők ejtésében, valamint hogy mennyiben függnek a vizsgált jegyek
az egyéni ejtési sajátosságoktól.
A mássalhangzók vizsgálata spontán beszédben történt, ilyen módon a
hangkörnyezet kiegyenlítetlen volt. A továbbiakban tervezzük a kutatás
kiterjesztését laboratóriumi beszéd elemzésére, amelyben a magánhangzók
minősége, valamint a prozódiai szerkezet kontrollálása mentén is összevethetővé
válnának az egyes csoportok értékeit, illetve tervezzük a vizsgálat bővítését új
életkori csoportok bővítésével.
A kérdés azonban felmerül, hogy az emberi beszédészlelés pontosan hogyan
dolgozza fel az akusztikumot. A másik felmerülő kérdés, hogy a zöngétlenebb
/z/-ejtések során a dinamikus CoG menete, avagy egy átlagolt CoG-észlelet
mentén történhet a percepcióban az elkülönítés a mássalhangzók között hasonló
időtartam esetében. Figyelembe kell venni természetesen, hogy a zöngés
mássalhangzó időtartama mindkét zöngétlennél jóval rövidebb, ami további
másodlagos felismerési kulcsokkal együttesen segíti az azonosítást.
Irodalom Auszmann A. (2016) Magyar gyermekek magánhangzóinak akusztikai-fonetikai jellemzői. Doktori
disszertáció. Budapest: ELTE BTK.
Bárkányi Zs. & Kiss Z. (2009) Word-final fricative contrasts in Hungarian. A phonetic approach.
Előadás a BuPhoC 2009 nov. 5-i ülésén. Letölthető: http://budling.nytud.hu/~cash/papers/
buphoc09-slide.pdf
Bárkányi Zs., Kiss Z. & Mády K. (2009) Az /s/–/z/ oppozíció fenntartása megnyilatkozás végén.
Előadás a Beszédkutatás 2009 konferencián. Budapest, 2009. okt. 16–17. Letölthető:
http://budling.nytud. hu/~cash/papers/beszkut2009-slide.pdf
Baum, S. R. & Blumstein, S. E. (1987) Preliminary observations on the use of duration as a cue to
syllable-initial fricative consonant voicing in English. Journal of the Acoustical Society of America
82. pp. 1073–1077.
Beke A. & Gyarmathy, D. (2010) Zöngétlen résmássalhangzók akusztikai szerkezete. Beszédkutatás
2010. pp. 57−75.
Bickley, C. A. & Stevens, K. N. (1986) Effects of a vocal tract constriction on the glottal source:
experimental and modeling studies. Journal of Phonetics 14. pp. 373−382.
Bóna, J. & Beke, A. (2013) A zöngétlen réshangok akusztikai szerkezete fiatal és idős korban.
Elhangzott: Az interkulturális kommunikáció elmélete és gyakorlata. Tudományos konferencia a
Kodolányi János Főiskola és az ELTE BTK Alkalmazott Nyelvészeti Tanszéke szervezésében.
Budapest, 2011. október 24–25.
Boersma P. & Weenink D. (2016) Praat: doing phonetics by computer.
http://www.fon.hum.uva.nl/praat/ (A letöltés ideje: 2016. 02. 13.)
Docherty, G. J. (1992) The Timing of Voicing in British English Obstruents. Berlin: Foris
Publications.
Fónagy I. & Szende T. (1969) Zárhangok, réshangok, affrikáták hangszínképe. Nyelvtudományi
Közlemények 71. pp. 281–343.
Gósy M., Gyarmathy D., Horváth V., Gráczi T. E., Beke A., Neuberger T. & Nikléczy P. (2012)
BEA: Beszélt nyelvi adatbázis. In: Gósy M. (szerk.) Beszéd, adatbázis, kutatások. Budapest:
Akadémiai Kiadó. 9‒24.
Gráczi T. E. (2012) Zörejhangok akusztikai fonetikai vizsgálata a zöngésségi oppozíció
függvényében. Doktori disszertáció. Budapest: ELTE BTK.
GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA
19
Gyarmathy D. & Neuberger T. (2015) Egy hiánypótló adatbázis: a Tini BEA. Beszédkutatás 2015.
pp. 209−222.
Hacki, T. & Heitmüller, S. (1999) Development of the child’s voice: premutation, mutation.
International Journal of Pediatric Otorhinolaryngology 49. pp. 141−144.
Halle, M. & Clements, G. N. (1983) Problem Book in Phonology. Cambridge: MIT Press.
Heinz, J. M. & Stevens, K. N. (1961) On the properties of fricative consonants. Journal of the
Acoustical Society of America 33. pp. 589−596.
Hacki T., Hirschberg J. & Mészáros K. (2013) A hangképzés gyermekkori fejlődése, premutáció,
mutáció. In: Hirschberg J., Hacki T. & Mészáros K. (szerk.) Foniátria és társtudományok I.
Budapest: Eötvös Kiadó. pp. 213−216.
Jesus, L. M. T. & Shadle, C. H. (2003) Temporal and devoicing analysis of European Portuguese
fricatives. In: Solé, M.-J.; Recasens, D. & Romero, J. (eds.): 5th International Congress of Phonetic
Sciences. pp. 779–782.
Jongman, R. G. H. & Wayland, R. ‒ Wong, S. (1998) Acoustic Characteristics of English
Fricatives. Journal of the Acoustical Society of America 108. pp. 1252−1263.
Jongman, A.; Wayland, R. & Wong, S. (2000) Acoustic characteristics of English fricatives. Journal
of the Acoustical Society of America 108. pp. 1252−1263.
Kassai I. (1982) A magyar beszédhangok időtartamviszonyai. In: Bolla Kálmán (szerk.) Fejezetek a
magyar leíró hangtanból. Budapest: Akadémiai Kiadó.
Krepsz V. (2015) Magánhangzó-időtartamok alakulása a hangsor hossza és az életkor függvényében.
In: Váradi T. (szerk.) Doktoranduszok tanulmányai az alkalmazott nyelvészet köréből.
http://www.nytud.hu/alknyelvdok15/proceedings/anyd9.pdf (letöltés: 2017. 11. 01.)
Maddieson, l. (1999) Phonetical universals. In: Hardcustle, William J. & Laver, John (eds.) The
handbook of phonetic sciences. Oxford: Blackwell Publishers. pp. 619‒639.
Magdics K. (1966) A magyar beszédhangok időtartama. Nyelvtudományi Közlemények 68. 125–139.
Nissen, S. L. & Fox, R. A. (2005) Acoustic and spectral characteristics of young children's fricative
productions: A developmental perspective. Journal of the Acoustical Society of America 118. pp.
257−258.
Nittrouer, S. (1995) Children learn separate aspects of speech production at different rates: Evidence
from spectral moments. Journal of the Acoustical Society of America 97. pp. 520−530.
Sebestyénné Tar É. (2006) A 3-6 éves kori fonológiai fejlődéskronológiai mintázata a magyarban.
Budapest: Open Art.
Stevens, K. N. (1971) Airflow and turbulence noise for fricative and stop consonants: Static
considerations. Journal of the Acoustical Society of America 50. pp. 1182‒1192.
Stevens, K. N. (1998) Acoustic Phonetics. Cambridge, Massachusetts–London: The MIT Press.
Stevens, K. N. (2000) Diverse acoustic cues at consonantal landmarks. Phonetica 57. pp. 139‒151.
Stevens, K. N.; Blumstein, S. E.; Glicksman, L.; Burton, M. & Kurowski, K. (1992) Acoustic and
perceptual characteristics of voicing in fricatives and fricative clusters. Journal of the Acoustical
Society of America 91. pp. 2979‒3000.
Strevens, P. (1960) Spectra of fricative noise in human speech. Language and Speech 3. pp. 32−49.
Vorperian, H. K.; Wang, S.; Chung, M.K.; Schimek, E.M.; Durtschi, R.B. & Kent, R. D. et al.
(2009) Anatomic development of the oral and pharyngeal portions of the vocal tract: An imaging
study. Journal of the Acoustical Society of America. 125. pp. 1666−1678.