19
1 TANULMÁNY GRÁCZI TEKLA ETELKA* , ** KREPSZ VALÉRIA* *MTA Nyelvtudományi Intézet, **MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport [email protected], [email protected] Gráczi Tekla Etelka–Krepsz Valéria: Intervokális réshangok akusztikai szerkezete tinédzser- és felnőttkorban Alkalmazott Nyelvtudomány, XVIII. évfolyam, 2018/1. szám doi:http://dx.doi.org/10.18460/ANY.2018.1.003 Intervokális réshangok akusztikai szerkezete tinédzser- és felnőttkorban The acoustic characteristic of speech sounds changes throughout the life span. The question arises around what age speech production is similar to adults’ speech. The acoustic characteristics of fricatives have been described for children in English speakers (Nissen‒Fox, 2005). Our question was whether there is a similarity in the spectral characteristics of fricatives in 16 year old and adult speech production. To answer the question the spontaneous speech of twelve 16 years olds and twelve young adults (20-30 years) was analyzed. The duration, static CoG, SD, skewness, kurtosis and dynamic CoG and voiceless part ratio was measured in their /z/, /s/ and /ʃ/ realizations in spontaneous speech. The results show that the three consonants show similar distinctiveness, however, the spectral features show larger differences between the teenagers’ and the adults’ speech, and also between the genders. These differences may arise from the differences in speech organ size and different voicing distinction strategies of the speaker groups. 1. Bevezetés A spiránsok képzése során a toldalékcső valamely artikulációs szervpárja között rés keletkezik, és az ezen átáramló levegő turbulens zörejt hoz létre (Strevens, 1960; Stevens, 1971; Stevens, et al., 1992; Jongman, et al. 1998). A réshangok jól elkülöníthetők egymástól az akadály megjelenésének helye, és ebből következően az eltérő akusztikai lenyomatuk alapján. Több akusztikai paraméterrel is jellemezhető a mássalhangzók szerkezete. Ilyen lehetőség például az egyes spiránsok jellemzésére az intenzívebb frekvenciatartományok középértékének megadása, azaz a zörejgócok mérése (magyarra vö. pl. Magdics, 1966). A zöngétlen, alveoláris réshangnál a zörejgócok 4000 és 10.000 Hz -es tartományban helyezkednek el, az éles, sziszegő hangzásért felelős intenzív zörejgócok jellemzően a 6000 és 8000 Hz közötti tartományban jelennek meg. A zöngétlen, posztalveoláris spiránsok alacsonyabb frekvenciatartományban, 2200 és 5000 Hz között fordulnak elő, az észleleti susogó érzetét pedig a 3500 Hz körüli legintenzívebb zörejtartomány adja (Stevens, 2000). A CoG- (Centre of Gravity) érték a beszédhang spektrális eloszlásának súlypontját, más megfogalmazásban a frekvenciaértékek amplitúdóval súlyozott átlagát adja meg. Az azonos zöngésségű, de különböző képzési helyű spiránsokat jellemző zörejgócok különböző frekvenciákon jelennek meg, azaz a teljes spektrális lenyomat eltérő CoG-értékekkel jellemezhető. Így a zörejkomponensek alapján

Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

1

TANULMÁNY

GRÁCZI TEKLA ETELKA*, ** ‒ KREPSZ VALÉRIA* *MTA Nyelvtudományi Intézet, **MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport

[email protected], [email protected]

Gráczi Tekla Etelka–Krepsz Valéria: Intervokális réshangok akusztikai szerkezete tinédzser- és

felnőttkorban

Alkalmazott Nyelvtudomány, XVIII. évfolyam, 2018/1. szám

doi:http://dx.doi.org/10.18460/ANY.2018.1.003

Intervokális réshangok akusztikai szerkezete tinédzser- és

felnőttkorban

The acoustic characteristic of speech sounds changes throughout the life span. The question arises

around what age speech production is similar to adults’ speech. The acoustic characteristics of

fricatives have been described for children in English speakers (Nissen‒Fox, 2005). Our question was

whether there is a similarity in the spectral characteristics of fricatives in 16 year old and adult speech

production. To answer the question the spontaneous speech of twelve 16 years olds and twelve young

adults (20-30 years) was analyzed. The duration, static CoG, SD, skewness, kurtosis and dynamic

CoG and voiceless part ratio was measured in their /z/, /s/ and /ʃ/ realizations in spontaneous speech.

The results show that the three consonants show similar distinctiveness, however, the spectral features

show larger differences between the teenagers’ and the adults’ speech, and also between the genders.

These differences may arise from the differences in speech organ size and different voicing distinction

strategies of the speaker groups.

1. Bevezetés

A spiránsok képzése során a toldalékcső valamely artikulációs szervpárja

között rés keletkezik, és az ezen átáramló levegő turbulens zörejt hoz létre

(Strevens, 1960; Stevens, 1971; Stevens, et al., 1992; Jongman, et al. 1998).

A réshangok jól elkülöníthetők egymástól az akadály megjelenésének helye,

és ebből következően az eltérő akusztikai lenyomatuk alapján. Több akusztikai

paraméterrel is jellemezhető a mássalhangzók szerkezete. Ilyen lehetőség

például az egyes spiránsok jellemzésére az intenzívebb frekvenciatartományok

középértékének megadása, azaz a zörejgócok mérése (magyarra vö. pl. Magdics,

1966). A zöngétlen, alveoláris réshangnál a zörejgócok 4000 és 10.000 Hz-es

tartományban helyezkednek el, az éles, sziszegő hangzásért felelős intenzív

zörejgócok jellemzően a 6000 és 8000 Hz közötti tartományban jelennek meg. A

zöngétlen, posztalveoláris spiránsok alacsonyabb frekvenciatartományban, 2200

és 5000 Hz között fordulnak elő, az észleleti susogó érzetét pedig a 3500 Hz

körüli legintenzívebb zörejtartomány adja (Stevens, 2000). A CoG- (Centre of

Gravity) érték a beszédhang spektrális eloszlásának súlypontját, más

megfogalmazásban a frekvenciaértékek amplitúdóval súlyozott átlagát adja meg.

Az azonos zöngésségű, de különböző képzési helyű spiránsokat jellemző

zörejgócok különböző frekvenciákon jelennek meg, azaz a teljes spektrális

lenyomat eltérő CoG-értékekkel jellemezhető. Így a zörejkomponensek alapján

Page 2: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

2

tudunk megközelítőleg következtetni az artikulációra. Értelemszerűen ugyanez

fordítva is igazolható, azaz az egyes réshangok CoG-értékeit elsősorban a

szájüreg elülső részének alaki és méretbeli változása (az üreg nagysága, illetve a

szűkület mértéke, elhelyezkedése és az ajkak pozíciója) határozza meg (Heinz‒

Stevens, 1961). Több kutatási eredmény egymástól függetlenül is alátámasztotta

azt az állítást, amely szerint a spiránsok időtartama és spektrális szerkezetük

értékei eltérnek a képzési helyek mentén (Jongman et al., 2000; Beke‒

Gyarmathy, 2010). Beke és Gyarmathy (2010) szignifikáns különbséget

igazoltak a vizsgált zöngétlen alveoláris és posztalveoláris réshangok

spektrumának súlypontja, eloszlása, csúcsossága és intenzitása szerint is annak

ellenére, hogy jelentős individuális eltéréseket adatoltak. Igazolódott továbbá az

is, hogy a spektrális szerkezetet befolyásolja a spiránst követő magánhangzó

minősége. A spektrális szerkezet további tényezői, hogy ehhez a súlyponthoz (CoG-hez)

képest a teljes spektrális eloszlás hogyan viszonyul. Ilyen értékek a spektrális

szóródás, a ferdeség és a csúcsosság. A spektrális szerkezet szóródása azt

mutatja meg, hogy mennyire térnek el a spektrumösszetevő frekvenciák a

súlyponttól az adott ejtésben, azaz mekkora frekvenciatartományt fog át az ejtés

során képzett hang. A ferdeség megadja, hogy mennyiben tér el vagy hasonlít a

súlypont alatti frekvenciatartomány formája az a felettihez. A csúcsossággal azt

jellemezzük, hogy mennyiben hasonlít egy CoG-központú Gauss-görbéhez a

spektrális szerkezet. Minél inkább centralizálódik egy frekvenciaérték köré az

intenzitás, annál magasabb értéket kapunk.

Eltérők voltak az eredmények a különböző képzési helyű réshangok spektrális

szerkezetre gyakorolt hatását illetően. Jongman több kutatásában (Jongman,

1998; Jongman et al., 2000) is különbséget igazolt a spektrális paraméterekben a

szibilánsok és nem szibiláns réshangok között.

A képzési hely és a zöngésség hatással van ezen értékek alakulására, de

emellett egyéb univerzális jellemzők megjelenéséhez is vezet (vö. Stevens,

1998; Maddieson, 1999). Ezek közé tartozik többek között az, hogy a zöngétlen

beszédhangok a zöngés párjukhoz viszonyítva hosszabb időtartamban

realizálódnak (Baum‒Blumstein, 1987; Docherty, 1992; Jesus‒Shadle, 2003;

magyarra: Magdics, 1966; Kassai, 1982). Ugyanakkor az egyes nyelvek között

eltérő mintázatok is megjelenhetnek a realizációkban: A zöngésség és a

spirantikus zörej egyidejű fenntartásának aerodinamikai nehézsége például a

portugálban és a magyarban ahhoz vezet, hogy minél hosszabb a zöngés

réshang, annál nagyobb arányban zöngétlenedhet, míg az amerikai angolban

más feloldási stratégiák jelennek meg (pl. Jesus‒Shadle, 2003; Gráczi, 2012).

Noha mind a hazai, mind a nemzetközi szakirodalomban egyre jelentősebb az

életkorral mint befolyásoló tényezővel kapcsolatos kutatások aránya,

ismereteink szerint csak kevés olyan vizsgálat született, amely a réshangok

spektrális szerkezetét elemezné ilyen szempontból. Magyar nyelven történt

vizsgálatban − ismereteink szerint − korábban csupán az idősek és a fiatal felnőtt

Page 3: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

3

beszélők összehasonlításával foglalkoztak. Bóna és Beke (2013) 10 fiatal és 10

idős női beszélő spontán narratívájában megjelenő zöngétlen alveoláris és

zöngétlen posztalveoláris spiránsok temporális és akusztikai szerkezetének

összehasonlítása alapján a beszédhangok időtartamában nem, míg a spektrális

szerkezetben szignifikáns különbséget mutatott ki a korcsoportok között. A

statisztikai elemzés annak ellenére nem igazolt eltérést a réshangok időzítési

sajátosságaiban a mássalhangzók képzési helyének függvényében a két életkori

csoport között, hogy a beszélők artikulációs tempója szignifikánsan eltért

egymástól.

Különböző életkorú gyermekek ejtésében is elemezték a mássalhangzók

spektrális szerkezetét az angol nyelvben. Nittrouen (1995) a CoG, a spektrális

eloszlás csúcsossága és a ferdesége szempontja mentén vizsgálta a /t, k, s, ʃ/

realizációinak változását 3 és 7 éves kor között. Ezen eredmények szerint a fiatal

gyermekek ejtésében az obstruensek még nem minden képzési jegy mentén

különíthetők el, amit elsősorban a beszédképző szervek kisebb méretével, és az

ebből adódó spektrális szerkezetbeli eltérésekkel magyaráztak. Nissen és Fox

(2005) 3 és 6 év közötti gyermekek ejtésében vizsgálta a [f θ s ʃ] realizációinak

akusztikai jellemzőit. Eredményeik azt mutatták, hogy a gyermekek

beszédprodukciójában még ebben a fiatal életkorban kevésbé különülnek el

egymástól a szibilánsok a képzési helyük alapján, mint a felnőttek ejtésében,

amit a beszédhangok akusztikai szerkezetében körülbelül 5 éves korig

megfigyelhető, a felnőttek ejtésétől jelentősen eltérő spektrális jellemzők is

alátámasztanak.

Tudomásunk szerint magyar nyelven még nem készült gyermeknyelvi

vizsgálat az obstruensek akusztikai szerkezetére vonatkozóan. A

szakirodalomban evidenciaként van jelen, hogy az anyanyelv-elsajátítás

folyamata során a fiziológiai fejlődés folyamatos és ugrásszerű változásokat idéz

elő a gyermekek beszédprodukciós és beszédpercepciós működéseiben, ami

összefügg a beszédképző szervek növekedési mintázatával (l. pl. Vorperian et

al., 2009). Az artikuláció szempontjából meghatározó továbbá, hogy az életkor

előrehaladtával nő a gyermekek artikulációs mozgásainak begyakorlottsága,

fejlődik továbbá a beszédtervezés működése. Emellett a spiránsok előfordulása

relatíve gyakori, és produkciójuk eltér a felnőttekétől, gyakran logopédiai

nehézséget okoz az anyanyelv-elsajátítás során a gyermekek számára (pl.

selypesség, vö. Sebestyénné Tar, 2006).

A jelen vizsgálatban egy korcsoport beszélői, a 16 éves gyermekek

(tinédzserek) ejtésében elemezzük magyar spontán beszédben három réshang [s

z ʃ] realizációit felnőtt adatokhoz viszonyítva. Ebben a korban (pubertáskor) is

számos olyan fiziológiai módosulás következik be, amely hatást gyakorol a

beszédre, a kommunikációs folyamatokra, és amely változások mind a

szegmentális, mind a szupraszegmentális jegyekben kimutathatók. A hormonális

változások hatására a gyermeki hang felnőtt hanggá alakul át a pubertás

időszakában, általában 11 és 16 éves kor között (Hacki‒Hirschberg‒Mészáros,

Page 4: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

4

2013; Hacki‒Heitmüller, 1999). A mutációs fázisok során a gége megnő (a

lányoknál vertikális, a fiúknál vertikális és horizontális irányba is), a pajzsporc

lemezei által bezárt szög 120 fokról 90 fokra szűkül. A hangszalagok hosszabbá

válnak (a fiúknál a növekedés mértéke eléri az 1 cm-t (átlagosan 16‒29 mm

hosszúak), a lányoknál mindössze 3-4 mm-rel nőnek (átlagosan 10‒21 mm

hosszúak). A hangszalagok szöveti struktúrája a pubertás során a felnőttekéhez

hasonlóvá válik. A másodlagos nemi jelleg kialakulásával elkülönülnek

egymástól a két nem jellemzői. Magyar nyelven végzett fonetikai vizsgálatok

egymásnak ellentmondó eredményekre jutottak a tinédzserek és a felnőttek

beszédhang-időtartam vizsgálatainak összevetése során. Magánhangzók

időzítési sajátosságainak, valamint formánsszerkezetének elemzése alapján

Auszmann (2016) azt igazolta, hogy a 13 éves beszélők realizációi már

nagymértékben hasonlóvá váltak a felnőttek megnyilatkozásaiban mért

értékekhez. Ezzel szemben más kutatás (Krepsz, 2015) szignifikáns különbséget

adatolt a 16 évesek és a fiatalabb gyermekek, valamint a tinédzserek és a felnőtt

beszélők spontán közléseiben megjelenő beszédhangok időtartamértékei között.

A két életkori csoport megnyilatkozásainak vizsgálata alapján a

magánhangzók időzítési sajátosságaiban igazolt különbség felveti a kérdést,

hogy van-e eltérés a 16 évesek és a felnőttek között a réshangok temporális

sajátosságaiban és akusztikai szerkezetében. A jelen kutatásban két zöngétlen

(/s/ és /ʃ/) és egy zöngés (/z/) spiráns realizációit vizsgáltuk 16 évesek és fiatal

felnőtt beszélők spontán megnyilatkozásaiban. Választ kerestünk arra a

kérdésre, hogy milyen különbséget mutatnak a spiránsok temporális és spektrális

értékei a két életkori csoportban. Hipotéziseink szerint (i) a mássalhangzók

akusztikai szerkezete a 16 éves beszélők ejtésében még eltérést mutat a

felnőttnyelvi mintától, (ii) ugyanakkor a képzéshely szerinti különbségek

mindkét korcsoport esetében kimutathatóak lesznek, azaz 16 éves korra már

kimutathatóak.

2. Módszertan A kutatásban 24 magyar anyanyelvű adatközlő spontán beszédét elemeztük. A

beszélőket két életkori csoportból választottuk ki: 12 felnőtt (20 és 29 év

közöttiek, 6 női és 6 férfi) beszélő hanganyagát a BEA adatbázisból (Gósy et al.,

2012), és 12 tinédzser (16 évesek, 6 lány és 6 fiú) hanganyagát a TiniBEA

adatbázisból (Gyarmathy‒Neuberger, 2015). A felvételeket azonos

felvételvezető azonos körülmények között rögzítette. A kiválasztott

beszédhanganyagokban manuálisan címkéztük a /z, s, ʃ/ realizációit a

hullámforma és a hangszínkép alapján folyamatos auditív visszacsatolás mellett

a Praat szoftverben (Boersma‒Weenink, 2016). Minden vizsgált réshang

intervokális helyzetű volt. A VCV hangkapcsolatokban a környező

magánhangzók minősége a spontán beszéd sajátosságaiból adódóan nem

kiegyenlítettek. A hangfájlokat 22,5 kHz-en újramintavételeztük. A

mássalhangzók határait a megelőző magánhangzó F2-jének végétől a követő

Page 5: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

5

magánhangzó F2-jének kezdetéig jelöltük (1. ábra). Ez alapján számítottuk ki a

beszédhang időtartamát. Automatikusan mértük a mássalhangzókban a

zöngétlen rész arányát. A spektrális méréseket a spiránsok időtartamában 10%-

onként végeztük, 10% és 90% között (összesen 9 pontban). Az időtartam 20%-

ával egyező méretű, 10%-onként gördülő Hamming ablakot alkalmaztunk. Az 1.

ábra alján látható példán bemutatva: A mássalhangzó közepén (50%) annak

időtartamának 40%-a és 60%-a közötti szakasz átlagos CoG-értékét adtuk meg.

Egy erre a célra létrehozott Praat-szkript segítségével kinyertük a spektrális

eloszlás súlypontját (Centre of Gravity: CoG), szórását, ferdeségét és

csúcsosságát, valamint a vizsgált mássalhangzók időtartamát és zöngétlen

részük arányát. A kategoriális elemzés során zöngésnek tekintettük a

megvalósulást, ha legfeljebb az időtartamának 30%-ában volt zöngétlen,

zöngétlennek pedig legalább 70%-os érték esetében. A két érték között részben

zöngésként elemeztük a megvalósulást. A 30%-os határt az /s/ megvalósulásai

alapján választottuk. Ezek 90%-a (az összes adatot együtt elemezve beszélői

csoportbontás nélkül) legalább 70%-ban zöngétlen volt. A mérési hibákat

(kiugró értékeket) kizárva minden /s/-realizáció legalább 60%-ban zöngétlen

volt. (A viszonylag alacsony érték az időtartammal van összefüggésben:

rövidebb ejtés esetén a néhány periódusnyi zönge nagyobb arányt ad.)

A statisztikai elemzést az SPSS programban végeztük el: párosított t-próba,

Pearson-féle korrelációszámítás és ismételt méréses ANOVA. Ez utóbbiban

függő változóként a mássalhangzó-minőség, a korcsoport, a nem, ezek

páronkénti és hármas interakciója szerepelt.

Page 6: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

6

1. ábra. Minta a címkézés és a CoG-mérés menetére az [nɛɛm] hangsorban

3. Eredmények

A teljes mássalhangzóban mért jellemzők Az időtartam, a statikus CoG, a szóródás, a ferdeség, a csúcsosság és a

zöngétlen rész aránya, tehát a mássalhangzók teljes időtartamában mért jegyek

esetében az ismételt méréses ANOVA alapján a korcsoport és a nem

meghatározó a beszélők közötti varianciában, míg a korcsoport*nem interakció

nem. A réshangok közötti eltérés szignifikáns, és a mássalhangzó-minőség

interakciója a korral, illetve a nemmel ugyancsak meghatározónak bizonyult a

vizsgált akusztikai jellemzőkre. A hármas interakció

(mássalhangzó*korcsoport*nem) nem mutatott szignifikáns hatást. A statisztikai

eredményeket az 1. táblázatban foglaltuk össze.

1. táblázat. Az ismételt méréses ANOVA eredményei

F p

C 592,319 < 0,001

C * korcsoport 3,620 0,031

C * nem 3,242 0,043

C * korcsoport * nem 0,805 0,645

A mássalhangzók időtartama egyetlen kiugró értéktől eltekintve 27 és 213

ms között szórt. A legrövidebb realizációt mind a négy beszélői csoportban

(tinédzser fiúknál [átlag: 66 ms, SD: 17 ms) és lányoknál (átlag: 62 ms, SD: 13

ms), illetve a felnőtt férfiaknál (átlag: 71 ms, SD: 28 ms) és nőknél (átlag: 72

ms, SD: 19 ms] a /z/ esetében mértük (2. ábra). A /ʃ/ esetében hosszabb

időtartamokat adatoltunk [tinédzser fiúk (átlag: 102 ms, SD: 20 ms), lányok

(átlag: 106 ms, SD: 24ms), felnőtt férfiak (átlag: 104 ms, SD: 22 ms), nők (átlag:

116 ms, SD: 27ms], míg a leghosszabb előfordulásokat a /s/ esetében adatoltuk

[tinédzser fiúk (átlag: 111 ms, SD: 24 ms), lányok (átlag: 107 ms, SD: 18 ms),

felnőtt férfiak (átlag:118 ms, SD: 21ms), nők (átlag: 118 ms, SD: 34 ms].

A /z/ időtartama minden csoportban a zöngétlen párjához képest kb. 40%-kal,

a posztalveoláris réshanghoz képest pedig 30–40%-kal rövidebb időtartamban

valósult meg. A két zöngétlen réshang 1–12% közötti időtartambeli eltérést

mutatott: a két női csoport esetében gyakorlatilag teljesen azonos értéket

adatoltunk (1,0% és 2,0% eltérés), míg a férficsoportok esetében kismértékű

eltérést kaptunk (8,5%, 12,0%). Lényegében tehát nem volt különbség közöttük.

Page 7: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

7

2. ábra. Az időtartamok értékei a három vizsgált mássalhangzó, valamint a beszélők életkorának és

nemének függvényében (átlag és 95%-os CI)

A különböző típusú spiránsokat jellemző spektrális eloszlás súlypontjai

(CoG) az elvártaknak megfelelően a képzéstől függően különböző

frekvenciákon jelentek meg. Különbség mutatkozott a CoG-értékekben a

beszélők életkorától és a nemétől függően is. A legalacsonyabb CoG-értéket a

felnőtt férfiak esetében, míg a legmagasabbat a tinédzser lányok közléseiben

mértük mindhárom mássalhangzó esetében (3. ábra). A legmagasabb értékek

mind a négy csoportban a /s/ megvalósulásaiban mutatkoztak: az átlagok 6301

Hz (SD = 754 Hz) és 7995 Hz (SD = 735 Hz) között alakultak. Ennél a /ʃ/

realizációi CoG-ja jóval alacsonyabb értéket vett fel, 3449 Hz (SD = 859 Hz) és

4735 Hz (SD = 721 Hz) között alakultak a négy beszélői csoport értékei. A

csoportokon belül 32–48%-nyi eltérés volt a két hangzó között. A zöngés

alveoláris réshang megvalósulásai jóval nagyobb eltérést mutattak a két

zöngétlen réshanghoz képest. Míg a tinédzser lányok esetében ez a zöngétlen

párjához közeli értékeken realizálódott (6950 Hz ± 1813 Hz), addig a többi

beszélői csoportnál az /ʃ/-realizációkhoz hasonló CoG-értékeket mértünk erre a

beszédhangra. Két csoportban a posztalveoláris réshangnál magasabb átlagos

spektrális súlypont-értéket kaptunk (tinédzser fiúk: 4492 Hz ± 1990 Hz, felnőtt

nők: 4478 Hz ± 2657 Hz), a felnőtt férfiaknál azonban alacsonyabbat (2970 Hz

± 2286 Hz). A csoportok közötti különbségek mellett meg kell említeni a szórás

magas értékét is. Míg a két zöngétlen réshang esetében 578 Hz és 1003 Hz

között alakult a CoG-ben mért szóródás (a legtöbb esetben 760 Hz körüli

értékkel), addig a zöngés mássalhangzó ejtésében a legkisebb érték 1813 Hz

volt. Ennek oka, hogy a zönge képzése leállhat a zöngés réshang ejtése során.

Page 8: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

8

Ezen jelenségek hátterében feltehetően a fonológiai zöngésség fonetikai vetülete

áll elsősorban. A zönge fenntartása szájüregi rés és zár esetében nehézkes az a

mögött feltorlódó, így a szupraglottális nyomást megemelő levegőmennyiség

miatt (pl. Halle–Clements, 1983). Az emelkedő nyomás nehezíti, lassítja, majd

meg is akadályozhatja a hangszalagok felnyílását, illetve a hangszalagok között

is megemelkedő nyomás azok összezáródását akadályozza meg később (l.

Bickley‒Stevens 1986). Ennek az aerodinamikai kényszernek az elkerülésére

több lehetséges beszélői „stratégia” létezik. Egyrészt ejtheti a beszélő

rövidebben a beszédhangot, nyithatja a nazális üreg felé a toldalékcsövet, a

realizáció approximánsként jelenhet meg (approximalizálódhat) stb. (pl.

Bárkányi–Kiss, 2009) Emiatt a beszélők között, de a beszélőn belül is változó,

hogy részben (és hogy mennyire) zöngétleníti a mássalhangzót, esetleg

approximáns jelenik meg, avagy rövid – valóban réssel képzett – réshangot ejt

(magyarra l. pl. Bárkányi‒Kiss‒Mády, 2009; Gráczi, 2012; 4. ábra). A 4. ábrán a

/z/ realizációinak főbb típusait mutatjuk be. Az első minta egy teljes idejében

zöngés réshangként realizálódott beszédhang, míg a második során a résképzés

közben leáll a zöngeképzés, majd a résből a magánhangzóba való nyílás során

újraindul. A harmadik ejtésminta egy kisebb mértékben zörejes ejtést mutat, de a

képzés még réses, a zöngeképzés pedig folyamatos. A negyedik /z/-realizáció

esetében egy nagyon rövid approximáns ejtést láthatunk. Ez a megjelenés is

jellemző, ebben az esetben nem a zönge áll le, hanem a rést nem képzi meg a

beszélő, csak szűkületet hoz létre az adott (jelen esetben alveoláris) képzési

helyen. A bemutatott beszédhang rövidsége nem csak a rés-zönge párhuzamos

képzésének nehézségének feloldására utal, hanem a beszélő nem lazább,

közvetlenebb beszédmódjának is következménye.

3. ábra. A statikus CoG értékei a vizsgált mássalhangzók, valamint a beszélők életkorának és nemének

függvényében (átlag és 95%-os CI)

Page 9: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

9

4. ábra. Ejtésminták a /z/ megvalósulásaira:

Zöngés [z], részben zöngés [z̯], kevésbé zörejes [z], approximáns ejtés [ɹ]

A fenti okok miatt a /z/ esetében részletesebben is elemeztük a zöngétlenedés

mértékét (5. ábra). A felnőttek átlagosan kisebb mértékben zöngétlenítették a

realizációkat, mint a tinédzserek. A fiatalabb korcsoportban a lányok, a

felnőtteknél a férfiak esetében volt nagyobb arányú a zöngétlen rész aránya. Az

egyéni különbségek jellemzőek voltak, de a csoportokra jellemző tendenciáktól

csak két személy tért el nagyobb mértékben: a felnőtt férfiak között egy esetében

jelentősen magasabb a zöngétlen rész aránya a többiekéhez képest, a tinédzser

fiúk között pedig egy személy a csoport többi tagjához képest csak kisebb

mértékben zöngétlenített. Az átlagos zöngétlenrész-arányon túl a zöngés-

zöngétlen ejtés gyakorisága is jellemző a csoportokra. Azaz nem csak az, hogy

milyen arányban zöngétlen egy-egy ejtés, hanem az is, hogy milyen

gyakorisággal jelenik meg ilyen realizáció (6. ábra).

Arra a kérdésünkre, hogy mennyiben függ össze a zöngétlenítés mértéke a

spektrális súlyponttal a /z/ megvalósulásaiban, Pearson-féle korrelációszámítás-

sal kerestük a választ. A két érték között erős szignifikáns összefüggést találtunk

(r2 = 0,809, p < 0,001). A négy csoportot külön-külön elemezve az r2 értéke a

felnőtt nőknél 0,813, a felnőtt férfiaknál 0,897, a tinédzser lányoknál 0,731, a

tinédzser fiúknál 0,842 volt, a p-é pedig minden esetben kisebb volt, mint 0,001.

Page 10: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

10

5. ábra. A zöngés alveoláris réshang megvalósulásaiban mért zöngétlen rész aránya (%; átlag és 95%

CI)

6. ábra. A zöngés, részben zöngés és a zöngétlen ejtés gyakorisága (%)

A spektrális szerkezet eloszlását a súlyponthoz képest a szóródás, a ferdeség

és a csúcsosság alapján jellemezhetjük.

A spektrális szerkezet szóródása, azaz a spektrumösszetevők súlyponttól

való eltérése nagy különbséget mutatott a vizsgált mássalhangzók mentén. A

vizsgálati anyagunkban a legkisebb szórást az /ʃ/, a legnagyobbat a /z/ mutatta

(/ʃ/-realizációk: 1498 Hz ±419 Hz; /s/-megvalósulások: 1861 Hz ± 515 Hz és a

/z/ ejtésének értékei: 2413 Hz ± 835 Hz; 7. ábra). A felnőttek a zöngés hangzó

esetében nagyobb átlagos eltérést mutattak a spektrális szórás értékében, mint a

tinédzserek. A felnőtt nők inkább kevésbé zöngétlenítettek, így a zörejgócokon

túl az alsóbb, a zönge következtében megjelenő zörejösszetevők is nagy

intenzitással voltak jelen a spektrumban, így a szóródás magasabb, mint a

férfiak esetében, hiszen az ejtés nagyobb frekvenciatartományt ölel fel. A

18

34

55

48

33

26

33

28

49

40

12

24

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

tinédzser lány

tinédzser fiú

felnőtt nő

felnőtt férfi

Zöngés Részben zöngés Zöngétlen

Page 11: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

11

spektrális szórás átlagos eltérése ugyanakkor hasonlóan nagyobb, mindkét

csoportban, mint a tinédzsereknél, mivel a fiatalabb korcsoportra a zöngétlenebb

ejtés jellemzőbb, így kisebb variabilitást mutatnak, mint a felnőttek, akiknél a

beszélőn belül és a beszélők között is változó a zöngétlenebb és a

nagymértékben zöngés realizációk megjelenése. A zöngétlen réshangok közötti

eltérés ellentétes a felnőtt és tinédzser korcsoport között. Míg az alveoláris

esetében a felnőttek, addig a posztalveoláris ejtésében a tinédzserek

szóródásértékei magasabbak. Ennek a feltehető magyarázatához további

elemzések szükségesek.

7. ábra. A szóródás értékei a mássalhangzó minősége és a beszélők életkorának függvényében (átlag

és 95%-os CI)

Mind a három mássalhangzó esetében eltérő mintázatot találtunk a

mássalhangzók spektrális szerkezetének ferdeségében, azaz hogy a négy

beszélői csoportban milyen értékek jelennek meg (8. ábra). A posztalveoláris

réshang esetében az életkor, az alveoláris zöngétlen beszédhangok esetében

pedig a nem mentén találtunk tipikus eltérést. A posztalveoláris esetében minden

csoportban pozitív értékeket kaptunk, míg az alveoláris zöngétlen esetében

többnyire negatívat, kevés személynél 0-hoz közeli pozitívot. Azaz eltér a két

hangzó abban, hogy a spektrális súlypont alatti és feletti terület összetevői

mekkora tartományban jelennek meg milyen intenzitásviszonyokat mutatva.

Illetve a /s/ megvalósulásai esetében ez a két frekvenciatartomány hasonló is

lehet. A/z/ realizációi ebben az értékben is nagyobb variabilitást mutattak, mint

a másik két konszonáns. Egyrészt a beszélői csoportok átlaga is eltérő, másrészt

Page 12: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

12

a csoportokra jellemző átlagos eltérés is, azaz kevésbé egységes az ejtés az

egyik, mint a másik esetben. Ismét a zöngésséggel kapcsolatos a magyarázat.

Míg a fiatalok gyakrabban és nagyobb arányban zöngétlenítenek, így a /s/-

realizációkhoz hasonlóan ejtve a zöngés párt is, addig a felnőttek esetében

változóbb, hogy zöngétlenítenek-e, és milyen mértékben.

8. ábra. A ferdeség értékei a vizsgált mássalhangzó, valamint a beszélők életkorának és nemének

függvényében (átlag és 95%-os CI)

A csúcsosság mentén elemezve a mássalhangzókat ismét eltérő mintázatot

találunk az egyes beszélői csoportok között (9. ábra). Az alveoláris zöngétlen

réshang esetében jellemzően a női beszélők (életkortól függetlenül) produkáltak

centralizáltabb ejtést, mint a férfiak, míg a posztalveoláris esetében ebben az

esetben is az életkor mentén volt kimutatható eltérés. A felnőttek ejtésében a /ʃ/-megvalósulások csúcsosabb intenzitáseloszlást mutattak. A tinédzserek esetében

a két zöngétlen réshang között, illetve a zöngés és a zöngétlen mássalhangzók

között nem volt jelentős eltérés, a normál eloszláshoz közel eső frekvencia-

intenzitás viszonyokat mutattak a spektrális súlyponthoz képest. A felnőttek

esetében a posztalveoláris magasabb értékei ennél jóval csúcsosabb,

centralizáltabb ejtést jelentenek.

A zöngés mássalhangzó a zöngefenntartási eltérések miatt ismét a

korcsoportok között tért el jobban. A tinédzserek esetében – mint említettük – a

zöngétlen réshangokhoz hasonló ejtés volt jellemzőbb, míg a felnőttek esetében

a gyakrabban nagymértékben zöngés ejtés, és az így nagyobb

frekvenciatartományban megvalósuló akusztikai lenyomat eredményezhetett

negatív értékeket is (azaz „laposabb” ejtést mutatott), de a pozitív értékek is

nagy arányban és nagy tartományban jellemzőek az idősebb csoportra a

Page 13: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

13

zöngétlenebb ejtések jelenléte miatt. Összességében nagyobb variabilitás

jellemzi tehát a felnőtt ejtést.

9. ábra. A csúcsosság értékei a vizsgált mássalhangzó, valamint a beszélők életkorának és nemének

függvényében (átlag és 95%-os CI)

A statikus jegyek együttes elemzését beszélői csoportonként is elvégeztük,

hogy információt kapjunk, az egyes beszélői csoportokban milyen elkülönülés

jelentkezik a három mássalhangzó között. A 3. táblázatban foglaltuk össze a

párosított t-próba eredményeit. A tinédzserek és a felnőttek ejtésére kapott

adatok nem mutatnak jelentős eltérést. A zöngésségi pár esetében az időtartam, a

zöngétlen rész aránya és a statikus CoG eltért, azaz a két mássalhangzó a /z/-

realizációk gyakoribb és nagyarányú zöngétlenedése ellenére a spektrális jegyek

mentén is elkülöníthetőek akusztikai szerkezetük alapján.

A két zöngétlen réshang között minden csoportban eltér a CoG értéke és a

ferdeség, a további jegyek változó eredményt adtak. Azt mondhatjuk tehát, hogy

a fenti két érték mentén akusztikailag elkülöníthető a két konszonáns.

A /z/ és az /ʃ/ közötti eltérés a /z/-megvalósulások sokszínűsége miatt nem

mutat könnyen leírható képet. Az időtartam és a spektrális eloszlás szóródása

alapján minden csoportban elkülönül, és a legtöbb csoportban a zöngétlen rész

aránya is eltér.

3. táblázat. A statikus jegyek együttes elemzésének eredménye: párosított t-próba. A szabadságfok (df)

minden esetben 5. A szürke cellák a szignifikáns értékeket jelölik. A hármas hasonlítás miatt p <=

0,0167 esetén szignifikáns az eltérés.

Tinédzser lányok Tinédzser fiúk Felnőtt nők Felnőtt férfiak

t p t p t p t p

/ z / é s /s / Időtartam −29,439 < 0,001 −11,346 < 0,001 −9,550 < 0,001 −12,353 < 0,001

Page 14: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

14

Zöngétlen rész −5,387 0,003 −5,040 0,004 −4,001 0,010 −5,067 0,004

Statikus CoG −7,114 0,001 −3,919 0,011 −3,953 0,011 −5,241 0,003

CoG SD-je 4,660 0,006 20,673 0,000 2,618 0,047 1,776 0,136

Ferdeség −0,426 0,688 0,054 0,959 1,899 0,116 2,903 0,034

Csúcsosság −0,117 0,911 0,624 0,560 1,400 0,220 2,592 0,049

/z/

és /ʃ/

Időtartam −14,889 < 0,001 −15,648 < 0,001 −11,780 < 0,001 −5,654 0,002

Zöngétlen rész −4,765 0,005 −3,924 0,011 −2,353 0,065 −4,284 0,008

Statikus CoG 7,501 0,001 0,525 0,622 0,831 0,444 −0,765 0,479

CoG SD-je 4,117 0,009 5,052 0,004 6,878 0,001 6,054 0,002

Ferdeség −18,981 0,000 −2,107 0,089 −1,469 0,202 0,496 0,641

Csúcsosság 0,498 0,639 −0,370 0,727 0,664 0,536 1,528 0,187

/s/

és /ʃ/

Időtartam −0,218 0,836 2,762 0,040 1,836 0,126 4,061 0,010

Zöngétlen rész 4,469 0,007 3,209 0,024 3,059 0,028 2,551 0,051

Statikus CoG 14,275 < 0,001 7,953 0,001 25,750 < 0,001 12,817 < 0,001

CoG SD-je 0,268 0,799 −0,414 0,696 2,845 0,036 5,083 0,004

Ferdeség −9,466 < 0,001 −4,077 0,010 −7,331 0,001 −4,235 0,008

Csúcsosság 0,907 0,406 −0,558 0,601 −1,938 0,110 −2,536 0,052

A dinamikus spektrális eloszlás elemzése

A dinamikus CoG-t, azaz a spektrális súlypont időbeli alakulását szemlélteti

a 10. ábra a négy beszélői csoport átlagértékei alapján az egyes

mássalhangzókra. A tinédzser lányok ejtésében az /s/ és a /z/ a képzés teljes

időtartama alatt közeli értékeket vesz fel, míg a többi beszélői csoportban a

zöngés alveoláris a /ʃ/ értékeihez közelebbi CoG-menetet mutat. A

mássalhangzók kezdetén és végén tapasztalt emelkedő majd ereszkedő CoG-

menet természetesen a hangkörnyezet hatása, azaz a megelőző és a követő

magánhangzó miatti hangátmenet velejárója. Ugyanakkor a zöngésségi párok

kezdeti és végső szakaszán a CoG-érték alakulása eltért, ami a fenntartott és a

leállított zöngeképzés alsó frekvenciatartományban megjelenő összetevők

következménye főként. Ezt az összefüggést alátámasztja a 10. ábra, ahol az

összes beszélő közül a legkisebb (TF4) és a legnagyobb arányban (FF6), illetve

egy átlagos mértékben zöngétlenítő beszélő (TN1) átlagos dinamikus CoG-jét

mutatjuk be. TF4 esetében a /z/ súlypontja az ejtés teljes időtartama alatt a két

zöngétlen réshangnál alacsonyabb értéket vesz fel az alsóbb

frekvenciatartományokon jelenlévő összetevők miatt, míg FF6 beszédében az

időtartam 20–60%-os pontjai között a két alveoláris mássalhangzó azonos

értékeket mutat. A kb. 70%-tól megjelenő eltérés a követő magánhangzóhoz

előbb meginduló zönge miatt jelenik meg. A kb. 45%-ban zöngétlenítő TN1

ejtésében a /z/-realizációk zöngéje kb. 20%-nyi idő után jelenik meg, és 80%-tól

Page 15: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

15

indul újra. A két érték között a spektrális súlypont folyamatosan közeledik az /s/

CoG-vonulatának értékeihez.

10. ábra. A dinamikus CoG a mássalhangzó minősége és a beszélők életkorának függvényében

11. ábra. A dinamikus CoG három különböző /z/-realizációtípust alkalmazó beszélő ejtésében

Kiszámítottuk az egyes fonémák realizációjának spektrálissúlypont-menete

közötti euklideszi távolságot. Azaz az egyes időpontokban kapott átlagos

eredményeket összesítve is összevetettük a mássalhangzókat. A spektrális

súlypont eloszlásbeli euklideszi távolságok mentén kapott átfedések esetén tehát

Page 16: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

16

az időtartam alapján akusztikailag megkülönböztethető maradhat a

mássalhangzópár.

Az eredményeket a 12. ábra mutatja be. A zöngésségi pár távolsága a két női

csoport esetében nagyobb szóródást mutat, és felnőttkorban magasabb értékek

jelentek meg. Ez összefügg a korábban leírtakkal, azaz a /z/-megvalósulások

változatos megjelenésével, és a 16 éves csoport gyakori és nagymértékű

zöngétlenítésével. A /z/ és a /ʃ/ közötti eltérés a női beszélők esetében magasabb

és nagyobb szóródást mutat, mint a férfiaknál, a korcsoporttól függetlenül. A

tinédzser lányok jellemzően nagyobb eltéréssel ejtették a két hangzót, mint a

felnőtt nők. Ezen két konszonáns esetében kisebb eltérést vártunk, mint a két

alveoláris között, mert a posztalveoláris jellemzően alacsonyabb

frekvenciatartományban realizálódik, mint az alveoláris zöngétlen réshang,

ugyanakkor a zöngés alveoláris zöngés megvalósulása az alacsony

frekvenciakomponensek miatt alacsonyabb CoG-értékeket mutatna. Ez a

felnőttek esetében részben átfedéssel, de megvalósul. A fiatalabb korcsoportban

az átfedés nagy, és a lányok esetében a magasabb az eltérés, mint a zöngésségi

pár esetében, hiszen nagyrészt zöngétlenek a /z/-realizációk. Ugyancsak a

fonológiai zöngésség miatt a két zöngétlen réshang között kisebb eltérést

várnánk, mint a zöngésségi pár esetében. Ez a tinédzser fiúk kivételével nem

teljesült. A nagy szóródás ebben a csoportban is megkérdőjelezi a hangzók

realizációja közötti eltérés relevanciáját.

12. ábra. A mássalhangzók dinamikus CoG-értékei közötti euklideszi távolság (Hz)

4. Következtetések A jelen tanulmány a /z, s, ʃ/ hangok temporális és spektrális jellemzőit

vizsgálta tinédzserek és felnőtt beszélők spontán beszédében. A kutatás fő

kérdése az volt, hogy kimutatható-e különbség a két életkori csoport között,

valamint a beszédhangok képzési helye szerint a vizsgált paraméterekben.

Page 17: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

17

A réshangok időtartama jelentősen különbözött egymástól a mássalhangzók

képzéshelye és zöngéssége szerint. A zöngés spiráns átlagosan 40 ms-mal

rövidebb időtartamban valósult meg, mint a zöngétlen réshangok, míg az /ʃ/ és

/s/ között jelentős átfedést is adatoltunk. A beszélők életkorának a

hangidőtartamokra gyakorolt hatását a jelen kutatás eredményei alátámasztják.

A magyar szakirodalmi adatok azonban gyakran ellentmondóak a tekintetben,

hogy a tinédzser beszélők hangidőtartam-értékei elkülönülnek-e a felnőtt

beszélők realizációitól (vö. Krepsz, 2015; Auszmann, 2016). A jelen vizsgálat

szignifikáns különbséget igazolt mindhárom réshang képzési helye és

zöngéssége mentén a korcsoportok között. Megjegyzendő ugyanakkor, hogy a

szakirodalmi kutatások magánhangzók időtartamát elemezték, valamint hogy

mindkét vizsgálat esetében fiatalabb gyermekek értékeit is figyelembe vették az

összehasonlítás során. Nem igazolódott különbség azonban a nemek

tekintetében sem tinédzser, sem felnőttkorban, szemben a korábbi, réshangok

időtartamát felnőttek ejtésében vizsgáló kutatás (Beke‒Gyarmathy, 2010)

eredményeivel, ahol a nők szignifikánsan hosszabban ejtették az egyes

mássalhangzókat.

A vizsgált réshangok spektrális szerkezetének elemzése alátámasztotta az

egyes beszédhangok zöngésség és a képzési hely szerinti elkülönítését a vizsgált

paraméterek alapján. A szakirodalmi adatokhoz (Beke‒Gyarmathy, 2010)

hasonlóan az alveoláris zöngétlen réshang átlagos CoG-értékei magasabban, a

posztalveoláris zöngétlen réshangé alacsonyabban jelentek meg, míg a /z/

realizációinak értékei jelentős átfedést mutattak mindkét hanggal az átlagértékek

alapján, illetve nagyobb variabilitást mutattak azoknál Ennek hátterében a

képzésük során fenntartandó rés és zönge párhuzamos képzésének nehézsége áll.

A zönge esetleges leállása, a rövidebb, de tipikus zöngés réshangként való

realizáció és az approximált (vagy ahhoz közelítő ejtés) változatossága a

spektrális szerkezetben is evidensen megmutatkozott. A spektrális eloszlás

súlypontjának elhelyezkedését meghatározta továbbá a beszélők életkora és

neme is. Míg a felnőtt férfiak esetében mutatkoztak a legalacsonyabb, és a

tinédzserkorú lányoknál a legmagasabb értékek, a tinédzser fiúk és a felnőtt nők

átlagos CoG-értékei közel azonosak voltak. Mindez valószínűsíthetően a

toldalékcső életkoronként és nemenként eltérő méreteivel magyarázható.

A szóródás legnagyobb arányban a /z/ hang esetében volt adatolható, ami

feltehetően részben ismét összefügg azzal, hogy a zöngés mássalhangzó

realizációja változatos mértékben zöngétlenedhet.

A réshangok spektrális ferdeségének és csúcsosságának variabilitása a

korábbiakhoz hasonlóan elsősorban az üregek eltérő méretével és a

mássalhangzók zöngésség szerinti elkülönülésével támasztható alá. Emellett

azonban fontos figyelembe venni a mássalhangzók közötti mintázatvariabilitás

szempontját is, amit részben a beszédhangok relatíve gyakori megjelenése,

valamint a vokális környezet változatossága is alátámaszt.

Page 18: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

18

Az eredmények alapján további vizsgálati kérdések is felmerülnek. Ilyen

például, hogy hogyan változik a spiránsok spektrális szerkezete a fiatalabb és

idősebb beszélők ejtésében, valamint hogy mennyiben függnek a vizsgált jegyek

az egyéni ejtési sajátosságoktól.

A mássalhangzók vizsgálata spontán beszédben történt, ilyen módon a

hangkörnyezet kiegyenlítetlen volt. A továbbiakban tervezzük a kutatás

kiterjesztését laboratóriumi beszéd elemzésére, amelyben a magánhangzók

minősége, valamint a prozódiai szerkezet kontrollálása mentén is összevethetővé

válnának az egyes csoportok értékeit, illetve tervezzük a vizsgálat bővítését új

életkori csoportok bővítésével.

A kérdés azonban felmerül, hogy az emberi beszédészlelés pontosan hogyan

dolgozza fel az akusztikumot. A másik felmerülő kérdés, hogy a zöngétlenebb

/z/-ejtések során a dinamikus CoG menete, avagy egy átlagolt CoG-észlelet

mentén történhet a percepcióban az elkülönítés a mássalhangzók között hasonló

időtartam esetében. Figyelembe kell venni természetesen, hogy a zöngés

mássalhangzó időtartama mindkét zöngétlennél jóval rövidebb, ami további

másodlagos felismerési kulcsokkal együttesen segíti az azonosítást.

Irodalom Auszmann A. (2016) Magyar gyermekek magánhangzóinak akusztikai-fonetikai jellemzői. Doktori

disszertáció. Budapest: ELTE BTK.

Bárkányi Zs. & Kiss Z. (2009) Word-final fricative contrasts in Hungarian. A phonetic approach.

Előadás a BuPhoC 2009 nov. 5-i ülésén. Letölthető: http://budling.nytud.hu/~cash/papers/

buphoc09-slide.pdf

Bárkányi Zs., Kiss Z. & Mády K. (2009) Az /s/–/z/ oppozíció fenntartása megnyilatkozás végén.

Előadás a Beszédkutatás 2009 konferencián. Budapest, 2009. okt. 16–17. Letölthető:

http://budling.nytud. hu/~cash/papers/beszkut2009-slide.pdf

Baum, S. R. & Blumstein, S. E. (1987) Preliminary observations on the use of duration as a cue to

syllable-initial fricative consonant voicing in English. Journal of the Acoustical Society of America

82. pp. 1073–1077.

Beke A. & Gyarmathy, D. (2010) Zöngétlen résmássalhangzók akusztikai szerkezete. Beszédkutatás

2010. pp. 57−75.

Bickley, C. A. & Stevens, K. N. (1986) Effects of a vocal tract constriction on the glottal source:

experimental and modeling studies. Journal of Phonetics 14. pp. 373−382.

Bóna, J. & Beke, A. (2013) A zöngétlen réshangok akusztikai szerkezete fiatal és idős korban.

Elhangzott: Az interkulturális kommunikáció elmélete és gyakorlata. Tudományos konferencia a

Kodolányi János Főiskola és az ELTE BTK Alkalmazott Nyelvészeti Tanszéke szervezésében.

Budapest, 2011. október 24–25.

Boersma P. & Weenink D. (2016) Praat: doing phonetics by computer.

http://www.fon.hum.uva.nl/praat/ (A letöltés ideje: 2016. 02. 13.)

Docherty, G. J. (1992) The Timing of Voicing in British English Obstruents. Berlin: Foris

Publications.

Fónagy I. & Szende T. (1969) Zárhangok, réshangok, affrikáták hangszínképe. Nyelvtudományi

Közlemények 71. pp. 281–343.

Gósy M., Gyarmathy D., Horváth V., Gráczi T. E., Beke A., Neuberger T. & Nikléczy P. (2012)

BEA: Beszélt nyelvi adatbázis. In: Gósy M. (szerk.) Beszéd, adatbázis, kutatások. Budapest:

Akadémiai Kiadó. 9‒24.

Gráczi T. E. (2012) Zörejhangok akusztikai fonetikai vizsgálata a zöngésségi oppozíció

függvényében. Doktori disszertáció. Budapest: ELTE BTK.

Page 19: Intervokális réshangok akusztikai szerkezete tinédzser ...alkalmazottnyelvtudomany.hu/wordpress/wp-content/uploads/Graczi-Krepsz.pdf · szakirodalomban evidenciaként van jelen,

GRÁCZI TEKLA ETELKA–KREPSZ VALÉRIA

19

Gyarmathy D. & Neuberger T. (2015) Egy hiánypótló adatbázis: a Tini BEA. Beszédkutatás 2015.

pp. 209−222.

Hacki, T. & Heitmüller, S. (1999) Development of the child’s voice: premutation, mutation.

International Journal of Pediatric Otorhinolaryngology 49. pp. 141−144.

Halle, M. & Clements, G. N. (1983) Problem Book in Phonology. Cambridge: MIT Press.

Heinz, J. M. & Stevens, K. N. (1961) On the properties of fricative consonants. Journal of the

Acoustical Society of America 33. pp. 589−596.

Hacki T., Hirschberg J. & Mészáros K. (2013) A hangképzés gyermekkori fejlődése, premutáció,

mutáció. In: Hirschberg J., Hacki T. & Mészáros K. (szerk.) Foniátria és társtudományok I.

Budapest: Eötvös Kiadó. pp. 213−216.

Jesus, L. M. T. & Shadle, C. H. (2003) Temporal and devoicing analysis of European Portuguese

fricatives. In: Solé, M.-J.; Recasens, D. & Romero, J. (eds.): 5th International Congress of Phonetic

Sciences. pp. 779–782.

Jongman, R. G. H. & Wayland, R. ‒ Wong, S. (1998) Acoustic Characteristics of English

Fricatives. Journal of the Acoustical Society of America 108. pp. 1252−1263.

Jongman, A.; Wayland, R. & Wong, S. (2000) Acoustic characteristics of English fricatives. Journal

of the Acoustical Society of America 108. pp. 1252−1263.

Kassai I. (1982) A magyar beszédhangok időtartamviszonyai. In: Bolla Kálmán (szerk.) Fejezetek a

magyar leíró hangtanból. Budapest: Akadémiai Kiadó.

Krepsz V. (2015) Magánhangzó-időtartamok alakulása a hangsor hossza és az életkor függvényében.

In: Váradi T. (szerk.) Doktoranduszok tanulmányai az alkalmazott nyelvészet köréből.

http://www.nytud.hu/alknyelvdok15/proceedings/anyd9.pdf (letöltés: 2017. 11. 01.)

Maddieson, l. (1999) Phonetical universals. In: Hardcustle, William J. & Laver, John (eds.) The

handbook of phonetic sciences. Oxford: Blackwell Publishers. pp. 619‒639.

Magdics K. (1966) A magyar beszédhangok időtartama. Nyelvtudományi Közlemények 68. 125–139.

Nissen, S. L. & Fox, R. A. (2005) Acoustic and spectral characteristics of young children's fricative

productions: A developmental perspective. Journal of the Acoustical Society of America 118. pp.

257−258.

Nittrouer, S. (1995) Children learn separate aspects of speech production at different rates: Evidence

from spectral moments. Journal of the Acoustical Society of America 97. pp. 520−530.

Sebestyénné Tar É. (2006) A 3-6 éves kori fonológiai fejlődéskronológiai mintázata a magyarban.

Budapest: Open Art.

Stevens, K. N. (1971) Airflow and turbulence noise for fricative and stop consonants: Static

considerations. Journal of the Acoustical Society of America 50. pp. 1182‒1192.

Stevens, K. N. (1998) Acoustic Phonetics. Cambridge, Massachusetts–London: The MIT Press.

Stevens, K. N. (2000) Diverse acoustic cues at consonantal landmarks. Phonetica 57. pp. 139‒151.

Stevens, K. N.; Blumstein, S. E.; Glicksman, L.; Burton, M. & Kurowski, K. (1992) Acoustic and

perceptual characteristics of voicing in fricatives and fricative clusters. Journal of the Acoustical

Society of America 91. pp. 2979‒3000.

Strevens, P. (1960) Spectra of fricative noise in human speech. Language and Speech 3. pp. 32−49.

Vorperian, H. K.; Wang, S.; Chung, M.K.; Schimek, E.M.; Durtschi, R.B. & Kent, R. D. et al.

(2009) Anatomic development of the oral and pharyngeal portions of the vocal tract: An imaging

study. Journal of the Acoustical Society of America. 125. pp. 1666−1678.