View
5
Download
0
Category
Preview:
Citation preview
UNIVERZA V LJUBLJANI
v sodelovanju z Universität Wien, Univerzita Komenského v Bratislave in
Eötvös Loránd Tudományegyetem
Špela Medvešek
Kognitivni vidiki modeliranja
glasbenih lastnosti z eksplicitnimi
globokimi arhitekturami
Magistrsko delo
SKUPNI INTERDISCIPLINARNI PROGRAM DRUGE
STOPNJE KOGNITIVNA ZNANOST
Mentor: izr. prof. dr. Matija Marolt
Somentorica: izr. prof. dr. Anja Podlesek
Ljubljana, 2019
Copyright. Rezultati magistrske naloge so intelektualna lastnina avtorja in
Fakultete za računalnǐstvo in informatiko Univerze v Ljubljani. Za objavo in
korǐsčenje rezultatov magistrske naloge je potrebno pisno privoljenje avtorja,
Fakultete za računalnǐstvo in informatiko ter mentorja.
Besedilo je oblikovano z urejevalnikom besedil LATEX.
Zahvaljujem se mentorju, dr. Matiju Maroltu, in somentorici, dr. Anji
Podlesek, za svetovanje, stalno dosegljivost in strokovno pomoč pri izdelavi
magistrske naloge.
Posebna zahvala gre asistentu dr. Matevžu Pesku, ki je s svojim preteklim
delom omogočil nastanek te naloge, me spodbujal pri delu in skrbel, da nisem
že zdavnaj obupala.
Hvala Nuši, Ani in Gregu za prevode, povratne prevode in preverjanje
prevedenega vprašalnika MSI.
Hvala Zali za pomoč pri oblikovanju spletne strani z vprašalnikom. Brez
nje bi bila eksperimentalna naloga veliko bolj dolgočasna.
Hvala Urši in Mihu, ki sta mi pri programiranju spletne strani priskočila
na pomoč, kadar se je kje zataknilo.
In navsezadnje hvala vsem, ki so mi v času študija, predvsem pa med
dolgotrajnim pisanjem te naloge, stali ob strani.
Kazalo
Povzetek
Abstract
1 Uvod 1
2 Pregled področja 4
2.1 Pridobivanje informacij iz glasbe in kognitivna muzikologija . 4
2.2 Vpliv kulture na glasbeno kognicijo . . . . . . . . . . . . . . . 6
2.3 Glasbeno pričakovanje . . . . . . . . . . . . . . . . . . . . . . 9
3 Računski modeli glasbenega pričakovanja 11
3.1 Narmourjev model implikacije–realizacije . . . . . . . . . . . . 11
3.2 Kompozicionalni hierarhični model . . . . . . . . . . . . . . . 15
4 Raziskava A: Indeks glasbene sofistikacije 21
4.1 Adaptacija vprašalnika za nov kulturni prostor . . . . . . . . . 21
4.2 Validacija vprašalnika Gold-MSI (CFA) . . . . . . . . . . . . . 24
4.3 Adaptacija vprašalnika Gold-MSI (EFA) . . . . . . . . . . . . 28
5 Raziskava B: Glasbeno pričakovanje 30
5.1 Materiali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Postopek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3 Udeleženci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.4 Pridobivanje odgovorov CHM . . . . . . . . . . . . . . . . . . 36
6 Raziskava B: Rezultati 37
6.1 Analiza tonskih hierarhij . . . . . . . . . . . . . . . . . . . . . 41
6.2 Vpliv poznavanja glasbe tuje kulture . . . . . . . . . . . . . . 51
6.3 Vpliv velikosti učne množice na rezultate . . . . . . . . . . . . 52
6.4 Povprečje obratnih vrednosti rangov . . . . . . . . . . . . . . 53
6.5 Pilotska študija s kitajskimi udeleženci . . . . . . . . . . . . . 56
7 Zaključek 58
7.1 Predlogi za izbolǰsave . . . . . . . . . . . . . . . . . . . . . . . 59
7.2 Nadaljnje delo . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Literatura 62
A Slovenski vprašalnik Gold-MSI 70
B Notni zapisi eksperimentalnih izsekov 73
Povzetek
Naslov: Kognitivni vidiki modeliranja glasbenih lastnosti z eksplicitnimi
globokimi arhitekturami
Avtor: Špela Medvešek
Kompozicionalni hierarhični model je globoka arhitektura, ki jo odlikuje
transparentnost, eksplicitnost naučenih konceptov in zmožnost učenja na
majhnih množicah podatkov. Model smo preizkusili na nalogi melodičnega
pričakovanja ob predhodnem poznavanju glasbe različnih kultur ter primer-
jali uspešnost njegovih napovedi z napovedmi ljudi. Izvedli smo eksperi-
ment, s katerim smo ocenili sposobnost napovedovanja nadaljevanja izsekov
zahodne in kitajske glasbe na dveh skupinah udeležencev – Evropejcih (Slo-
vencih) in Kitajcih. Poznavanje glasbenega sloga pripomore k nižji zaznani
kompleksnosti, ugotovili pa smo, da enako velja tudi za nalogo glasbenega
pričakovanja: udeleženci so bili uspešneǰsi pri napovedovanju nadaljevanja
vzorca pri glasbi lastne kulture kot pri glasbi tuje kulture. Tudi model je
prilagajal način modeliranja vzorcev glede na različne naučene tipe glasbe,
pri čemer je bil v nekaterih aspektih celo uspešneǰsi od ljudi.
Ključne besede: kompozicionalni hierarhični model, glasbeni vzorci, me-
lodično pričakovanje, vpliv kulture, glasbena kognicija.
Abstract
Title: Cognitive aspects of modelling musical characteristics using explicit
deep architectures
Author: Špela Medvešek
The compositional hierarchical model is a deep architecture characterized
by transparency, explicitness of learned concepts, and the ability to learn on
small datasets. The model was tested on the task of melodic expectation with
the prior knowledge of the music of different cultures, and its performance
in terms of the correctness of predictions was compared with human perfor-
mance. An experiment was conducted, assessing the ability of two groups of
participants—European (Slovene) and Chinese—to predict the continuations
of Western and Chinese musical excerpts. Familiarity with the musical style
contributes to a lower perceived complexity, and we found that the same
applies to the task of musical expectation: the participants were more suc-
cessful in predicting the continuations in the music of their own culture than
the foreign one. Furthermore, the model also adapted the pattern modelling
method with regard to the different types of music learned, and in some
aspects, it was even more successful than people.
Keywords: Compositional hierarchical model, musical patterns, computer
modelling, cultural influence, musical cognition.
Poglavje 1
Uvod
V zadnjem času je v kognitivni znanosti zelo priljubljena teorija predikcij-
skega procesiranja, ki trdi, da si na podlagi konteksta in predhodnih izkušenj
ustvarimo pričakovanja oziroma predikcije o prihajajočih dogodkih. Pristopi,
ki uporabljajo probabilistične modele za posnemanje kognitivnih procesov,
lahko zelo uspešno razložijo človeško vedenje na računskem nivoju. To lahko
učinkovito prenesemo tudi v kontekst glasbenega pričakovanja oziroma na-
povedovanja melodije, saj imamo relativno enostavne vhodne signale z ome-
jenim naborom možnih nadaljevanj (za razliko od npr. vidnega zaznavanja),
napovedovanje pa olaǰsajo še predhodne izkušnje oziroma vpliv kulturnega
in socialnega okolja.
Vpliv kulturnega ozadja na glasbeno kognicijo je bil raziskan in dokazan
že za mnoga področja glasbenega udejstvovanja, v pričujoči nalogi pa smo se
osredotočili na glasbeno pričakovanje in napovedovanje melodije. Za modeli-
ranje predikcijskih procesov v zaznavanju glasbe smo uporabili kompozicio-
nalni hierarhični model (angl. Compositional hierarchical model oz. CHM),
ki je bil do sedaj že uspešen pri reševanju različnih nalog s področja pridobi-
vanja informacij iz glasbe. CHM je bil naučen na dveh učnih množicah, od
katerih je prva vsebovala glasbo evropske (nemške) in druga kitajske kulture.
Dodali smo mu komponento za predvidevanje nadaljevanja vzorca. Za eval-
vacijo rezultatov smo uporabili obstoječe baze skladb, ki so se v preteklosti
1
2 Špela Medvešek
že uporabljale za analizo na področju pridobivanja informacij iz glasbe.
Delovanje modela smo primerjali s človeškim zaznavanjem skozi ekspe-
riment, v katerem smo sprva ocenili sposobnost napovedovanja nadaljeva-
nja melodičnega izseka na skupini ljudi, nato pa to sposobnost primerjali
s sposobnostjo predlaganega računskega modela. Eksperiment smo izvedli
na evropski in kitajski ljudski glasbi. Osredotočili smo se na to, kako sku-
pina ljudi in računski model ob predhodnem poznavanju evropske glasbe
predvidevata vzorce v evropski glasbi ter glasbi tujega (neevropskega) iz-
vora. Z uporabo dveh različnih učnih in testnih množic smo analizirali vpliv
predhodnega poznavanja glasbe posameznega tipa oz. kulturnega ozadja ter
preverjali, ali tudi model odraža latentne probabilistične modele, na katere
namigujejo človeški kognitivni procesi.
Naše glavno raziskovalno vprašanje je bilo, kako uspešen je kompozici-
onalni hierarhični model v primerjavi z ljudmi pri nalogi glasbenega pri-
čakovanja ter kako na uspešnost vpliva predhodni trening oz. specifična
učna množica. Poleg tega smo preizkusili tudi nasprotujoče si ugotovitve o
uspešnosti pri nalogi glasbenega pričakovanja v glasbi tuje kulture. Priča-
kovali smo, da bo uporabljeni model prilagajal način predvidevanja oz. mo-
deliranja vzorcev glede na različne naučene tipe glasbe ter da bo delovanje
modela uspešno posnemalo človeško zaznavanje.
V prvem delu naloge na kratko povzamemo dosedanje ugotovitve s področij
vpliva kulture na glasbeno kognicijo in glasbenega pričakovanja. Nadalju-
jemo z opisom razširjenega modela implikacije–realizacije, katerega delova-
nje smo primerjali s kompozicionalnim hierarhičnim modelom, ki je opisan v
nadaljevanju poglavja 3. Nato obrazložimo še algoritem, s pomočjo katerega
CHM “rešuje nalogo”.
V poglavju 4 opǐsemo raziskavo A, v kateri smo prevedli in evalvirali
Goldsmithsov indeks glasbene sofistikacije – samoocenjevalni vprašalnik, s
pomočjo katerega smo ocenjevali glasbeno predznanje udeležencev. Predsta-
vimo postopek adaptacije tovrstnih vprašalnikov za drug kulturni prostor
Magistrska naloga 3
ter utemeljimo in predstavimo skraǰsano različico omenjenega vprašalnika,
ki smo ga uporabili v raziskavi B.
Sledi opis metode raziskave B, in sicer opǐsemo postopek zbiranja skladb,
uporabljenih v eksperimentu, uporabnǐski vmesnik, ki smo ga za ta namen
izdelali, udeležence v eksperimentu in postopek pridobivanja odgovorov mo-
dela CHM.
V poglavju 6 predstavimo rezultate evropskih udeležencev, modela CHM
in modela implikacije–realizacije, nazadnje pa še na kratko povzamemo re-
zultate pilotske študije s kitajskimi udeleženci. Na koncu omenimo še nekaj
predlogov za izbolǰsave ter idej za nadaljnje delo s kompozicionalnim hie-
rarhičnim modelom.
Poglavje 2
Pregled področja
2.1 Pridobivanje informacij iz glasbe in kog-
nitivna muzikologija
Magistrska naloga združuje področji pridobivanja informacij iz glasbe (ang.
music information retrieval – MIR) in kognitivno muzikologijo. Pridobivanje
informacij iz glasbe je interdisciplinarno področje s koreninami v muzikologiji,
strojnem učenju, procesiranju signalov in psihologiji. Cilj MIR je najti mo-
dele, ki najbolje rešijo zadano nalogo, medtem ko računsko preučevanje glas-
bene kognicije poskuša modelirati človeško kognicijo [7]. Od ostalih področij
glasbene psihologije se kognitivna muzikologija razlikuje po metodoloških pri-
stopih, in sicer uporablja računalnǐsko modeliranje za preučevanje reprezen-
tacij glasbenega znanja [33]. Pri raziskovanju so pogosto vključeni biološko
navdahnjeni modeli, npr. nevronske mreže in evolucijski algoritmi.
Zanimivi in med seboj povezani temi na stičǐsču teh dveh disciplin sta
hierarhično modeliranje glasbe in iskanje vzorcev v glasbi. Hierarhično mo-
deliranje obravnava vse od najosnovneǰsih vidikov glasbe, npr. prepoznave
tonskih vǐsin iz frekvenc slušnih signalov, do vǐsjih, kot so dojemanje hierarhij
znotraj lestvice, prepoznave akordov, harmonij, motivov in fraz [25]. Primer
hierarhičnega pristopa k analizi glasbe je shenkerjanska tonalna analiza (angl.
Schenkerian analysis), izvorno poimenovana redukcijska analiza (nem. Re-
4
Magistrska naloga 5
duktionsanalyse). Teorija prikazuje, da je vsako skladbo možno (postopoma)
poenostaviti na njeno fundamentalno strukturo ter da so melodije v svojem
bistvu zgolj dodelave osnovne strukture, imenovane Ursatz. Najosnovneǰse
sosledje harmonij je tonika-dominanta-tonika (I–V–I; slika 2.1), do katerega
pridemo s transformacijami od najvǐsjega nivoja, tj. celotne skladbe, do
najnižjega, tj. Ursatz. Teorijo pa lahko uporabimo ne le za namen poenosta-
vitve melodije, temveč tudi kot prikaz skladateljevega talenta in zmožnosti
predelave ter dodelave osnovne strukture v edinstveno skladbo [48].
Slika 2.1: Prikaz osnovne strukture skladbe v C-duru (nem. Ursatz ) –
zgornja vrstica predstavlja osnovni potek padajoče melodije s pričetkom na
tonu E oz. 3. stopnji C-durove lestvice (nem. Urlinie), spodnja pa to-
nike akordov, ki bi predstavljali harmonijo (nem. Bassbrechung). Pridobljeno:
http://www.schenkerguide.com/whatisschenkeriananalysis.php, 4. 5. 2019.
Schenkerjeva analiza ne zapoveduje določenega algoritma, po katerem bi
se gradilo hierarhije v glasbi, temveč se lahko smatra bolj kot osnova za
hierarhično analizo [26]. Ravno zaradi tega na njej temelji mnogo pozneǰsih
analiz in glasbenih modelov, npr. [16, 39, 40, 62, 66], posredno pa tudi model
CHM, predstavljen v pričujoči nalogi.
S pomočjo analize, prepoznavanja ter strukturiranja motivov in fraz lahko
učinkovito rešujemo nalogo iskanja ponavljajočih vzorcev v glasbi, pri čemer
se je za uspešnega izkazal tudi CHM [25, 56].
6 Špela Medvešek
Področje kognitivne muzikologije med drugim raziskuje tudi vzporednice
v možganih med jezikovnimi in glasbenimi dogodki [19]. Tako jezik kot glasba
sta povezana s procesiranjem zvoka. Za oba je potrebna interpretacija več
lastnosti zvoka, kot so barva, tonska vǐsina, trajanje in njihove interakcije
[18].
Nekateri aspekti jezika in glasbe so dokazano procesirani v istih funkcio-
nalnih možganskih delih, in sicer v primarnem in sekundarnem avditornem
korteksu, temporalnem režnju, Brocovem centru, primarnem in suplementar-
nem motoričnem korteksu, anteriorni insuli, bazalnih ganglijih, ventralnemu
talamusu in posteriornem cerebelumu. Pri jeziku je opazna lateralizacija – za
jezikovne naloge se specializira dominantna hemisfera (navadno leva) –, glas-
bene aktivacije pa se dogajajo na obeh hemisferah, zaradi česar se aktivnosti
jezikovnih in glasbenih procesov pogosto prekrivajo [6].
Enako kot se aktivirajo določeni možganski procesi, ko slǐsimo znan jezik,
lahko v možganih vidimo razliko v aktivacijah pri poslušanju glasbe, ki jo
poznamo [42, 60]. Tudi neskladja v glasbi na nivoju glasbene sintakse sprožijo
enake možganske odzive, kot so bili opazovani v jezikoslovnih eksperimentih
[36, 44, 49].
2.2 Vpliv kulture na glasbeno kognicijo
Vpliv kulture na glasbeno kognicijo je bil raziskan in dokazan že za mnoge
vidike glasbe, npr. glasbeno segmentacijo [44], prepoznavanje razpoloženja
[3], zaznavanje ritmične [13] in melodične kompleksnosti [15].
Mnogi eksperimenti, ki preučujejo glasbeno kognicijo, so zasnovani na je-
zikoslovnih študijah. Maess idr. [36] so v študiji z MEG so pokazali, da Bro-
cov center, ki igra pomembno vlogo pri zgodnjem procesiranju neskladnosti
v sintaksi, tudi pri glasbenih neskladjih manifestira podobne aktivacije. To
predpostavko so nato Nan in drugi [44] prenesli na področje prepoznavanja
segmentov (fraz) v glasbi in v EEG raziskavi pokazali, da neskladja v glasbi
sprožijo enake možganske odzive kot jezikovna neskladja. Pri udeležencih so
Magistrska naloga 7
opazili univerzalni označevalec prozodičnega segmentiranja fraz, angl. closure
positive shift (CPS), ki se pojavlja tako pri poslušanju govora in glasbe kot
branju. Glasbeni CPS se je pojavljal med 100 in 450 ms po koncu fraze; bolj
zgodaj pri poslušanju glasbe lastne kulture (Nemci pri poslušanju evropske,
Kitajci pri poslušanju kitajske glasbe) in pozneje pri poslušanju tuje glasbe
(Nemci pri poslušanju kitajske, Kitajci pri poslušanju evropske glasbe) [44].
Glasba različnih kultur aktivira iste oziroma zelo podobne možganske re-
gije, kar so pokazali tudi Morrison in drugi v študiji s funkcionalno magnetno
resonanco (fMRI) [42]. V splošnem se nevrofiziološke raziskave strinjajo, da
je možno opazovati razlike v možganskih aktivacijah, kadar poslušamo glasbo
lastne in kadar poslušamo glasbo tuje kulture. Pri dokazovanju tega pa so
bili še bolj uspešni behavioristični eksperimenti.
Vpliv kulture je bil dokazan že za mnoge aspekte glasbene kognicije, npr.
izražanje glasbenih preferenc [63], prepoznavanje razpoloženja in čustev v
glasbi [3], glasbeni spomin [14] itd. Že pri otrocih se pokažejo preference za
kulturno poznane glasbene tradicije [14, 63]. Tudi glasbeni spomin posame-
znika je bolǰsi za kulturno poznano kot neznano glasbo [14]. Vpliv kulture
je viden tudi pri ritmu, ki je eden od faktorjev, ki je kot stalna in periodična
mera časovne organizacije prisoten v vseh svetovnih glasbah. Preferenco za
ritem svoje kulture opazimo že zgodaj. Kultura prav tako vpliva na prepo-
znavanje ritma, in sicer se nam tuji ritmi zdijo kompleksneǰsi, zato jih težje
prepoznamo [12].
Prepoznavanje razpoloženja in klasifikacija čustev v glasbi pri odraslih sta
odvisna tako od kulturno-specifičnih kot univerzalnih strukturnih lastnosti
poslušane glasbe. Balkwill in Thompson [3] sta raziskovala, ali zahodni po-
slušalci znajo prepoznati čustva (intended emotion) v glasbi v nepoznanem
tonalnem sistemu, v njunem primeru v hindujski glasbi. Ugotovila sta, da
smo ljudje v glasbi v tujem tonalnem sistemu zmožni prepoznati osnovna
čustva, npr. veselje, žalost in jezo, ne pa kompleksneǰsih in takšnih, ki se
morda razlikujejo od kulture do kulture – kot primer slednjega navajata
“mir” [3]. Fritz in drugi [17] so opravili raziskavo tudi v obratni smeri, in
8 Špela Medvešek
sicer so preverjali, ali tudi nezahodni (v tem primeru afrǐski) udeleženci pre-
poznajo čustva v zahodni glasbi. Prǐsli so do enakega zaključka, torej da je
tudi v zahodni glasbi izraz osnovnih emocij univerzalno prepoznaven.
Pri raziskavah kompleksnosti, tako ritmične kot melodične, velja omeniti
dve raziskavi, ki sta preučevali afrǐsko in evropsko glasbo [13, 15]. Udeleženci
so pri obeh raziskavah glasbo lastne kulture ocenjevali kot manj kompleksno
od glasbe tuje kulture. Tujo glasbo pa so ocenjevali kot kompleksneǰso od
glasbe lastne kulture, a so Afričani evropsko dojemali bistveno manj komple-
ksno kot Evropejci afrǐsko. To je najverjetneje posledica razširjenosti zaho-
dne kulture ali z drugimi besedami, ljudje po vsem svetu so dodobra sezna-
njeni z zahodno kulturo in glasbo, zaradi česar manj robustne kulture hitro
izginjajo ali v manj radikalnih primerih kažejo “zgolj” globoko infiltracijo
zahodnih glasbenih temeljev [22].
Področje raziskovanja glasbe, ki je za našo raziskavo najpomembneǰse,
pa je glasbeno pričakovanje. Izmed vseh zgoraj predstavljenih se pri tem
aspektu najmanj manifestirajo razlike med kulturami [9, 30, 31]. Tovrstne
študije se navadno izvajajo na dveh skupinah udeležencev (običajno je ena
zahodna – Evropejci ali Američani – in ena tuja – v raziskavah po večini
sodelujejo Afričani ali Azijci). Naloga udeležencev je napovedati, kako se bo
nadaljeval segment glasbe lastne in tuje kulture. Na splošno se udeleženci iz
različnih kultur zelo podobno odločajo glede nadaljevanj v skladbah lastne in
tuje kulture. V eni izmed raziskav (Krumhansl et al. [30]) pa so se neevrop-
ski udeleženci celo točneje odločali v primeru evropske glasbe, s pomembno
opombo, da so bili dobro seznanjeni z evropskimi klasičnimi deli in so se
posledično odločali bolj v skladu z glasbeno teorijo kot Evropejci, ki imajo
bolj “splošno” (tj. ne omejeno na en sam slog) znanje o zahodni glasbi.
Ugotovljeno je bilo tudi, da so poslušalci dokaj fleksibilni glede odziva
na strukturo glasbe nepoznanega stila, torej da se hitro privadijo na različne
glasbene sisteme ter so zmožni že po kratki izpostavljenosti “zatreti” priča-
kovanja, ki se ne bi skladala s slogom poslušane glasbe [22, 31]. Za to obsta-
jata dve možni razlagi, in sicer (1) da se pri poslušanju že učimo značilnosti
Magistrska naloga 9
sloga oziroma, z drugimi besedami, pozorni smo na stilistične težnje v glasbi,
ali (2) da obstajajo osnovni psihološki principi oz. univerzalne lastnosti
glasbe, ki jih lahko prenesemo na različne glasbene sloge.
2.3 Glasbeno pričakovanje
Napovedovanje igra pomembno vlogo pri procesiranju informacij. To sta
ugotavljala že Hermann von Helmholtz [20] in William James [23] konec 19.
stoletja, teorija predikcijskega procesiranja pa v zadnjem času le še pridobiva
na priljubljenosti [10, 61].
Predikcijski mehanizmi temeljijo na konstruiranju reprezentacij na osnovi
konteksta in predhodnih izkušenj, ki se manifestirajo skozi tok informacij od
zgoraj navzdol (angl. top-down). Koncept predikcijskega procesiranja se je
uspešno uveljavil na mnogih področjih, še posebno pri obdelavi senzornih
informacij [34].
Sears et al. [61] navajajo primer hoje po stopnicah – možgani si ustva-
rijo miselno reprezentacijo stopnǐsča, pri čemer si pomagajo z vizualnimi,
avditornimi, haptičnimi in proprioceptičnimi dražljaji. Z neprestanim po-
sodabljanjem te reprezentacije minimalizirajo potencialne napake v njej in
zato lahko brez pretirane nevarnosti hodimo po stopnicah. Z izpostavljeno-
stjo podobnim situacijam naše predikcijske sheme postanejo natančneǰse in
lažje predvidimo prihodnje dogodke.
Prvi, ki je predikcijsko procesiranje uporabil na področju glasbe, je bil
Leonard B. Meyer [41], čigar teorijo je za osnovo vzel Eugene Narmour in
ustvaril model realizacije–implikacije [45, 46] (gl. poglavje 3.1), ki predpo-
stavlja, da si na podlagi intervalov v skladbi ustvarimo pričakovanja o na-
daljevanju melodije. To predpostavko lahko skladatelji izkoristijo na primer
za ustvarjanje glasbe, ki si jo bodo poslušalci zlahka zapomnili [27], ali pa
za komponiranje nepričakovanih melodij, ki bi poslušalce presenetile ali kako
drugače zaznamovale.
Obširno raziskano glasbeno področje z vidika pričakovanja so kadence, tj.
10 Špela Medvešek
kombinacije akordov oziroma tonskih stopenj, ki označujejo konec skladbe
oziroma dela skladbe. Kadence vzpostavijo najbolj predvidljiva shematska
pričakovanja v glasbi [61] (najmočneǰsi je na primer razvez iz dominante v
toniko [1]), zato lahko predvidevamo, da se bo to odražalo tudi pri reševanju
eksperimentalne naloge, in sicer smo pričakovali, da bodo udeleženci pravil-
neje odgovarjali glede pričakovanega nadaljevanja glasbe za glasbene izseke,
pri katerih je potrebno ugibati zaključek fraze (kadence), kot za izseke, pri
katerih je bilo treba ugibati nezaključni ton v frazi.
Sodobneǰsi pristopi, ki s pomočjo probabilističnih modelov posnemajo
človeške kognitivne procese, lahko v nekaterih primerih zelo dobro razložijo
človeško vedenje na računskem nivoju [38]. Glasba, predvsem monofonska,
je eno takšnih področij, ki so lahko zelo uspešno modelirana, saj nudi le
omejen nabor možnih elementov [57] oziroma nadaljevanj (za razliko od npr.
vidnega zaznavanja, kjer so elementi veliko manj diskretni, meje med njimi
pa so lahko zelo zabrisane). Napovedovanje melodije pa nam dodatno olaǰsa
(ali pa oteži) tudi predhodno poznavanje glasbene kulture.
Poglavje 3
Računski modeli glasbenega
pričakovanja
S porastjo računalnǐske tehnologije se je konec preǰsnjega stoletja začelo
večati tudi zanimanje za računalnǐsko pridobivanje informacij iz glasbe in
njeno analizo. Od takrat je nastalo že veliko modelov, ki se ukvarjajo z
najrazličneǰsimi nalogami MIR.
V tem poglavju predstavimo dva računska modela za modeliranje glasbe-
nega pričakovanja, katerih uspešnost primerjamo v nalogi: razširjeni Narmo-
urjev model implikacije–realizacije (IR) in kompozicionalni hierarhični model
(CHM).
Model IR je nastal kot alternativa schenkerjanski analizi. Slednja se
osredotoča na glasbeno analizo, IR pa predvsem na kognitivne aspekte me-
lodičnega pričakovanja. CHM je sodobna globoka arhitektura, ki z nenadzo-
rovanim učenjem ǐsče vzorce v glasbi, implementirali pa smo ji tudi kompo-
nento za napovedovanje nadaljevanja melodije.
3.1 Narmourjev model implikacije–realizacije
Eugene Narmour je za osnovo vzel teorijo glasbenega pričakovanja Leonarda
Meyerja [41], ki temelji na razumevanju glasbene strukture ter zaznavanju
11
12 Špela Medvešek
glasbenih emocij in pomena, in jo razvil v kompleksno teorijo melodične per-
cepcije, ki jo je poimenoval model implikacije–realizacije (angl. the implication–
realization (IR) model) [45].
Osredotoča se na implikativne intervale, s pomočjo katerih si ustvarimo
pričakovanja o nadaljevanju melodije, in realizirane intervale, ki ta pričako-
vanja oz. implikacije (predvidoma) izpolnijo oz. realizirajo [65]. Z drugimi
besedami, model opazuje zaznavne sisteme, ki procesirajo informacije od zgo-
raj navzdol (angl. top-down), in tiste, ki procesirajo informacijo od spodaj
navzgor (angl. bottom-up), na podlagi katerih si zgradimo melodične re-
prezentacije. Top-down procesiranje glasbe lahko enačimo z implikacijo oz.
pričakovanjem, njihove realizacije pa spadajo v sistem bottom-up reprezen-
tacij, ki so priučene, odvisne od glasbenega znanja in izkušenj ter specifične
za glasbene kulture [50].
Model IR vsebuje pet kriterijev, na podlagi katerih se ocenjuje primernost
realiziranega intervala:
– smer melodije, angl. registral direction: implikativni intervali, veliki
8 poltonov ali več, implicirajo spremembo smeri melodije, manǰsi pa
ohranitev smeri,
– melodični povratek, angl. registral return: preferira povratek na
prvi ton implikativnega intervala oz. odmik od slednjega za največ 2
poltona navzgor ali navzdol,
– intervalna razlika, angl. intervallic difference: implikativni intervali,
veliki 5 poltonov ali manj, implicirajo podobno velike realizirane inter-
vale (z odmikom za 2 poltona navzgor ali navzdol pri spremembi smeri
melodije oziroma 3 poltone pri ohranitvi smeri), implikativni intervali
večji od 5 poltonov pa manǰse realizirane,
– bližina, angl. proximity : preferira realizirane intervale, velike 5 polto-
nov ali manj,
– zaključenost, angl. closure: implicira spremembo smeri melodije ali
Magistrska naloga 13
manǰsi realizirani interval od implikativnega, če je bil implikativni in-
terval velik (vsaj 3 poltone večji od realiziranega)
Model preferira majhne realizirane intervale in ohranitev smeri melodije ozi-
roma obstanek na istem tonu, v primeru večjih realiziranih intervalov pa
spremembo smeri melodije.
3.1.1 Razširjeni model implikacije–realizacije
Petim osnovnim kriterijem Narmourjevega modela so pozneje različni avtorji
dodali še pet kriterijev, ki pa ne temeljijo vsi na realizaciji implikativnih
intervalov. Dodani kriteriji so:
– sozvočnost, angl. consonance: preferirani realizirani intervali so so-
zvočni intervali: prima, čista kvarta, čista kvinta in oktava [28],
– tonalnost, angl. tonality : preferirani so tonsko stabilneǰsi toni, gl.
Poglavje 3.1.2 [27],
– melodična privlačnost, angl. melodic attraction: razmerje tonalno-
sti obeh tonov v realiziranem intervalu [35],
– tessitura : napoveduje tone, ki so blizu srednji legi melodije [21],
– mobilnost, angl. mobility : na podlagi avtokorelacije med zaporednimi
tonskimi vǐsinami ocenjuje, kako napovedljiv je posamezen ton glede
na preǰsnje tone in srednjo lego [21].
V nadaljevanju podrobneje predstavimo kriterij tonalnost. Njegovo poeno-
stavljeno različico smo uporabili tudi za analizo primernosti odgovorov v
raziskavi B.
3.1.2 Tonske hierarhije
Teorija tonskih hierarhij sloni na predpostavki, da so statistično pogosti glas-
beni vzorci (v večini primerov) zanesljive smernice za poslušalčevo abstrahi-
ranje tonske hierarhije. Z drugimi besedami, poslušalci so se ob upoštevanju
14 Špela Medvešek
sloga skladbe zmožni orientirati k pravi tonalni hierarhiji, njihovo zaznavanje
pa se sklada s frekvencami pojavitve tonov in njihovih kombinacij.
Hierarhijo tonov vzpostavi glasbeni kontekst. Določeni toni so značilnej-
ši, stabilneǰsi in pomembneǰsi za strukturo kot drugi. V klasični zahodni
tonalno-harmonični glasbi 18. in 19. stoletja je glavni ton v hierarhiji to-
nika, sledita mu dominanta in dominantna paralela, nato ostali toni lestvice,
nazadnje pa še toni, ki niso del lestvice. Ta hierarhija odraža vpliv triadične
(akordne) strukture, v kateri dominirajo konsonantni akordi.
Krumhansl [29] je za namen kvantificiranja tonskih hierarhij uporabila
metodo probe tone, pri kateri so udeleženci poslušali nezaključene lestvice
ter ocenjevali (s pomočjo lestvice Likertovega tipa z vrednostmi 1–7), kako
dobro posamezni toni to lestvico zaključijo. Rezultati so transponirani v
skupno tonaliteto in predstavljeni v tabeli 3.1. Kot že omenjeno v preǰsnjem
odstavku, dobi najvǐsjo vrednost tonika (v primeru C-dura oz. c-mola je to
ton C).
Tabela 3.1: C-durova tonska hierarhija, pridobljena z metodo probe tone.
ton C C# D D# E F F# G G# A A# B
C-dur 6,35 2,23 3,48 2,33 4,38 4,09 2,52 5,19 2,39 3,66 2,29 2,88
c-mol 6,33 2,68 3,52 5,38 2,60 3,53 2,54 4,78 3,98 2,69 3,34 3,17
Toni, ki so vǐsje v tonski hierarhiji, se pojavljajo pogosteje in na poudar-
jenih metričnih pozicijah ter trajajo dlje [27], poleg tega pa vǐsje kot so v
hierarhiji, hitreje jih prepoznamo kot del lestvice [24].
Poleg glasbenih referenčnih točk, ki vodijo glasbeno percepcijo, glasbeni
spomin in razumevanje, so poslušalci občutljivi tudi na pogosta zaporedja
zvokov [58, 59]. S ponavljajočim poslušanjem implicitno razvijejo men-
talne reprezentacije, ki odražajo glasbene konsistentnosti, s pomočjo kate-
rih nato šifrirajo in pomnijo glasbene vzorce ter med poslušanem generirajo
pričakovanja. Občutljivost na te konsistentnosti omogoča relativno hitro pri-
lagoditev novim glasbenim slogom.
Koncept, da je en centralni ton referenčna točka za množico hierarhično
Magistrska naloga 15
povezanih tonov, pa ni lasten zgolj zahodnemu tonsko-harmoničnemu slogu,
temveč tudi drugim slogom in kulturam, edinstvene hierarhije pa se lahko
vzpostavijo tudi znotraj posameznih skladb.
Zahodni poslušalci so se v poskusu Castellana idr. [9] hitro prilagodili
tonskih hierarhijam nepoznanega (indijskega) sloga. Izkazalo se je, da so
pomembneǰsi toni zaigrani večkrat, zaradi česar so poslušalci, ki s slogom
niso seznanjeni, zmožni najti primerno tonsko hierarhijo [9]. Že neizkušeni
poslušalci so fleksibilni in se hitro prilagodijo na tonska zaporedja v neznanih
glasbenih kontekstih, pri glasbeno izobraženih pa je statistično procesiranje
glasbe še bolj poudarjeno [47].
3.2 Kompozicionalni hierarhični model
V zadnjem času so na področju strojnega učenja in prepoznavanja vzorcev
postale popularne t. i. globoke arhitekture, še posebno tiste, ki temeljijo
na nevronskih mrežah. Tovrstne arhitekture ponujajo zmožnost učenja in
modeliranja značilnosti učnih podatkov na več ravneh, pri čemer na nizkih
ravneh modelirajo enostavne strukture, na vǐsjih pa obsegajo kompleksneǰse
koncepte. Pri prepoznavanju predmetov na slikah lahko npr. elementi na pr-
vih ravneh prepoznavajo značilke, kot so robovi, elementi na najvǐsjih ravneh
pa celotne predmete.
Alternativa nevronskim mrežam je vizualni hierarhični model, ki se uči se-
gmente slik hierarhično združiti v kompleksneǰse motive in specifične objekte
[51]. Na podlagi tega modela so Pesek in drugi [54] razvili kompozicionalni
hierarhični model (v nadaljevanju: CHM), globoko arhitekturo, namenjeno
pridobivanju informacij iz glasbe. Motivacija za CHM je razgradnja zaple-
tenih signalov v preprosteǰse dele signala. Prva plast vsebuje dele, ki pred-
stavljajo posamezne dogodke (npr. prisotnost zvočne frekvence na avdio
posnetku, črte na sliki ali note v simbolnem glasbenem zapisu), nadaljnje
plasti pa na podlagi statistične analize gradijo kompozicije delov s preǰsnjih
plasti, ki se pogosto sopojavljajo.
16 Špela Medvešek
Model je bil že preizkušen na več opravilih s področja pridobivanja in-
formacij iz glasbe: prepoznavanje not v polifonični glasbi [54], pridobivanje
značilk za opredelitev čustev, izraženih z glasbo, ocenjevanje harmonskih za-
poredij [53] in iskanje vzorcev v simbolnih glasbenih predstavitvah [25, 56].
V primerjavi s trenutnimi implementacijami globokih arhitektur, ki teme-
ljijo na nevronskih mrežah, lahko strukturo naučenih konceptov v kompozi-
cionalnem hierarhičnem modelu, ki je transparentna arhitektura, opazujemo
brez specializiranega procesa, kakršen je običajno potreben za modele, ki de-
lujejo na principu črne škatle. Poleg tega CHM zaradi relativnosti delov že
na zelo majhni vhodni množici uspešno prepozna kompleksne koncepte [52].
3.2.1 Kompozicionalni hierarhični model za simbolni
glasbeni zapis
Kompozicionalni hierarhični model za simbolni glasbeni zapis (angl. Symbo-
lic compositional hierarchical model, SymCHM) je implementacija CHM za
glasbo v simbolnem glasbenem zapisu1. Model z nenadzorovanim učenjem
dogodke oz. dele na najnižjem nivoju (posamezne note) združuje v dele na
vǐsjih nivojih, slednje pa nadalje združuje v dele oz. kompozicije na še vǐsjih
nivojih in tako odkriva kompleksne, ponavljajoče se vzorce na najvǐsjih ni-
vojih [25, 55].
Medtem ko del v prvotnem modelu CHM predstavlja spektralne značil-
nosti zvoka, kot so frekvence in posamezni toni, v katere se osnovne frekvence
združujejo, pa SymCHM iz delov (tonov in njihovih kompozicij) gradi hie-
rarhične modele melodičnih vzorcev [55]. Deli so predstavljeni relativno, za-
radi česar model najde vzorce neodvisno od absolutne tonske lege in trajanja
[52] (gl. tudi Poglavje 3.2.2).
V model so avtorji vgradili več biološko navdahnjenih mehanizmov: in-
hibicijo, podobno inhibiciji v človeškem avditornem sistemu, sposobnost za-
polnjevanja manjkajočih delov (avtorji ta mehanizem poimenujejo halucina-
1 Vhodni podatki so v formatu MIDI, MusicXML ali drugih tekstovnih formatih, vse-
bujejo pa tonsko vǐsino, čas nastopa tona in trajanje tona, gl. Poglavje 3.2.2
Magistrska naloga 17
cija) ter avtomatsko ojačitev novosti v signalu. Zaradi relativnosti naučenih
konceptov in vgrajenih mehanizmov, predvsem zapolnjevanja, lahko model
napoveduje pričakovane prihodnje dogodke, kar sovpada tudi s človeškim
dojemanjem glasbe, pričakovanji in njihovim kršenjem ter s tem povezano
zanimivostjo in emocionalnostjo doživljanja glasbe [56].
3.2.2 Obdelava podatkov
Za izgradnjo kompozicionalnega hierarhičnega modela potrebujemo učno mno-
žico v točno določenem zapisu (predstavljenem v nadaljevanju), ki predsta-
vlja naše vhodne podatke. Te CHM obdela in iz njih izlušči vzorce, ki se
v učni množici pojavljajo. Izhodna datoteka, ki jo CHM vrne, v vsaki vr-
stici vsebuje niz, ki predstavlja enega izmed najdenih vzorcev. Prvi ton v
vzorcu je predstavljen kot 0, ne glede na absolutno tonsko vǐsino, vsi nasle-
dnji pa kot relativni poltonski odmiki od njega. Tako je npr. zaporedje tonov
{C2, F2, A1,C2} v izhodni datoteki predstavljeno kot {0, 5, –3, 0}.Najprej uredimo vhodne podatke, in sicer je treba skladbe iz formata
MIDI pretvoriti v tekstovne datoteke formata .csv. V datoteki je vsak ton
predstavljen v svoji vrstici kot niz s petimi elementi:
{To, P1, P2,D, S}
pri čemer elementi po vrsti predstavljajo:
– To: čas nastopa tona (ang. onset time) v udarcih četrtinke,
– P1: tonsko vǐsino v formatu MIDI,
– P2: tonsko vǐsino, zapisano v morfetični vrednosti (vrednosti nismo
uporabljali),
– D: trajanje tona v udarcih četrtinke,
– S: številko notnega črtovja (vrednosti nismo uporabljali).
18 Špela Medvešek
Na takšen način pripravimo učno množico, na podlagi katere s pomočjo
kompozicionalnega hierarhičnega modela pridobimo nabor glasbenih vzorcev,
dolgih med 4 in 32 dogodkov, ki se v učni množici pojavljajo.
Vzorce pretvorimo v skraǰsani zapis, pri katerem si pomagamo z malimi
in velikimi tiskanimi črkami, ki nadomestijo razmerja med toni, izražena v
številkah.
{ 0, 5, -3, 0 } → 0Ec0
Pozitivne številke spremenimo v velike črke (5 → E), negativne pa v malečrke (–3→ c). Toni so zabeleženi relativno glede na poltonsko oddaljenost odprvega tona, ki ima povsod vrednost 0. Takšno anotacijo z nekaj razlikami,
opisanimi v nadaljevanju, uporabljamo tudi pri eksperimentalnih glasbenih
izsekih.
Skladbe najprej zapǐsemo kot nize MIDI tonskih vǐsin (sledi zapis MIDI
vǐsin za del skladbe Kuža pazi):
{ 60, 60, 60, 60, 62, 62, 62, 62, 64, 64, 62, 62 }
in jih nato pretvorimo v zgoraj omenjeno anotacijo s prvo vrednostjo enako
0. Nato ločeno z $ nizu pripnemo niz z vsemi toni od drugega naprej, pri
čemer ima drugi ton (tj. prvi znak drugega niza) vrednost 0, ostale tone pa
pretvorimo relativno glede na prvi znak (drugi ton). Postopek nadaljujemo
do predzadnjega tona (gl. tabela 3.2) in dobimo nize oblike:
0000BBBBDDBB$000BBBBDDBB$...$0000BB00$...$00bb$0bb$00.
Med posamezne tone v vsakem vzorcu (ne skladbi) vstavimo regularni iz-
raz [0a-zA-Z]*, ki označuje, da se med dvema znakoma lahko nahaja poljubno
število znakov. Del v oglatih oklepajih pomeni katero koli črko angleške abe-
cede ali številko 0, zvezdica pa poljubno število ponovitev katerega koli izmed
znakov v tem naboru. Nato poǐsčemo vse vzorce, ki se ujemajo z naučenimi
vzorci do predzadnjega tona, in zadnji ton določimo kot nadaljevanje glas-
benega izseka (tabela 3.3). Vzorci se pojavljajo na različnih delih izseka in
z različnimi oddaljenostmi med toni; za slednje poskrbi izraz [0a-zA-Z]*. Na
Magistrska naloga 19
Tabela 3.2: Pretvorba skladb za iskanje ujemajočih se vzorcev (izsek
skladbe Kuža pazi).
Mesto 13 12 11 10 9 8 7 6 5 4 3 2
Midi 60 60 60 60 62 62 62 62 64 64 62 62
Segment
0 0 0 0 B B B B D D B B
0 0 0 B B B B D D B B
0 0 B B B B D D B B
0 B B B B D D B B
0 0 0 0 B B 0 0
0 0 0 B B 0 0
0 0 B B 0 0
0 B B 0 0
0 0 b b
0 b b
0 0
podlagi tega za možna nadaljevanja izračunamo različne uteži. Dalǰsi vzorci
in vzorci, ki se s skladbo ujemajo proti koncu izseka ter imajo posledično
med posameznimi toni manj “lukenj”, dobijo večjo utež (tabela 3.3).
Uteži izračunamo po formuli:
U =Vlen
Slen + 1
pri čemer Vlen pomeni število tonov v vzorcu, Slen pa dolžino celotnega se-
gmenta z upoštevanjem ugibanega tona (gl. tabelo 3.3). Z nadaljnjim
povečanjem Slen za 1 zagotovimo vǐsjo utež za dalǰse vzorce, saj je tako
najvǐsja možna utež za vzorec dolžine n enaka nn+1 .
Tako bi npr. 32-tonski vzorec, ki bi se popolnoma ujemal z zadnjimi 32
toni (31 + 1 zadnjim, ugibanim tonom), dobil večjo utež (3233 = 0, 97), 4-tonski
vzorec, ki se ujema z zadnjimi 4 toni pa manǰso (45 = 0, 80). 4-tonski vzorec,
katerega prvi ton se ujema s prvim tonom skladbe, bi dobil zelo majhno utež
20 Špela Medvešek
(npr. 421 = 0, 19, če bi bila skladba dolga 19 tonov).
Tabela 3.3: Postopek iskanja vzorcev in določanja uteži.
Mesto 13 12 11 10 9 8 7 6 5 4 3 2 1 Utež
Midi 60 60 60 60 62 62 62 62 64 64 62 62 ?
Izsek 0 0 0 0 B B B B D D B B * 4/(13+1)
Vzorec 1 0 0 B E = 0,29
Izsek 0 B B B B D D B B * 8/(10+1)
Vzorec 2 0 B B B D D B b = 0,73
Izsek 0 0 b b * 4/(5+1)
Vzorec 3 0 b b 0 = 0,67
V izseku skladbe Kuža pazi (tabela 3.3) je vzorec 1 primer vzorca s nizko
utežjo: 414 = 0, 29. Noben izmed predstavljenih vzorcev se ne ujema popol-
noma, vrednosti nn+1 pa se že nekoliko bolj približata vzorca 2 in 3 z utežema811 = 0, 73 in
46 = 0, 67.
Nazadnje seštejemo vse uteži vzorcev za posamezni možni odgovor.
Poglavje 4
Raziskava A:
Indeks glasbene sofistikacije
V raziskavi B (poglavji 5 in 6), ki smo jo izvedli v okviru pričujoče naloge,
smo želeli oceniti glasbeno predznanje udeležencev. Zato smo se odločili iz-
vesti predhodno raziskavo, v nalogi označeno kot raziskava A, v kateri smo
uporabili Goldsmithsov indeks glasbene sofistikacije (Gold-MSI), samooce-
njevalni vprašalnik, ki kvantificira različne vidike glasbenega udejstvovanja.
Za potrebe magistrske naloge smo ga prevedli v slovenščino in skraǰsali, kot
je opisano v tem poglavju.
4.1 Adaptacija vprašalnika za nov kulturni
prostor
Zaradi raznolikosti kultur po svetu ni dovolj, da vprašalnik le prevedemo,
ampak je potrebno podrobno preveriti njegovo veljavnost (validity) ob adap-
taciji v drugo kulturno okolje [64]. Medkulturne razlike lahko vplivajo na
veljavnost reševanja nekega vprašalnika v primeru nematernih govorcev npr.
angleščine, četudi imajo dobro znanje jezika [4], do razhajanj glede veljav-
nosti pa lahko pride celo pri uporabi istega vprašalnika pri dveh kulturah z
istim maternim jezikom, a povsem različnima kulturama (npr. ZDA in Nova
21
22 Špela Medvešek
Zelandija) [5]. Za priredbo instrumenta (vprašalnika) za novo kulturno oko-
lje sta torej poleg prevoda obvezna tudi adaptacija in ocena veljavnosti ter
zanesljivosti (ponovljivosti in notranje konsistentnosti) [2].
Proces transkulturne adaptacije obsega izdelavo instrumenta, ki je se-
mantično, konceptualno, vsebinsko, tehnično in kriterijsko ekvivalenten iz-
vornemu [64], a jezikovno in kulturno prilagojen ciljnemu kontekstu. Tako
prilagojen instrument omogoča primerjavo rezultatov, pridobljenih v različ-
nih kulturah [2].
Kljub temu da takšna validacija vzame veliko časa, je potrebna za zago-
tavljanje popolnega jezikovnega ekvivalenta samoocenjevalnih instrumentov.
Po Sousu in Rojjanasrirat [64] so priporočeni koraki za adaptacijo instru-
menta naslednji:
1. Prevod instrumenta s strani dveh med seboj neodvisnih prevajalcev
(oz. ekip prevajalcev), od katerih je eden izvedenec na področju, s
katerim se ukvarja raziskava, drugi pa ima dobro poznavanje kulturnih
in jezikovnih nians ciljnega jezika, vendar ni izvedenec na zadevnem
področju;
2. Oba prevoda pregleda tretji dvojezični, še raje pa dvokulturni, prevaja-
lec ter izpostavi dvoumja in neujemanja med obema prevodoma. Nato
se v soglasju z vsemi tremi prevajalci in člani raziskovalne ekipe ustvari
preliminarno začetno prevedeno verzijo instrumenta v ciljnem jeziku;
3. Dva prevajalca, ki v projektu še nista sodelovala in ki sta po karakte-
ristikah enaka kot prevajalca iz prve točke, opravita vzvratni prevod
(angl. back-translation) v izvorni jezik brez poznavanja izvornega be-
sedila. Ta korak služi preverjanju ter razjasnitvi besedǐsča in stavčnih
struktur, uporabljenih v prevodu v ciljni jezik;
4. Ponovno se pregleda odstopanja med prevodi ter napravi predzadnjo
verzijo instrumenta v ciljnem jeziku. V kolikor se ekipa o odstopanjih
ne strinja, je potrebno ponoviti vse 4 korake bodisi za celotni vprašalnik
bodisi za točke nestrinjanja.
Magistrska naloga 23
S prvimi štirimi točkami se zagotovi konceptualno, semantično in vsebinsko
ekvivalentnost instrumenta v ciljnem jeziku s tistim v izvornem jeziku. Ko je
ugodeno vsem štirim korakom, je instrument pripravljen za pilotsko testiranje
[64]:
5. 10–40 posameznikov (naravnih govorcev ciljnega jezika) oceni jasnost
navodil, vprašanj in formata odgovor, priporočljivo pa je, da enako
stori tudi odbor 6–10 strokovnjakov. Za vsako točko je potrebno vsaj
80-odstotno strinjanje v vsaki izmed obeh skupin;
6. Dvojezični posamezniki najprej rešijo vprašalnik v ciljnem, nato pa še
izvornem jeziku (vendar z drugačnim vrstnim redom vprašanj). Na
podlagi primerjave odgovorov se sklepa o kriterijski enakovrednosti;
7. Končno se opravi psihometrično testiranje (splošni dogovor glede po-
trebnega števila subjektov je približno število vprašanj × 10) z uporaboanalize merilne lestvice in odgovorov, Pearsonove korelacijske analize
ter eksploratorne in konfirmatorne faktorske analize. Namen tega ko-
raka je prečistiti vprašalnik, tako da bo končni instrument ustrezal
minimalnim zahtevam za zanesljivost (reliability), homogenost in ve-
ljavnost (validity) ter da bo imel stabilno faktorsko strukturo.
Notranjo konsistentnost instrumenta lahko preverimo z izračunom Cronba-
chovega koeficienta α (zaželeno je, da znaša njegova vrednost ≥ 0,70); pono-vljivost testiranja merimo z Wilcoxonovim neparametričnim testom, korela-
cijskimi koeficienti ali parnim t-testom [2, 4, 32].
Veljavnost najprej preverjamo z vzvratnim prevodom, pregledom litera-
ture, kritično obravnavo in opiranjem na izvedenska mnenja. Nato opravimo
faktorsko analizo in instrument s pomočjo korelacijskih koeficientov (npr.
Spearmanov ρ, Pearsonov r) primerjamo z izvornim ali drugimi podobnimi
instrumenti [2, 32].
Najpogosteǰsi statistični analizi, ki se uporabljata za validacijo prevo-
dov instrumentov, sta eksploratorna in konfirmatorna faktorska analiza [2].
24 Špela Medvešek
S konfirmatorno faktorsko analizo (CFA) preverjamo, ali podatki odražajo
strukturo izvornega instrumenta, s pomočjo eksploratorne faktorske analize
(EFA) pa lahko iz velikega seta vprašanj izluščimo, katere dimenzije instru-
menta so pomembne za definiranje modela ali teorije oz. kaj adaptirani in-
strument sploh meri [2]. Eksploratorna analiza se načeloma uporablja, kadar
konfirmatorna ne pokaže ustreznega prileganja strukture izvornega instru-
menta podatkom, zbranim s priredbo.
4.2 Validacija vprašalnika Gold-MSI (CFA)
Vprašalnik Gold-MSI obsega 38 vprašanj o glasbenem udejstvovanju in iz-
obraženosti (gl. dodatek A). Prvih 31 vprašanj je subjektivnih in ima od-
govore v obliki lestvice Likertovega tipa (1–7, pri čemer pomeni 1 “sploh se
ne strinjam”, 7 pa “popolnoma se strinjam”), zadnjih 7 pa je bolj objek-
tivnih vprašanj o trajanju glasbenega izobraževanja, številu inštrumentov,
ki jih posameznik igra, itd. (odgovori na vsako vprašanje so razdeljeni v 7
neintervalnih ordinalnih kategorij).
Vprašalnik smo z večkratnim preverjanjem kakovosti prevedli v sloven-
ščino. Dva prevajalca sta vprašalnik neodvisno prevedla, tretja prevajalka
pa je prevoda pregledala. Oba pregledana prevoda smo združili v prvo slo-
vensko verzijo. To verzijo je četrta neodvisna prevajalka prevedla nazaj v
angleščino (back-translation), nazadnje pa smo primerjali vzvratni prevod
z izvornim angleškim besedilom ter z ustreznimi spremembami prve verzije
ustvarili končni slovenski prevod.
V okolju CodeIgniter 3.1.7 smo ustvarili spletno stran z vprašalnikom
Gold-MSI v slovenščini ter štirimi kratkimi demografskimi vprašanji (spol,
starost, izobrazba, status). Podatke smo obdelali v orodju za statistično
analizo R 3.4.0.
Opravili smo konfirmatorno faktorsko analizo, da bi ugotovili, ali preve-
deni vprašalnik odraža psihometrično strukturo originalnega, nato pa smo se
odločili še za eksploratorno faktorsko analizo, saj smo hoteli vprašalnik čim
Magistrska naloga 25
bolj skraǰsati.
4.2.1 Udeleženci
Vprašalnik je v celoti rešilo 231 ljudi (79 moških, 152 žensk). Udeleženci so
bili povečini študentje (136) in zaposleni (75), stari med 16 in 58 let (M =
26,7, SD = 7,3). Skoraj vsi udeleženci (96,5 %) so imeli vǐsjo izobrazbo od
srednješolske: 83 jih je imelo šesto stopnjo izobrazbe, 86 sedmo in 54 osmo.
Velika večina udeležencev je imela vsaj nekaj let glasbene izobrazbe. Glas-
bene šole ni nikoli obiskovalo 66 udeležencev (28,6 %), kar 139 (60,2 %) pa
se jih je vsaj tri leta formalno učilo igranja inštrumenta oz. petja (od tega
44 udeležencev deset let ali več). Tretjina udeležencev (75) se ni nikoli iz-
obraževala o glasbeni teoriji, 128 (55,4 %) pa se jih je na tem področju
izobraževalo tri leta ali več (od tega 41 udeležencev več kot šest let). Le 38
udeležencev (16 %) je bilo popolnih neglasbenikov – nikoli se niso glasbeno
izobraževali in vadili inštrumentov niti se niso sami naučili igrati nobenega
inštrumenta niti ne obvladajo petja.
Največ udeležencev je odgovorilo, da najbolj obvladajo petje (47), temu
so sledili klavir (43), kitara (33), prečna flavta (15) in violina (11). Ostali
inštrumenti so imeli frekvenco 3 ali manj, 65 udeležencev (28,1 %) pa ni
obvladalo nobenega inštrumenta oz. petja.
4.2.2 Konfirmatorna analiza
Najprej smo preverili ponovljivost testiranja instrumenta. Pregledali smo
7 parametrov (povprečne vrednosti, tri mere razpršenosti – SD, najvǐsje in
najnižje vrednosti – ter tri mere zanesljivosti – Cronbachovo α, McDonal-
dovo ω in Guttmanovo λ6) za pet faktorjev, o katerih poročajo Müllensiefen,
Gingras, Musil in Stewart [43]:
– aktivno udejstvovanje (active engagement – A),
– zaznavne sposobnosti (perceptual abilities – P),
26 Špela Medvešek
– glasbena izobrazba (musical training – M),
– pevske sposobnosti (singing abilities – S),
– čustva (emotions – E).
Vsaka izmed 38 postavk iz vprašalnika spada v eno izmed teh petih kategorij
(A: obsega 9 postavk, P: 9, M: 7, S: 7, E: 6). Obravnavali smo tudi splošni
faktor glasbene sofistikacije (General sophistication – GEN), ki obsega 18
izmed teh 38 postavk [43].
V tabeli 4.1 so predstavljene različne vrednosti, pridobljene v originalni
raziskavi ([43], oznaka “EN” v tabeli), ter vrednosti, pridobljene v raziskavi
A (oznaka “SL” v tabeli). Mere zanesljivosti kažejo na dobro notranjo kon-
sistentnost pri vseh faktorjih, tako za originalni instrument v angleščini kot
za slovensko različico.
Tabela 4.1: Primerjava povprečnih vrednosti, razpršenosti in mer zaneslji-
vosti med originalno in našo raziskavo za 5 faktorjev in splošni faktor glasbene
sofistikacije (n = 147.633 (EN); n = 231 (SL)).
Aktivno Zaznavne Glasbena Pevske Čustva Splošna
udejstvovanje sposobnosti izobrazba sposobnosti sofistikacija
(A) (P) (M) (S) (E) (GEN)
EN SL EN SL EN SL EN SL EN SL EN SL
M 41,52 37,67 50,20 50,85 26,52 28,65 31,67 32,22 34,66 34,77 81,58 82,16
SD 10,36 11,69 7,86 9,67 11,44 12,20 8,72 10,18 5,04 5,83 20,62 23,93
Max 63 62 63 63 49 48 49 49 42 42 126 124
Min 9 9 9 22 7 7 7 8 6 14 18 22
α 0,87 0,87 0,87 0,88 0,90 0,92 0,87 0,88 0,79 0,76 0,93 0,94
ω 0,87 0,88 0,87 0,89 0,90 0,92 0,87 0,88 0,79 0,77 0,93 0,94
λ6 0,86 0,87 0,87 0,88 0,91 0,93 0,87 0,88 0,77 0,74 0,94 0,96
Opombe: EN: originalna raziskava; SL: raziskava A.
Ponovljivost testiranja smo preverili z enosmernim t-testom, s katerim smo
rezultate Slovencev pri vseh šestih faktorjih primerjali s povprečji pri posa-
meznem faktorju, ki jih poročajo avtorji v originalni raziskavi. Vrednosti se
Magistrska naloga 27
pri večini faktorjev niso razlikovale statistično značilno (p > 0,05), izjema je
bil le faktor Aktivno udejstvovanje (tabela 4.2). Razlogi za to so lahko na
primer dejanska razlika med vzorcema ali razlike v interpretaciji vrednosti
na uporabljeni odgovorni lestvici.
Tabela 4.2: Rezultati enosmernega t-testa za povprečne rezultate pri po-
sameznem faktorju.
Faktor t(230) p d
Aktivno udejstvovanje –5,01 < 0,001 –0,661
Zaznavne sposobnosti 1,02 0,309 0,135
Glasbena izobrazba 2,65 0,009 0,349
Pevske sposobnosti 0,82 0,415 0,108
Čustva 0,29 0,774 0,038
Splošni faktor 0,37 0,713 0,049
Analiza angleškega in slovenskega vprašalnika je torej pokazala, da sta
instrumenta v veliki meri primerljiva, a smo kljub temu opravili tudi konfir-
matorno analizo slovenskega vprašalnika, saj avtorji prvotnega vprašalnika
poročajo o slabem prileganju enofaktorskemu modelu [43].
Konfirmatorna faktorska analiza enofaktorskega modela slovenskega vpra-
šalnika je pokazala, da se podatki modelu ne prilegajo dobro, χ2 (665) =
2901, p < 0,001; CFI = 1,00; TLI = 1,00; RMSEA = 0,150, 90-% IZ =
[0,146, 0,154]; SRMR = 0,128.
Prileganje je bilo še slabše pri 5-faktorskem (isti faktorji kot v originalni
raziskavi) modelu (χ2 (655) = 9690, p < 0,001; CFI = 0,328; TLI = 0,278;
RMSEA = 0,244, 90-% IZ = [0,240, 0,249]; SRMR = 0,085), kar je bil eden
izmed razlogov, zakaj smo morali vprašalnik rekonstruirati.
28 Špela Medvešek
4.3 Adaptacija vprašalnika Gold-MSI (EFA)
Cilj eksploratorne analize je bil zmanǰsati število vprašanj, ki bi nam vseeno
dala zadostne informacije o glasbeni sofistikaciji udeležencev. Ker je bila
eksperimentalna naloga v raziskavi B dokaj dolga, smo želeli vprašalnik Gold-
MSI občutno skraǰsati.
Izločili smo en splošni faktor z lastno vrednostjo 13,1. Nato smo izbrali
postavke z absolutnimi nasičenostmi, večjimi od 0,70; vprašalnik smo tako
skraǰsali na osem postavk (za 79 %).
Na podlagi teh osmih postavk smo ustvarili nov indeks glasbene sofistika-
cije (tabela 4.3), ki dobro sovpada s splošnim indeksom splošne sofistikacije
Gold-MSI (r = 0,95). Korelacijo smo izračunali na podlagi števila točk oz.
faktorskega dosežka, ki smo ga pridobili s seštevanjem uteženih vrednosti
odgovorov pri posameznih postavkah (število točk za posameznikov indeks
glasbene sofistikacije je bil seštevek uteženih odgovorov na postavke št. 5, 7,
10, 12, 19, 22, 27 in 32; po enakem postopku smo izračunali tudi rezultat pri
indeksu Gold-MSI).
Tabela 4.3: Izbor postavk z najvǐsjimi absolutnimi nasičenostmi.
Absolutna
Št. Postavka nasičenost
5 Dobro znam presoditi, ali je nekdo dober ali slab pevec. 0,734
7 Na pamet lahko pojem ali igram skladbe. 0,753
10 Ob spremljavi glasbenega posnetka sem sposoben zapeti prave note. 0,794
12 Zmožen sem primerjati in razpravljati o razlikah med dvema0,795
izvedbama ali različicama iste pesmi.
19 Zmožen sem prepoznati posebnosti poslušane skladbe. 0,802
22 Opazim, kadar nekdo poje ali igra napačne tone. 0,724
27 Ne bi rekel, da sem glasbenik. 0,746
32 Koliko časa ste redno, dnevno vadili glasbeni inštrument? 0,777
Novi indeks glasbene sofistikacije z osmimi postavkami smo vključili v
raziskavo B. Odgovori na prvih 7 postavk iz tabele 4.3 so bili v raziskavi B
Magistrska naloga 29
del lestvice Likertovega tipa (kot v originalnem vprašalniku). Pri zadnjem
pa smo od udeležencev zahtevali, da sami vnesejo število let (med 0 in svojo
starostjo) redne vadbe inštrumenta oz. petja, vendar smo za končni izračun
rezultata MSI v raziskavi B intervalne odgovore pretvorili nazaj v njihove
ordinalne ustreznice, uporabljene v originalnem vprašalniku [43].
Poglavje 5
Raziskava B:
Glasbeno pričakovanje
5.1 Materiali
Eksperiment je bil sestavljen iz dveh blokov, kitajskega in evropskega, za
katera smo poiskali ustrezne glasbene zbirke, znotraj njih našli primerne
skladbe ter jih ustrezno skraǰsali. Kitajski glasbeni izseki, ki smo jih z dovo-
ljenjem avtorjev uporabili, so del glasbene baze, uporabljene v študiji zazna-
vanja glasbenih fraz [44]. Izseki evropske glasbe so iz prosto dostopne spletne
zbirke Robokopp1, ki vsebuje ljudske in vojne pesmi ter himne iz nemških
in angleških govornih okolij. Da bi prǐslo do čim manj razlik v glasbenem
slogu, smo se omejili le na nemške pesmi.
Za vsak del (evropski, kitajski) smo sprva naključno izbrali po 30 ne-
polifoničnih glasbenih odlomkov. Vsako skladbo v zapisu MIDI smo najprej
pretvorili v notni zapis z uporabo programov Midi Sheet Music in MuseScore
2 ter jo nato ponovno izvozili v formatu MIDI. Za ponovno izdelavo MIDI-jev
smo se odločili, ker so bile evropske in kitajske skladbe iz različnih virov in
je med njimi prihajalo do razlik v barvi zvoka in odmevu, prav tako pa je bil
natančen notni zapis uporaben za nadaljnjo statistično obravnavo skladb.
1http://www.musicanet.org/robokopp/Volksong.html, 15. 2. 2018
30
Magistrska naloga 31
Skladbe so bile prvotno dokaj dolge, v povprečju 18,7 sekunde oz. pri-
bližno 8 taktov. Da bi bila naloga bolj prijazna do udeležencev, smo jih
skraǰsali na posamezne fraze znotraj skladb. Na sliki 5.1a je primer prvotne
skladbe, njena skraǰsana različica, uporabljena v eksperimentalni nalogi, pa
je na sliki 5.1b.
Skladbe smo kraǰsali na dva načina: nekatere smo odrezali po predza-
dnjem tonu fraze (udeleženci so torej morali napovedati zadnji ton fraze),
nekatere pa na naključnem mestu sredi fraze. Tako imenovane zaključene
(sliki 5.1b in 5.1d) in nezaključene izseke (sliki 5.1c in 5.1e) smo vključili v
razmerju 3 : 1 (75 % zaključenih, 25 % nezaključenih).
(a) primer kitajske skladbe
(b) kitajski izsek; zaključen (odlomek 1)
(c) kitajski izsek, nezaključen (odlomek 2)
(d) nemški izsek, zaključen (odlomek 3)
(e) nemški izsek, nezaključen (odlomek 4)
Slika 5.1: Primeri uporabljenih izsekov.
32 Špela Medvešek
Na podlagi treh kriterijev – (1) število tonov, (2) največji interval, ki se
pojavi v skladbi, in (3) razpon – smo za vsako kulturo izbrali po 20 odlom-
kov, ki smo jih vključili v eksperimentalno nalogo. Da bi zagotovili čim bolj
podobno strukturo glasbenih dogodkov, so bili izbrani odlomki znotraj okvi-
rov M ± 2 SD za vsakega izmed treh kriterijev. Na koncu smo iz preostankaprimernih skladb izbrali časovno kraǰse odlomke.
V tabeli 5.1 se nahajajo vrednosti omenjenih treh kriterijev za primer
glasbenih odlomkov 1–4 (slika 5.1b–e).
Tabela 5.1: Vrednosti kriterijev 1–3 za štiri glasbene odlomke.
OdlomekŠtevilo Največji Razpon
tonov interval [polton]
1 (kitajski zaključen) 13 VIII (oktava) 12
2 (kitajski nezaključen) 17 VI (seksta) 17
3 (evropski zaključen) 13 IV (kvarta) 14
4 (evropski nezaključen) 12 IV (kvarta) 17
Z enosmerno ANOVO smo med seboj primerjali glasbene odlomke obeh
kultur. Skupini se v nobenem izmed prej omenjenih kriterijev nista stati-
stično pomembno razlikovali (tabela 5.2).
Glasbeni odlomki so imeli v povprečju skoraj 15 tonov (kitajski: M =
15,6, SD = 3,3; nemški: M = 13,9, SD = 4,3). Kitajske skladbe v izboru so
imele med 10 in 22 tonov, nemške pa med 7 in 24.
V povprečju je bil največji interval v odlomkih obeh kultur seksta. Med
kitajskimi skladbami je bila najmanǰsa vrednost terca in največja oktava,
med nemškimi pa najmanǰsa kvarta ter največja decima.
Skupini sta se po razponu skladb minimalno razlikovali. Povprečni razpon
skladb je bila oktava oz. 12 poltonov (kitajske: M = 12,4, SD = 3,8; nemške:
M = 11,6, SD = 2,8). Kitajske skladbe so imele razpon med 5 (kvarta) in 20
poltonov (tercdecima), nemške pa med 7 (kvinta) in 17 poltonov (undecima).
Povprečno so skladbe trajale 6,9 sekunde (kitajske: M = 7,3, SD = 1,7;
Magistrska naloga 33
nemške: M = 6,6, SD = 2,2). Kitajske skladbe so bile dolge med 5 in 11
sekund, nemške pa med 3 in 11 sekund.
Tabela 5.2: Rezultati enosmerne ANOVE za primerjanje kriterija v skupini
evropskih in skupini kitajskih odlomkov.
Kriterij MS F(1, 38) p ω2
število tonov 28,9 1,88 0,179 0,021
največji interval 0,1 0,04 0,845 –0,025
razpon [polton] 6,4 0,54 0,469 –0,012
trajanje [s] 4,2 1,04 0,315 0,001
Opomba. Moč testa: 1 − β = 0,11 pri vrednosti α = 0,05.
5.2 Postopek
Spletno stran z vprašalnikom smo izdelali v MVC-okolju CodeIgniter 3.1.7, ki
je zasnovano na programskem jeziku PHP. Vprašalnik je bil sestavljen iz štirih
delov: prvi del je obsegal demografska vprašanja, skraǰsani vprašalnik Gold-
MSI in vprašanji o glasbenih preferencah ter pogostosti poslušanja kitajske
glasbe. Drugi del se je pričel z navodili za eksperimentalni del, nato pa so
bili udeleženci preusmerjeni na uporabnǐski vmesnik (slika 5.2), ki so ga se
najprej naučili uporabljati na treh poskusnih primerih.
Naloga udeležencev je bila poslušati kratek glasbeni izsek, nato s pomočjo
tonskega drsnika ali gumbov izbrati ton, ki bi bil po njihovem mnenju naj-
bolǰse nadaljevanje poslušanega izseka, in po potrebi ponovno poslušati izsek
z dodanim tonom. Na koncu so morali označiti še, ali skladbo prepoznajo
ali ne. Za poskusne primere smo izbrali skladbe, ki bi jih poznali praktično
vsi udeleženci (pri slovenskem vprašalniku so bile to Kuža pazi, Zdravljica in
Vse najbolǰse za te, pri angleškem pa otroška pesem Twinkle, Twinkle, Little
Star, Beethovnova skladba Für Elise in Vse najbolǰse za te) in jim zelo ver-
jetno znali določiti nadaljevanja. Pravilnost odgovorov na poskusnem delu
34 Špela Medvešek
Slika 5.2: Uporabnǐski vmesnik za eksperimentalno nalogo.
je med drugim vplivala na pozneǰso razvrstitev v skupini glasbenikov in ne-
glasbenikov (gl. poglavje 5.3.2).
Tako med poskusnim kot eksperimentalnim delom so s pritiskom na gumb
(?) lahko kadarkoli ponovno prikazali navodila.
Po končanem poskusnem delu se je pričel eksperimentalni del, sestavljen
iz evropskega in kitajskega bloka. Vsak del je obsegal po 20 manj poznanih
glasbenih izsekov, ki jim je bilo treba določiti nadaljevanje. Vrstni red blokov
se je izmenjeval (polovica udeležencev je torej najprej reševala evropski in
nato kitajski blok, polovica pa obratno).
Vprašalnik smo distribuirali preko elektronske pošte in družabnih omrežij
ter povezavo objavili tudi na spletni strani Oddelka za psihologijo Filozofske
fakultete.
5.3 Udeleženci
Vprašalnik je v celoti rešilo 57 udeležencev (26 moških, 31 žensk), starih med
16 in 54 let (M = 26,7, SD = 7,5). Večina udeležencev (59,6 %) je imela
Magistrska naloga 35
vǐsjo izobrazbo od srednješolske: 14 jih je imelo šesto stopnjo, 16 sedmo in
10 osmo.
Velika večina udeležencev je vsaj nekaj let redno vadila glasbeni inštru-
ment oziroma petje. Le deseterica (17,5 %) je odgovorila, da niso nikoli vadili
inštrumentov; v povprečju so udeleženci redno vadili 6,8 let (SD = 6,5). Kar
19 udeležencev (33,3 %) je inštrument vadilo 10 let ali več (max : 25 let),
skoraj tri četrtine (73,7 %) pa vsaj 3 leta.
Najbolj priljubljene zvrsti so bile klasična glasba (13 udeležencev uvrstilo
na prvo mesto, 5 na drugo in 15 na tretje), rock (16, 6, 4) in pop (6, 9, 5).
Udeleženci v veliki meri ne poslušajo kitajske glasbe: 39 (68 %) je ne posluša
nikoli, 13 občasno (nekajkrat na leto), le 2 nekajkrat na mesec in 3 praktično
vsak dan.
5.3.1 Indeks glasbene sofistikacije
Del demografskega vprašalnika je predstavljal skraǰsani vprašalnik Gold-MSI,
predstavljen v raziskavi A (poglavje 4.3).
Udeleženci so poročali o visoki glasbeni sofistikaciji, kar pravzaprav ni
presenetljivo, saj je večina vsaj 3 leta redno vadila glasbeni inštrument ozi-
roma petje. Povprečen rezultat je bil 42,2 točk od 56 možnih (SD = 7,7).
S pomočjo rezultatov skraǰsane lestvice Gold-MSI smo med drugim določali
razporeditev udeležencev v skupine glasbenikov in neglasbenikov.
5.3.2 Skupine
Ker je bilo v vzorcu veliko glasbenikov, smo se odločili za razporeditev v
večjo skupino glasbenikov in manǰso skupino neglasbenikov.
Upoštevali smo dva kriterija: indeks glasbene sofistikacije in odgovore
na preizkusnem delu vprašalnika. Za MSI smo mejo določili pri rezultatu
40, ki bi ga udeleženec dobil, če bi pri vsaki postavki (v povprečju) označil
vrednost 5. Med neglasbenike so bili torej umeščeni tisti, ki so imeli rezultat
MSI do vključno 39 (16 udeležencev). Nadalje smo v to skupino uvrstili tudi
36 Špela Medvešek
vse udeležence, ki na preizkusnem delu vprašalnika (tri znane pesmi) niso
pravilno rešili vseh primerov. Upoštevali smo tudi odgovor na vprašanje,
ali poslušano skladbo poznajo, zaradi česar je en udeleženec “napredoval” iz
skupine neglasbenikov v skupino glasbenikov. Vsaj eno napako je storilo 14
udeležencev. Po združenju obeh kriterijev je bilo v skupini neglasbenikov 21
udeležencev (9 moških, 12 žensk, MSI: M = 34,4, SD = 6,8; leta glasbenega
izobraževanja: M = 1,8, SD = 2,2).
Preostalih 36 udeležencev smo razvrstili v skupino glasbenikov (17 moš-
kih, 19 žensk, MSI: M = 46,8, SD = 3,3; leta glasbenega izobraževanja: M
= 9,6, SD = 6,3).
5.4 Pridobivanje odgovorov CHM
Uporabili smo evropsko in kitajsko učno množico, ki sta obsegali približno
14.000 tonov, iz glasbene zbirke Essen2. Za obdelavo z modelom CHM smo
podatke v množicah uredili, kot je opisano v poglavju 3.2.2.
Rezultati, pridobljeni z evropsko in kitajsko učno množico na podlagi vsot
uteži, so bili zelo razpršeni (od –22 do +21 poltonov od izhodǐsča). Za začetek
smo se omejili le na razpon, kakršnega so imeli na voljo udeleženci (± 12poltonov), nazadnje pa smo se na podlagi razpršenosti odgovorov evropskih
udeležencev (slika 6.3 v poglavju 6.1.1) in porazdelitve intervalov v skladbah,
ki so bile del eksperimenta, omejili le na tone, ki so od izhodǐsča oddaljeni
največ za kvarto (IV) oz. 5 poltonov.
Kot najbolǰsi odgovor smo smatrali odgovor z najvǐsjo vsoto uteži in
tako pridobili odgovore CHM za vseh 40 glasbenih izsekov. Rezultati so
predstavljeni v poglavju 6.
2 Dostop: http://kern.ccarh.org/browse, 22. 6. 2018
Poglavje 6
Raziskava B:
Rezultati
V nalogi smo želeli preučiti, kako uspešen je kompozicionalni hierarhični
model v primerjavi z ljudmi pri nalogi glasbenega pričakovanja ter kako na
uspešnost vpliva predhodno poznavanje glasbene kulture oziroma specifična
učna množica. Eksperiment smo izvedli na dveh različnih zvrsteh glasbe:
evropski in kitajski ljudski glasbi.
V tabeli 6.1 so predstavljeni rezultati evropskih udeležencev, modela
CHM, naučenega na evropski in kitajski učni množici, ter razširjenega Nar-
mourjevega modela implikacije–realizacije. V naslednjih poglavjih podrob-
neje primerjamo rezultate znotraj različnih skupin.
Najprej bomo predstavili rezultate udeležencev z evropskim (slovenskim)
kulturnim ozadjem. Nato bomo analizirali delovanje modela CHM, naučene-
ga na evropski in kitajski učni množici, ter predstavili rezultate popravljenega
modela implikacije–realizacije. Rezultate bomo povezali s teorijo tonskih hie-
rarhij in povzeli, ali seznanjenost s tujo glasbeno kulturo vpliva na uspešnost
pri reševanju ter kako na uspešnost modela vpliva velikost učne množice.
Nazadnje bomo na kratko povzeli še pilotsko študijo istega eksperimenta s
kitajskimi udeleženci.
37
38 Špela Medvešek
Tabela 6.1: Povprečna uspešnost udeležencev z evropskim kulturnim ozad-
jem in uspešnost CHM, naučenega na evropskih (CHM–eu) in kitajskih
(CHM–cn) vzorcih.
Evropske skladbe Kitajske skladbe
vse zaključene nezaključ. vse zaključene nezaključ.
Vsi udeleženci 58 % 63 % 42 % 34 % 34 % 35 %
Glasbeniki 68 % 74 % 47 % 39 % 37 % 44 %
Neglasbeniki 41 % 43 % 33 % 25 % 27 % 21 %
CHM–eu 60 % 73 % 20 % 30 % 33 % 20 %
CHM–cn 45 % 53 % 20 % 30 % 40 % 0 %
Narmour 50 % 60 % 20 % 35 % 25 % 40 %
Kot pravilna nadaljevanja izsekov smo upoštevali le tista, ki so dejanska
nadaljevanja skladbe. V primeru odlomka 1 (slika 5.1b na strani 31) je torej
pravilni odgovor –2, tj. premik za dva poltona navzdol, kar je tudi dejansko
nadaljevanje odlomka 1 (s slike 5.1a je razvidno nadaljevanje odlomka 1)1.
Udeleženci
V tem izseku se sklicujemo na tabelo 6.2, v kateri se nahajajo vrednosti
Wilcoxonega testa enakovrednih parov in Wilcoxonovega testa vsote rangov
za različne kombinacije skupin udeležencev, glasbenih slogov ter primerjavo
obeh vrst izsekov.
Evropski udeleženci so v povprečju pravilno rešili 58 % evropskih in 34 %
kitajskih izsekov. Razlika med obema blokoma je bila statistično pomembna,
tako v skupini glasbenikov kot neglasbenikov.
Glasbeniki so bili bolj uspešni od neglasbenikov tako pri reševanju evrop-
skega kot tudi kitajskega bloka. Razlike med skupinama glasbenikov in ne-
glasbenikov so bile pri glasbi obeh kultur statistično značilne.
1 V podpoglavju “Analiza tonskih hierarhij” za pravilnost odgovorov uporabljamo
drugačen kriterij, ki je razložen na začetku poglavja 6.1.
Magistrska naloga 39
Tabela 6.2: Rezultati Wilcoxonovega testa enakovrednih parov (V ) in Wil-
coxonovega testa vsote rangov (W ).
Udeleženci Glasba Dodatni kriterij W V p
GlasbenikiEvropska : kitajska
3 < 0,001
Neglasbeniki 29 0,005
Glasbeniki : neglasbenikiEvropska 134 < 0,001
Kitajska 152 < 0,001
GlasbenikiEvropska
Zaključeni :
nezaključeni
izseki
129 < 0,001
Kitajska 476 0,050
NeglasbenikiEvropska 180 0,305
Kitajska 147,5 0,234
Pri evropskih izsekih so bili udeleženci bolj uspešni pri reševanju za-
ključenih kot nezaključenih izsekov, pri kitajskem delu pa so bolje reševali
nezaključene izseke. Glasbeniki so statistično pomembno bolje odgovarjali
za zaključene kot nezaključene izseke, tako pri evropskem kot tudi kitajskem
bloku (pri slednjem je bila razlika na meji statistično signifikantne). Pri
neglasbenikih so bile razlike manǰse.
Glede na to, da so zaključki fraz najbolj predvidljivi deli skladb (gl. po-
glavje 2.3), smo pričakovali, da bodo udeleženci (in tudi CHM) uspešneǰsi
pri reševanju zaključenih kot nezaključenih izsekov. Hipotezo smo potrdili
za skupino glasbenikov, nekoliko bolje pa so se razlike manifestirale ob po-
slušanju glasbe lastne kot tuje kulture.
Presenetilo nas je, da so neglasbeniki pri reševanju kitajskega bloka naj-
bolje odgovarjali za nezaključeni izsek cn16 (57-odstotna uspešnost), vendar
je razlog za to najverjetneje ta, da je šlo v zadnjem delu izseka za ponovitev
melodije s prvega dela izseka, zaradi česar so pravilni ton enkrat že slǐsali
in ga znali poustvariti2. Najslabše so udeleženci odgovarjali za zaključeni
izsek cn5 (skupno 5 % pravilnih odgovorov), in sicer je le 8 % glasbenikov
odgovorilo pravilno, izmed neglasbenikov pa nihče. To je bila edina izmed
vseh 40 skladb, pri kateri je bil pravilni odgovor 0 (obstanek na istem tonu),
2 Notni zapisi vseh eksperimentalnih izsekov se nahaja v prilogi B.
40 Špela Medvešek
kar pa se udeležencem očitno ni zdelo ustrezno.
CHM
CHM, naučen na evropski učni množici (CHM–eu), je pravilno nadaljeval 60
% evropskih izsekov in 30 % kitajskih. V evropskem bloku je pravilno odgo-
voril za kar 73 % zaključenih izsekov, vendar le enega nezaključenega (tj. 20
%). Pri kitajskem delu je bila porazdelitev bolj enakomerna: pravilno je rešil
33 % zaključenih in prav tako kot v evropskem bloku le 20 % nezaključenih
izsekov.
CHM, naučen na kitajskih vzorcih (CHM–cn), je bil nekoliko manj uspe-
šen od CHM–eu. Zanimivo je, da je CHM–cn bolje reševal evropski del od
kitajskega, in sicer je pravilno nadaljeval 45 % evropskih izsekov in, enako
kot CHM–eu, le 30 % kitajskih.
CHM, predvsem CHM–eu, se zelo dobro približa uspešnosti udeležencev,
iz česar lahko sklepamo, da je model v nalogi glasbenega pričakovanja primer-
ljiv s povprečno izobraženim glasbenikom (naj rezultati naših udeležencev ne
zavedejo, saj so bili v povprečju relativno visoko glasbeno izobraženi ter so
izkazali visoko stopnjo glasbene sofistikacije).
Narmourjev model implikacije-realizacije
Glede na dejanske odgovore pri evropskem delu eksperimenta smo povzeli tri
preprosta pravila glede ugibanih tonov:
– so visoko na tonski hierarhiji (gl. poglavje 3.1.2),
– če je melodija na zgornji oz. spodnji meji razpona izseka, ugibani ton
spremeni smer melodije,
– so 7 ali manj poltonov oddaljeni od izhodǐsča.
Udeleženci se teh treh pravil dosledno držijo, CHM prvih dveh prav tako,
tretjega pa smo (s strožjo omejitvijo 5 ali manj poltonov oddaljenosti) im-
plementirali z omejitvijo možnih odgovorov, ki jih lahko poda model.
Magistrska naloga 41
Teh pravil se drži tudi razširjeni Narmourjev model implikacije-realizacije
(poglavje 3.1, [65]). Izkazalo se je, da so pravila (nepopravljenega) razširje-
nega Narmourjevega modela prestroga, in posledično se je na naši nalogi
veliko slabše odrezal – pravilno namreč ni rešil niti enega evropskega izseka
in le tri kitajske (15 %). Pri večini skladb nepopravljeni model kot najbolǰsi
odgovor navede 0, kar je z vidika konformnosti s tonsko hierarhijo v skladbi
v večini primerov popolnoma sprejemljiv odgovor, ni pa najbolj verjeten.
Poleg tega daje preveliko težo odgovorom v neposredni bližini izhodǐsča (±nekaj poltonov).
Za potrebe naloge smo uporabili zgolj nabor kriterijev razširjenega mo-
dela implikacije–realizacije, saj se je osnovni model preveč osredotočal na
majhnost realiziranih intervalov oziroma prepogosto preferiral obstanek na
istem tonu. Obdržali smo kriterije melodični povratek, blǐzina, tonalnost, me-
lodična privlačnost in tessitura. Ta nabor kriterijev je podal najbolǰse možne
odgovore za naša eksperimentalna bloka. S tem smo dobili rezultate, primer-
ljive s CHM–eu, in sicer je popravljeni model implikacije–realizacije pravilno
nadaljeval 50 % evropskih in 35 % kitajskih skladb (tabela 6.1).
6.1 Analiza tonskih hierarhij
Zelo težko bi trdili, da je dejansko nadaljevanje izsekov tudi najbolǰse in edino
možno, saj se na istem mestu lahko več različnih tonov “slǐsi dobro”. Zato
smo v tem poglavju za določitev “pravilnih” nadaljevanj izsekov uporabili
drugačen kriterij kot v preǰsnjem. Za vsako evropsko in kitajsko skladbo
smo na podlagi njene tonske hierarhije določili možne odgovore in tako za
vsakega udeleženca izračunali, kako uspešen je bil pri nadaljevanju izseka.
Kot pravilna nadaljevanja skladb smo upoštevali vse tiste tone, ki se pojavijo
v ustrezni tonski hierarhiji oziroma lestvici. Tako je bilo za evropske skladbe
v duru možnih 7 različnih tonov (gl. sliko 6.1b), za molove pa 9 (dodani
zvǐsani 6. in 7. stopnja, ki se pojavljata v harmonični in melodični lestvici).
Za pravilne veljajo ti toni v kateri koli oktavi.
42 Špela Medvešek
(a) Primer evropskega izseka (odlomek 3).
(b) Del možnih odgovorov.
Slika 6.1: Nabor možnih pravilnih odgovorov za zgornji evropski izsek vse-
buje vse tone C-durove lestvice.
Za kitajske skladbe je bilo možnih 5 različnih tonov (gl. sliko 6.2). Kot
pravilni veljajo ti toni v kateri koli oktavi.
(a) Primer kitajskega izseka (odlomek 1).
(b) Del možnih odgovorov.
Slika 6.2: Nabor možnih pravilnih odgovorov za zgornji kitajski izsek vse-
buje vse tone durove pentatonične lestvice z izhodǐsčem v tonu H[.
Pri evropskih izsekih je bilo tako izmed vseh možnih odgovorov po naši poe-
nostavljeni definiciji tonskih hierarhij pravilnih kar 60 % odgovorov (15 tonov
od 25) za skladbe v duru in 68 % (17 od 25) za molove skladbe. Pri kitajskih
Magistrska naloga 43
je bila možnost pravilnega odgovora z ugibanjem nekoliko manǰsa, in sicer
44-odstotna (pravilnih je bilo 11 tonov od 25).
Evropski udeleženci so pravilneje reševali evropski kot kitajski del, in
sicer so bili pri evropskem delu 94,2-odstotno uspešni, pri kitajskem pa 89,7-
odstotno (uspešnost za evropski del – glasbeniki: 97,9 %, neglasbeniki: 87,9
%; kitajski del – glasbeniki: 95,6 %, neglasbeniki: 79,5 %). Primerjali smo
več kriterijev ter ali so med njimi statistično pomembne razlike. Med obema
testnima blokoma (tj. v evropskem v primerjavi s kitajskim) so bile po-
membne razlike znotraj obeh skupin udeležencev. Prav tako so bile po-
membne statistične razlike med glasbeniki in neglasbeniki znotraj posame-
znega testnega bloka. Natančni rezultati testov za preverjanje razlik med
različnimi skupinami so navedeni v tabeli 6.3.
Tabela 6.3: Rezultati Wilcoxonovega testa vsote rangov (primerjava glas-
benikov in neglasbenikov; W ) in Wilcoxonovega testa enakovrednih parov
(primerjava evropske in kitajske glasbe; V ).
Udeleženci Glasba W V p
Glasbeniki : neglasbenikiEvropska 370 0,900
Kitajska 152 < 0,001
GlasbenikiEvropska : kitajska
0 < 0,001
Neglasbeniki 32 < 0,001
Kljub temu da so evropski udeleženci statistično pomembno slabše reševali
kitajski del od evropskega, je bila njihova uspešnost zelo visoka – združena
skupina glasbenikov in neglasbenikov je pri kitajskem bloku dosegla skoraj
90-odstotno uspešnost, glasbeniki pa so bili skoraj popolnoma uspešni. Po-
trdimo lahko torej hipotezo, da se hitro prilagodimo na statistične tendence
glasbe nepoznanega sloga [22, 29, 31], pri tem pa pomembno vlogo igra tudi
glasbena izkušenost oziroma sofistikacija.
Kot je že navedeno, je bila uspešnost evropskih udeležencev 94,2-odstotna
za evropski in 89,7-odstotna za kitajski blok. Model CHM (tako CHM–eu
44 Špela Medvešek
kot CHM–cn) je pravilno nadaljeval prav vse skladbe v evropskem ekspe-
rimentalnem bloku. Tako je bil torej na preizkusu z evropskimi skladbami
100-odstotno uspešen in posledično bolj uspešen od udeležencev.
Pri kitajskem eksperimentalnem bloku je bil CHM–cn prav tako 100-
odstotno uspešen, CHM–eu pa le 80-odstotno. Razlog, zakaj je bil CHM–cn
na evropskem delu popolnoma uspešen, CHM–eu pa na kitajskem delu ni bil,
je najverjetneje, da so vsi toni pentatonične lestvice podmnožica diatonične
lestvice.
6.1.1 Analiza evropskega izseka
V tabeli 6.4 je predstavljena tonska hierarhija odlomka 3 (slika 5.1d, Sli-
ka 6.1a), po teoriji tonskih hierarhij, opisani v poglavju 3.1.2. Tonaliteta
skladbe je C-dur. Toni C-durove lestvice so opremljeni z lestvičnimi sto-
pnjami (stolpec Stopnja). Stolpec Odgovor predstavlja oddaljenost v pol-
tonih od zadnjega slǐsanega tona v poslušanem izseku. Če se je izsek torej
zaključil na tonu E, so morali udeleženci za ton F drsnik premakniti za eno
stopnjo (en polton) navzgor. Tabela vsebuje tudi vsote uteži za odlomek 3,
kakršne je podal CHM.
V tonski hierarhiji imajo najvǐsje vrednosti toni, ki so del lestvice, od
tega največ tonika (I. stopnja, v tem primeru C), sledi dominanta (V. oz.
G), nato dominantna paralela (III. oz. E) in subdominanta (IV. oz. F), še
nekoliko nižje sta tonična paralela (VI. oz. A) in subdominantna paralela
(II. oz. D), najnižje pa vodilni ton (VII. oz. H) in nediatonični toni (brez
označenih stopenj oz. v tem primeru vsi toni z #).
CHM–eu je v skladu s teorijo tonskih hierarhij najvǐsje uteži dal tonom
ustrezne lestvice, z izjemo vodilnega tona (H oz. odgovor -5), ki je dobil zelo
nizko utež, kljub temu da je del C-durove lestvice; vendar, kot smo omenili
že prej, ima VII. stopnja tudi v tonski hierarhiji najnižjo utež.
CHM–cn je očitno našel manj ujemajočih se vzorcev, saj so njegove vsote
uteži veliko manǰse kot pri CHM–eu. Kljub temu je tudi CHM, naučen na
kitajski učni množici, deloma prepoznal tonsko hierarhijo, vendar je mogoče
Magistrska naloga 45
Tabela 6.4: Tonska hierarhija in vsote uteži CHM za odlomek 3. Odebeljeno
je označeno dejansko nadaljevanje skladbe (C/–4) in najbolǰsa odgovora glede
na CHM.
Ton Stopnja Odgovor TonalnostVsota uteži
CHM–eu CHM–cn
H VII. -5 2,88 1,14 -
C I. -4 6,35 14,26 6,89
C# -3 2,23 1,23 0,83
D II. -2 3,48 24,01 8,64
D# -1 2,33 4,40 -
E III. 0 4,38 20,42 4,11
F IV. 1 4,09 16,70 3,85
F# 2 2,52 6,08 0,40
G V. 3 5,19 17,05 10,85
G# 4 2,39 2,88 0,83
A VI. 5 3,66 8,07 2,73
opaziti, da so najvǐsje uteži prejeli odgovori, ki so del tako diatonične (“evrop-
ske”) durove lestvice kot kitajske pentatonične lestvice.
V zgornji tabeli so predstavljeni zgolj toni, ki so od izhodǐsčnega oddaljeni
za 5 poltonov (navzgor ali navzdol), saj so bili to odgovori, ki so jih udeleženci
v veliki večini izbirali tako v našem eksperimentu (96,3 % za evropske in 95,6
% za kitajske skladbe, gl. sliko 6.3) kot tudi v drugih, npr. Carlsen 1981 [8].
Kot je že omenjeno, smo v tem poglavju kot nabor možnih odgovorov iz-
brali zelo poenostavljeno različico zgornje tonske hierarhije. Poenostavljeno
hierarhijo smo uporabili predvsem zato, da bi lahko primerjali rezultate
evropskih in kitajskih izsekov, saj za kitajski tonalni sistem še ne obstaja
podobna validirana hierarhija.
Podrobneje smo analizirali odgovore evropskih udeležencev na evropskem
glasbenem izseku (odlomek 3, slika 5.1d). Preverjali smo, kako dobro so se
melodična pričakovanja udeležencev skladala s predlaganim modelom tonskih
46 Špela Medvešek
Slika 6.3: Frekvenčna porazdelitev odgovorov evropskih udeležencev na
vseh 40 eksperimentalnih nalog.
hierarhij (in ne “pravilnim” odgovorov oz. dejanskim nadaljevanjem izseka).
Rezultati udeležencev za odlomek 3 so predstavljeni v tabeli 6.5.
Tabela 6.5: Frekvenčna tabela odgovorov za odlomek 3 (dejanski odgovor
je –4).
Odgovor Del lestvice? Glasb. Neglasb. Skupaj
-4 X 6 (17 %) 5 (24 %) 11 (19 %)
-2 X 29 (81 %) 7 (33 %) 36 (63 %)
-1 - 1 (5 %) 1 (2 %)
0 X - 3 (14 %) 3 (5 %)
1 X 1 (3 %) 4 (19 %) 5 (9 %)
2 - 1 (5 %) 1 (2 %)
Skupaj 36 (100 %) 21 (100 %) 57 (100 %)
Razpršenost odgovorov je bila med neglasbeniki večja kot med glasbeniki,
kljub temu da je bila skupina glasbenikov skoraj dvakrat večja od skupine ne-
glasbenikov. Za evropski eksperimentalni blok je bila povprečna razpršenost
med glasbeniki 3,9 odgovorov, med neglasbeniki p
Recommended