Upload
jussila-jari
View
179
Download
1
Embed Size (px)
DESCRIPTION
Hypermedian jatko-opintoseminaari 2009: Sosiaalisten verkostojen tutkimusmenetelmät. Seminaariesitys: "Keskeisyys ja arvostus". Jari Jussila, TTY.
Citation preview
1
Hypermedian jatko-opintoseminaari 2009
Keskeisyys ja arvostus
MATHM-67500 Hypermedian jatko-opintoseminaari
Sosiaalisten verkostojen tutkimusmenetelmät
21.1.2009
Jari Jussila
Tärkeys
• Yksi graafiteorian pääkäyttökohteista sosiaalisten verkostojen
analyysissa on sosiaalisen verkoston tärkeimpien toimijoiden
tunnistaminen.
• Tärkeyden (importance, prominence) määritelmiä on useita,
mutta yhteistä niille on, että ne yrittävät kuvata ja mitata ”toimijan
sijainnin” ominaisuuksia sosiaalisessa verkostossa.
Varhaisempia esimerkkejä Morenon (1934) ”tähdet” ja
”eristäytyneet”.
• Käydään läpi käsitteet: • keskeisyysaste (degree)
• closeness (läheisyys)
• välisyys (betweenes)
• informaation keskeisyys (information)
2
Toimijan keskeisyys
• Tärkeät toimijat ovat laajasti osallisia yhteyksiin toisten toimijoiden
kanssa.
• Osallisuus tekee toimijoista enemmän näkyviä muille toimijoille.
• Toimijan keskeisyydessä ei ole väliä, onko toimija lähettänyt vai
vastaanottanut yhteyden. Soveltuu hyvin suuntaamattomille verkostoille,
joissa ei tehdä eroa lähettämisen ja vastaanottamisen välille.
• Suuntaamattomissa verkostoissa keskeinen toimija on siis sellainen, joka
on osallisena monissa yhteyksissä.
• Toimijan keskeisyys soveltuu esimerkiksi resurssien hallinnan ja pääsyn
sekä informaation välittämisen mittaamiseen (Knoke & Burt, 1983).
• Freeman (1977, 1979) on esittänyt seuraavaan notaation toimijan
keskeisyyden mitaksi:
• C on keskeisyyden mitta ni:n funktiona, jonka alaindeksi CA ilmaisee mittauksen
tyypin. Indeksi i saa arvot 1 – g.
3
Toimijan arvostus
• Suunnatuissa verkostoissa erotetaan toisistaan yhteyksien lähettäminen
ja vastaanottaminen. Arvostettuja toimija on sellainen, joka on useampien
yhteyksien vastaanottaja.
• Toisin sanottuna arvostettu toimija on sellainen, jolla on suuri tuontiluku
(indegree).
• Huomaa, että jos tarkastellaan negatiivisia suhteita, kuten ”vihaa” tai ”ei
halua olla ystävä”, niin tällöin arvostetut toimijat eivät ole vertaistensa
kovasti arvostamia.
• Toimijan arvostusta on myös kutsuttu statukseksi (Moreno, 1934; Zeleny,
1940, 1941, 1960; Proctor & Loomis, 1951; Katz, 1953; Harary, 1959).
Wasserman & Faust (1994) sen sijaan puhuvat mielummin sijasta (rank).
• Olkoon, P, arvostuksen mittaus, joka määritellään toimijalle ni.
4
Kertaus: Vienti- ja tuontiluvut (Miilumäki
2009)
• Suunnatuille verkoistoille solmujen vienti- (outdegree)
ja tuontiluvut (indegree) ovat helposti laskettavissa sosiomatriisin X avulla.
• dO = solmun vientiluku
• dI = solmun tuontiluku
• Arvostetut toimijat ovat yleensä niitä, joilla on suuret
tuontiluvut, tai joihin kohdistuu suuri määrä
vastaanotettuja ”valintoja”.
5
Tärkeyden mitta
• Hubbelin (1965) ja Friedkinin (1991) mukaan tärkeyden mittauksessa
pitää ottaa huomioon suorien (direct) ja viereisten (adjacent) yhteyksien
lisäksi epäsuorat polut .
• Esim. LinkedIn:
6
Keskeisyys ja keskittyneisyys
• Keskeisyys (centrality) on toimijan ominaisuus
• Keskittyneisyys (centralisation) on koko verkoston
ominaisuus
• Keskittyneisyys mittaa koko verkoston tasolla, missä
määrin yksittäiset toimijat hallitsevat muiden välistä
kanssakäymistä.
• ”Tähti” on kaikkein keskittynein verkosto ja ”pyörä” kaikkein
vähiten keskittynyt.
7
Siivonen 2003
Kolme havainnollista verkostoa
keskeisyyden (keskittyneisyyden) ja
arvostuksen tutkimiseen
8
Tähti
Pyörä
Ketju
Maksimaalisen keskittynyt,
kaikki solmut jäsentyvät
yhden keskeisen solmun
ympärille
Keskittyneisyys äärimmäisen
vähäinen, solmut kytkeytyvät
toisiinsa ilman, että yksikään
solmu olisi keskeisempi kuin
toinen
Löyhempi kuin tähti,
mutta keskittyneempi
kuin pyörä
0 1 1 1 1 1 1
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
0 1 0 0 0 0 1
1 0 1 0 0 0 0
0 1 0 1 0 0 0
0 0 0 1 0 1 0
0 0 0 0 1 0 1
1 0 0 0 0 1 0
0 1 1 0 0 0 0
1 0 0 1 0 0 0
1 0 0 0 1 0 0
0 1 0 0 0 1 0
0 0 1 0 0 0 1
0 0 0 1 0 0 0
0 0 0 0 1 0 0
Näkyvyys ja tärkeys -käsitteet
9
Centrality (level two concept)
Prestige (level two concept)
Visibility (superordinate concept)
CAN BE
STUDIED BY
Centrality (level two concept)
Prestige (level two concept)
Prominence (superordinate concept)
CAN BE
STUDIED BY
Wasserman & Faust 1994 Knoke and Burt 1983
Käsitekartta: Novak 1998
=
Prominence: Centrality and Prestige
10
Centrality Prestige
Prominence
Wasserman & Faust 1994
Degree
Centrality
Closeness
Centrality
Degree
Prestige
Proximity
Prestige
Betweeness
Centrality
Information
Centrality
Status or Rank
Prestige
Tärkeys: keskeisyys ja arvostus
11
Keskeisyys Arvostus
Tärkeys
Wasserman & Faust 1994
Keskeisyysaste Läheisyys Degree
Prestige
Proximity
Prestige
Välillisyys Informaation
keskeisyys
Status or Rank
Prestige
Keskeisyysaste
• Keskeisyysaste (degree)
• Kertoo, kuinka monta suoraa yhteyttä toimijalla on
muihin toimijoihin
• Jos verkostoaineisto on suunnattu, voidaan
laskea erikseen lähettäjäkeskeisyys (outdegree)
ja vastaanottajakeskeisyys (indegree)
• Keskeisyysastetta läheinen indeksi on ego tiheys
(ego density) (Burt 1982, Knoke & Kuklinski
1982). Ego tiheys on suhdeluku toimijan suorista
yhteyksistä kaikkiin mahdollisiin yhteyksiin
suuntaamattomissa verkostoissa.
12
Keskeisyysasteen mitta
• Standardi mittana Wasserman & Faust (1994) esittävät seuraavan
kaavan:
• Joka kuvaa osuutta solmuja jotka ovat viereisiä ni. C’D(ni) on itsenäinen
g:stä, jolloin sitä voidaan verrata eri kokoisiin verkostoihin.
• Esimerkiksi asteluku seitsemälle toimijalle tähtigraafissa ovat 6 (ni:lle) ja 1
(n2-n7). Jolloin jakaja standardoidulle toimija indeksille C’D(ni) on g-1=6.
Standardoitu indeksi saa arvot {1.0, 0.167, 0.167, 0.167, 0.167, 0.167,
0.167).
• Pyörägraafille asteluku on kaikille d(ni)=2, joten kaikki indeksit ovat
yhtäsuuria: C’D(ni) = 0.333.
• Vastaavasti ketjugraafissa n1-n5 on kaikilla : C’D(ni) = 0.333, mutta kaksi
viimeistä toimijaa C’D(n6) = C’D(n7) = 0.167 –ovat vähemmän keskeisiä.
13
1
)()('
g
ndnC i
iD
Keskeisyys indeksit Florentine perheille
With g = 16 actors With g = 15 actors
C’D(ni) C’B(ni)* C’D(ni)* C’C(ni)* C’B(ni)* C’I(ni)*
Acciaiuoli 0.067 0.000 0.071 0.368 0.000 0.049
Albizzi 0.200 0.184 0.214 0.483 0.212 0.074
Barbadori 0.133 0.081 0.143 0.438 0.093 0.068
Bischeri 0.200 0.090 0.214 0.400 0.104 0.074
Castellani 0.200 0.048 0.214 0.389 0.055 0.070
Ginori 0.067 0.000 0.071 0.333 0.000 0.043
Guadagni 0.267 0.221 0.286 0.467 0.255 0.081
Lamberteschi 0.067 0.000 0.071 0.326 0.000 0.043
Medici 0.400 0.452 0.429 0.560 0.522 0.095
Pazzi 0.067 0.000 0.071 0.286 0.000 0.033
Peruzzi 0.200 0.019 0.214 0.368 0.022 0.069
Pucci- 0.000 0.000 - - - -
Ridolfi 0.200 0.098 0.214 0.500 0.114 0.080
Salvati 0.133 0.124 0.143 0.389 0.143 0.050
Strozzi 0.267 0.089 0.286 0.438 0.103 0.070
Tornabuoni 0.200 0.079 0.214 0.483 0.092 0.080
Centralization 0.267 0.383 0.257 0.322 0.437 -
14
Läheisyys
• Ideana on, että toimija on keskeinen jos se
kykenee nopeasti vuorovaikutukseen muiden
kanssa
• Läheisyys (closeness) on toimijan lyhyimpien
polkujen summa kaikkiin verkoston muihin
toimijoihin
• dij on lyhyimmän polun pituus i:n ja j:n välillä
• Huomaa tulkinnassa, että pieni arvo tarkoittaa
keskeistä pistettä
15
n
ij
iji dc
Läheisyyden mitta
• Sabidussin (1966) esittämä läheisyys:
• ja Beauchamp (1965) esittämä ”standardi” läheisyys:
• Tämä standardoitu indeksi saa arvot välillä 0 ja 1, ja se voidaan ajatella
käänteisenä etäisyynä toimija i:stä muihin toimijoihin.
16
)()1()('
iCiC nCgnC
g
j
jiiC nndnC1
1
, )]([)(
Kertaus: Geodeesit ja etäisyys
(Miilumäki 2009)
• Geodeesit eli solmujen lyhimmät etäisyydet
esitetään usein etäisyysmatriisin (distance
matrix) avulla
• Etäisyysmatriisin alkiot d(i, j) ilmoittavat solmujen
ni ja nj välisemmän lyhimmän etäisyyden
pituuden
17
Välillisyys
• Välillisyys (betweenness) mittaa, kuinka monen
toimijaparin välisen lyhyimmän polun varrelle
toimija sijoittuu
• Jos piste sijaitsee useiden muiden pisteiden
välillä, se pystyy säätelemään esim. tiedon
kulkua näiden välillä (portinvartijat)
• Piste voi olla (lokaalisti) hyvin epäkeskeinen,
mutta sen välillisyys voi silti olla hyvin suuri
18
Välillisyyden mitta
• Esimerkiksi solmujen lyhimmät etäisyydet (geodeesi) toimijoiden n2 ja n3
välillä on n2n1n4n3 – eli lyhyn polku näiden kahden toimijan välillä kulkee
kahden toimijan n1 ja n4 kautta- voidaan sanoa, että n1 ja n4 on vaikutusta
n2 ja n3 välisessä vuorovaikutuksessa.
• Toimija on siis keskeinen jos sen on useiden toimijoiden ja niiden
geodeesien välissä, jolloin toimijalla on suuri keskeisyys välillisyys.
• Välillisyyden mitta voidaan pukea seuraavaan kaavaan:
• jossa gjk on j ja k toimijoiden yhdistävien geodeesien lukumäärä. Koska
mikä tahansa geodeesi on yhtä todennäköinen, niin todennäköisyys
minkä tahansa geodeesin kautta on 1 / gjk (Freeman)
• joka on standardoituna:
19
kj
jkijkiB gngnC /)()(
]2/)2)(1/[()()(' ggnCnC iBiB
Kritiikkiä Freemanin (1979)
välillisyydelle
• Freeman (1979) olettaa, että kaikki geodeesit ovat yhtä todennäköisiä,
huomioimatta toimijoita. Jotkut toimijat saattavat kuintenkin olla
keskeisempiä keskeisyysasteeltaan, esim. jonkun toimijan keskeisyysaste
voi olla 10 kun toisen toimijan 3, tällöin yleensä sellainen toimija valitaan
todennäköisemmin joka on keskeisempi.
• Freeman (1979) olettaa myös, että aina mennään lyhintä reittiä pitkin, eli
keskitityyn vain geodeeseihin, vaikka jossain tapauksissa pidemmän reitit
tai polut saattavat olla todennäköisempiä.
20
Informaation keskeisyys
• Stephensonin ja Zelenin (1989) keskeisyyden indeksi vastaa tähän
kritiikiin, ja huomioi kaikki polut sekä niiden painoarvot.
• Geodeeseille yleensä annetaan painoarvoina niiden yhteneväisyydet.
Kun taas poluille joiden pituus on pidempi kuin geodeesin pituus
annetaan pienemmät painoarvot sen mukaan mitä informaatiota ne
sisältävät. Polun informaatio on yksinkertaisesti määritelty sen pituuden
inverssinä.
21
Informaation keskeisyyden mitta
• Informaatio keskeisyyden laskemiseksi tarvitaan kaksi välillistä arvoa.
Nämät ovat summa-arvoja: ja
• T on yksinkertaisesti summa kaikista matriisin diagonaalisista arvoista, ja
R on joku rivi summista (kaikki rivi summat ovat yhtäsuuria). Näiden
kahden arvojen avulla voidaan vihdoin laskea informaation keskeisyys
indeksi toimijalle i:
• Tämä indeksi mittaa kuinka paljon informaatiota sisältyy polkuihin jotka
alkavat (ja päättyvät) tiettyyn toimijaan. Indeksin minimiarvo on 0, mutta
sillä ei ole maksimiarvoa; jos T = 2R, ja Cii = 0, niin indeksi on ääretön.
Stephenson ja Zelen (1989) suosittelevat että käytetään suhteellista
informaatio indeksi, joka saadaan jakamalla jokainen indeksi (CI(ni)
kaikilla indekseillä:
22
g
i iicTC1
:
g
j ijcR1
gRTcnC
ii
iI/)2(
1)(
i iI
iII
nC
nCniC
)(
)()('
Lähteet
• Johanson, J-E., Mattila, M., Uusikylä, P. 1995. Johdatus
verkostoanalyysiin. http://www.valt.helsinki.fi/vol/kirja/.
• Novak, J.D. 1998. Learning, Creating and Using Knowledge: Concept
Maps as Facilitative Tools in Schools and Corporations. New York,
Lawrence Erlbaum Associates.
• Miilumäki, T. 2009. Matriisit verkostojen mallintamisessa.
• Siivonen, V. 2003. Johdatus verkostoanalyysiin.
http://www.valt.helsinki.fi/blogs/ville.siivonen/Luento%202.pdf
• Wasserman, S., Faust, K. 1994. Social Network Analysis, Methods and
Applications.
23