Upload
kenneth-geisshirt
View
250
Download
0
Embed Size (px)
DESCRIPTION
My contribution of Dansk Naturvidenskabsfestival 2010. It's a dicussion on being famous or important and how social network analysis can make you understand the difference.
Citation preview
Kendthed og vigtighedOm søgemaskiner og sociale netværk
Kenneth Geisshirt
2010-09-30 © 2010 Kenneth Geisshirt 2
Agenda
● Om mig● Baggrund● Grafer● Korteste sti● Facebook, PGP og Kevin Bacon● Small World● Søgemaskiner
2010-09-30 © 2010 Kenneth Geisshirt 3
Om mig
● Privat● Gift med Pia
● To børn: Svea (6 år) og Svante (9 år)
● Uddannelse● B.Sc. i kemi/datalogi (KU)
● cand.scient. i kemi (KU)
● Ph.d. i soft material science (RUC)
● Selvstændig/freelancer● Software-udvikling
● Skribent (artikler, bøger)
● Underviser (kurser, teknisk skole)
● Rollemodel i IT-Branchen
2010-09-30 © 2010 Kenneth Geisshirt 4
Lidt baggrund
● Venner på Facebook● Mere end 50?● Mere end 250?● Mere end 500?
● Brug af Google● Indenfor en uge?● Sidste døgn?● Her til morgen?
2010-09-30 © 2010 Kenneth Geisshirt 5
Mere baggrund
Thomas Ring Pedersen
1.340 hitsPoul-Henning Kamp
50.400 hits
Lars Løkke Rasmussen
320.000 hits
2010-09-30 © 2010 Kenneth Geisshirt 6
Grafer
En graf består af● En række knuder (eng. nodes)● Kanter/forbindelser (eng. edges) mellem knuderne● Kanterne kan have vægt eller længde (1 hvis intet andet
siges)● Kanterne kan være orienteret
● En sti mellem to knuder● 4 → 5 → 1● 4 → 5 → 2 → 1● 4 → 3→ 2 → 1● 4 → 3 → 2 → 5 → 1
2010-09-30 © 2010 Kenneth Geisshirt 7
Flere ord
● En knudes valens er antal kanter som går ud fra knuden● Knude 4 har valens 3
● En kreds eller cyklus er sti som ender hvor den begynder● 2 → 3 → 4 → 5
● En graf er sammenhængende hvis er der findes mindst en sti mellem alle knuder
● En lukket Euler-tur er en cyklus som indeholder alle kanter én gang
2010-09-30 © 2010 Kenneth Geisshirt 8
Anvendelse af grafer
● Optimering af vej/el/kloaknettet og computernetværk
● Farvelægning af kort● Fire farver er nok
● Overvågningskameraer● Mindste antal og bedste placering
● Korteste sti● GPS i biler
● Dine venner, venners venner, venners venners …
2010-09-30 © 2010 Kenneth Geisshirt 9
Gåtur over broer i Königsberg
● Opgave: er det muligt at komme hele byen rundt og kun passere broerne én gang?
● Svar: Nej!● Argument: En lukket Euler-tur er
kun mulig hvis og kun alle knuder har lige valens
2010-09-30 © 2010 Kenneth Geisshirt 10
Korteste sti
Udfordringen er at finde den korteste sti mellem to knuder● Summen af kanternes
vægt/længde skal være mindst muligt
● Anvendelser:● Rejseplanen og bilnavigation
● E. Dijkstra udviklede første (computer)metode i 1956
4 → 5 → 1
2010-09-30 © 2010 Kenneth Geisshirt 11
Facebook som graf
● Personer er knuder● Venskab er en kant
● Maximal valens er 2000
● Grafen ændrer sig med tiden● En sti angiver venners venners …● http://www.touchgraph.net/
Vigtighed er laveste gennemsnitlige korteste stiDet er ikke antal venner
2010-09-30 © 2010 Kenneth Geisshirt 12
Pretty Good Privacy● PGP er et socialt netværk
● Udveksling af digital signatur til emails● Personerne skal mødes ikke-virtuelt og viser billed-ID
(kørekort, pas, etc.)
● Opbygger web of trust mellem brugerne● Du kan angive en værdi for din tillid● Og derved udregne tilliden til dine venners venner
2010-09-30 © 2010 Kenneth Geisshirt 13
Kevin Bacon
● Enhver skuespiller er forbunden med Kevin Bacon gennem højest 6 led
● Som graf:● Skuespillere er knuderne● Filmene er kanterne
● Korteste sti til Kevin Bacon er højest 6
● http://oracleofbacon.org/Foto: SAGIndie
Tomas Villum Jakob Cedergren
Dianne Wiest
2010-09-30 © 2010 Kenneth Geisshirt 14
Small World
● Small World fænomenet● PGP og skuespillere lever i små verdener● Facebook er det sandsynligvis også
● Højest 6 led/kanter adskiller os mennesker● Analyse af PGP (1997):
● http://bcn.boulder.co.us/~neal/pgpstat/
● Gennemsnitlig korteste sti: 6.2● Maximale korteste sti: 21● Derek Atkins: 3.99 (laveste)● Poul-Henning Kamp: 5.21
2010-09-30 © 2010 Kenneth Geisshirt 15
Websider som graf
WWW kan ses som en orienteret graf● Siderne er knuder● Links er kanterne – et link har
retning● Nogle sider er vigtigere end
andre:● Relevant i en søgning● Mange indgående kanter (mange
links til siden)
2010-09-30 © 2010 Kenneth Geisshirt 16
PageRank
● Google bruger metoden PageRank● Andre søgemaskiner bruger lignende metoder
● En sides vigtighed afhænger af● Vigtigheden af sider som linker til siden● Vigtigheden opskrives med vigtigheden fra de andre sider● Sider med mange links tæller ikke så meget
V A=V B
nB
V C
nC
⋯
● Google bruger andre tricks for at undgå snyd
● En del firmaer lever af Search Engine Optimization
2010-09-30 © 2010 Kenneth Geisshirt 17
Få mere at vide
● Alt om DATA, pp. 40-42, 12/2010● Grafteori af J. Carstensen. Systime, 1992.● Matematik 3F af J. Carstensen og J. Frandsen.
Systime, 1986.● Mat A htx af A. Bohnstedt. Systime, 2009.● http://da.wikipedia.org/wiki/Grafteori● SocNetV: http://socnetv.sourceforge.net/
2010-09-30 © 2010 Kenneth Geisshirt 18
IT-Branchenhttp://choosedifferent.com
Powerpraktik i uge 46