23
Föreläsning 6 Slumptal Testa slumptal Slumptal för olika fördelningar Grafer Datastrukturen graf

Föreläsning 6

  • Upload
    linus

  • View
    63

  • Download
    0

Embed Size (px)

DESCRIPTION

Föreläsning 6. Slumptal Testa slumptal Slumptal för olika fördelningar Grafer Datastrukturen graf. Repetition. En dator kan inte generera slumptal då den är helt deterministisk, däremot kan den generera pseudo-slumptal som kan fås att upplevas som slumptal: #include < stdio.h > - PowerPoint PPT Presentation

Citation preview

Page 1: Föreläsning  6

Föreläsning 6

SlumptalTesta slumptalSlumptal för olika fördelningarGraferDatastrukturen graf

Page 2: Föreläsning  6

Repetition En dator kan inte generera slumptal då den är helt deterministisk, däremot

kan den generera pseudo-slumptal som kan fås att upplevas som slumptal:

#include <stdio.h>#include <stdlib.h>#include <time.h>

int main(void){ srand(time(NULL)); //Anropas EN gång för att sätta frö int tarning1 = rand()%6+1; //blir slumptal 1-6 int tarning2 = rand()%6+1; printf(“Du fick %d och %d",tarning1, tarning2); return 0;}

rand() beräknar nästa slumptal i serien. Resultatet blir mellan 0 och RAND_MAX

Page 3: Föreläsning  6

Pseudoslumptal

Om inte hårdvarustöd finns kan en dator som är deterministisk inte skapa ”riktiga” slumptal.

Istället börjar den med ett frö (ett tal) och kan med detta beräkna en sekvens tal som saknar eller nästan saknar mönster.

Vid varje beräkning erhålles ett nytt ”frö” som kan användas till beräkning av nästa slumptal. Detta nya ”frö” kan vara men bör helst inte vara det beräknade slumptalet.

Förr eller senare kommer beräkningen att generera ett ”frö” det redan tidigare använt och man har då fastnat i en loop. Antalet slumptal man kan beräkna innan detta händer är slumptalsgeneratorns period.

Page 4: Föreläsning  6

Kvalitetskrav

Perioden långFördelningen likformig (alla tal lika sannolika,

vanliga)Slumptal nära varandra ska vara oberoende

(sannolikheten att få ett visst tal ska inte bero på vad vi fått innan)

Effektiv

Page 5: Föreläsning  6

Linjär kongruensgenerator

Har brister men är snabb och kräver nästan inget minne.

Använder slumptalet som frö till nästa slumptal.

Beräknas med: xn = (axn-1+c) mod mdär a, c och m är konstanter som ska väljas med omsorg. Sätts m till en jämn tvåpotens blir modulus operationen snabbast.int rnd(int *seed){

long long a; a=(long long) 16807* *seed; *seed=(int)(a%2147483647); return *seed;}

Page 6: Föreläsning  6

Additiv kongruensgenerator

xn = xn-j + xn-k mod mmed j = 24 och k = 55 fungerar bra men

kräver 55 startvärden. m=231

Page 7: Föreläsning  6

Chi-square-test

Vi kastar en vanlig tärning 1200 gånger och noterar resultatet. Vi förväntar oss knappast:

Låt oss säga att vi får:

Är tärningen ok?Ett chi-square-test jämför tärningens resultat med det

statistiska för att ge ett mått på hur sannolikt det är. För att det ska vara alls rimligt att göra ett chi-square-test bör förväntade antalet per utfall vara minst 5.

Page 8: Föreläsning  6

Som mått på avvikelsen använder vi:

Vilket ger oss V = 5,18Detta värde använder vi för att läsa av raden

för rätt antal frihetsgrader i följande tabell.Antal frihetsgrader är antalet möjliga utfall -1,

i vårt fall 5.

Page 9: Föreläsning  6

Vårt värde hamnade mellan 4,351 och 6,626 En korrekt tärning ska enligt tabellen hamna under 6,626 i 75% av fallen. Hade vi hamnat

över 6,626 hade det alltså varit lite osannolikt men inte exceptionellt. Det hade ju hänt i 25% av gångerna man gjorde experimentet med en riktig tärning.

Att vi kom över 4,351 är inte alls konstigt men det hade inte varit konstigt att komma under heller. En korrekt tärning hade kommit under 50% av gångerna man gjorde försöket.

Hade vi fått under 0,5543 eller över 15,09 hade det varit lite oroande. Det händer bara i 1% av försöken. Därmed inte sagt att slumptalsgeneratorn är dålig. För att säkerställa detta behöver man göra fler försök.

Page 10: Föreläsning  6

Gap test

Om vi kastar en tärning och får:

11111,22222,33333,… osv

känns det kanske inte så där jätteslumpmässigt även om chi-square-testet ovan ger ok.

Man kan då analysera avståndet mellan tal nära varandra (ex. avståndet mellan samma siffra).

Man gör då statistik på vilket avstånd tal som är på ett visst avstånd från varandra är och gör sedan ett chi-squar test på denna statistik.

Mer om detta finns i boken.

Page 11: Föreläsning  6

Ej rektangelfördelade slumptal

De inbyggda slumptalen i C och i många andra miljöer är rektangelfördelade, dvs alla tal i ett intervall är lika sannolika.

När vi vill simulera verkligheten är det vanligt att vi har andra fördelningar. Tex är längden hos människor snarare normalfördelade runt ett medelvärde

Page 12: Föreläsning  6

Normalfördelade slumptal

Page 13: Föreläsning  6

Exponentialfördelade slumptal

Page 14: Föreläsning  6

Poissonfördelning

Page 15: Föreläsning  6

Generera poissonfördelade slumptal

Page 16: Föreläsning  6

Grafer

Grafteori är en gren inom matematiken som är mycket användbar inom datalogi. Vi ska här ge en översikt som ingång till ämnet och hjälp inför problemlösning under kursens andra del. Vi börjar med lite begrepp.Graf (graph) - En mängd V av noder (vertices) och en mängd

E av bågar (edges) sådan att ändpunkterna på varje båge i E finns i V. En graf skrivs G = (V, E). Ett exempel: G = ({a, b, c, d}, {(a, c), (b, d), (b, c), (a, d)})

Broarna i Königsberg 1736

Page 17: Föreläsning  6

Riktad graf (digraf) en graf där varje båge är riktadväg (path), en vandring i grafen där alla noder är olika

(undantag: första och sista kan vara samma).sluten väg (closed path) väg där den första och sista

noden är samma. Kallas också cykel (cycle).förbindelsematris (adjacency matrix) har lika många

rader och kolumner som antalet noder i grafen. Talet 1 i rad i och kolumn j betyder att det går en båge mellan nod i och nod j. Talet 0 betyder att i samma position i matrisen betyder att ingen båge finns mellan dessa noder. Förbindelsematrisen för grafen ovan:

Page 18: Föreläsning  6

sammanhängande graf (connected graph) är en graf där det finns en väg mellan alla par av noder.

brygga (bridge) är en båge, sådan om den tas bort så är inte längre grafen sammanhängande.

intilliggande noder (adjacent vertices) Två noder som sammanbinds av en båge.

komplett graf (complete graph) en graf där varje par av noder har en gemensam båge.

gradtal (degree) Givet en nod v, säger vi att deg(v) är antalet bågar som är anslutna till denna nod v.

avstånd (distance) Givet två noder v och w den kortaste vägen d(v,w) mellan dessa noder.

diameter (diameter) Det största avståndet d(v,w) som finns i en sammanhängande graf.

Euler tur (Euler tour) En sluten väg som går genom samtliga grafens bågar precis en gång.

skog (forest) en graf utan cykler (slutna vägar). Om skogen är sammanhängande är det ett träd.

Page 19: Föreläsning  6

Hamilton tur (Hamilton cycle) En sluten väg som besöker samtliga grafens noder precis en gång.

isomorfi (isomorphic) Två grafer med samma matematiska struktur (samma förbindelsematris).

ordning (order) antal noder i grafenviktad graf (weighted graph) en graf där där

varje båge tilldelats ett tal som kallas för vikten, kostnaden eller avståndet. Spelar en stor roll i datalogin. I motsvarande förbindelsematris placerar vi in kostnaden istället för 1.

Page 20: Föreläsning  6

Tillämpningar

FödesschemanSociala nätverkVägnätDatornätverkTransporterKartografi - att måla kartor. Noderna är länder

och bågarna är gränser.Binära sökträd

Page 21: Föreläsning  6

Graf som ADT

Exempel på operationer: Sätta in en nod Sätta in en båge Ta bort en nod Ta bort en båge Söker upp en nod i grafen Bestämmer grannarna till en given nod

Beror på tillämpning se tex binära sökträdet som är en graf

Page 22: Föreläsning  6

Implementering av graf(hur lagrar vi informationen)

Enklast möjligast? (men krävande man måste söka igenom hela varje gång man vill hitta en förbindelse):

Förbindelsematris. Effektiv och enkel att slå i men slösaktig på minne. (Blir vårt val i kursen)

En array med pekare till länkade listor som innehåller de noder som respektive nod har bågar till. effektivare att slå i än förslag ett och mindre minneskrävande än förbindelsematrisen.

Page 23: Föreläsning  6

Inlämningsuppgifter

Följande uppgifter redovisas senast tisdag den 12 februari och kan inte redovisas senare:6.2, 6.11