47
1 Ett litet kompendium om Excel 2003 som statistiskt verktyg Erling Englund Statistiker Forskning och Utveckling, Landstinget Västernorrland erling.englund[at]lvn.se 2016-10-25

Ett litet kompendium om Excel 2003 som statistiskt verktyg · 2017. 4. 26. · 1 Ett litet kompendium om Excel 2003 som statistiskt verktyg Erling Englund Statistiker Forskning och

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • 1

    Ett litet kompendium om Excel 2003 som

    statistiskt verktyg

    Erling Englund

    Statistiker

    Forskning och Utveckling,

    Landstinget Västernorrland

    erling.englund[at]lvn.se

    2016-10-25

  • 2

  • 3

    Innehållsförteckning

    1. Introduktion ............................................................................................................................ 4 2. Databearbetning ..................................................................................................................... 5

    2.1 Struktur på data ............................................................................................................ 5

    2.2 Lägga till en variabel ........................................................................................................ 6 2.3 Lägga till en serie/nummerserie ....................................................................................... 6 2.4 Ändra bredden på kolumner och höjden på rader ............................................................ 7 2.5 Ändra format i en cell ....................................................................................................... 8 2.6 Skapa nya variabler av befintliga variabler .................................................................... 10

    2.6.1 Excels funktioner, te.x. OM-funktionen .................................................................. 10 2.6.2 Exempel på funktioner ............................................................................................ 13

    2.7 Sortera data ..................................................................................................................... 15 2.8 Selektera och sortera data via Filter ............................................................................... 16

    2.9 Hantera Blad/Flikar ........................................................................................................ 17 3. Pivottabeller ......................................................................................................................... 18

    3.1 Skapa pivottabell ............................................................................................................ 18

    3.1.1 Den korta vägen ...................................................................................................... 18

    3.1.2 Den långa vägen ...................................................................................................... 20 3.1.3 Skapa pivottabell från tidigare skapad pivottabell .................................................. 22

    3.2 Vanlig frekvenstabell ..................................................................................................... 23

    3.3 Korstabell ....................................................................................................................... 23 3.4 Tabell med beskrivande statistik (medelvärde mm)....................................................... 24

    3.5 Split file, dvs göra en tabell uppdelad på en annan variabel .......................................... 25 3.6 Select file, dvs göra en tabell för en kategori av en annan variabel ............................... 26 3.7 Ändra i tabell .................................................................................................................. 27

    4. Diagram ................................................................................................................................ 29

    4.1 Skapa diagram från persondata ...................................................................................... 29

    4.1.1 Punktdiagram .......................................................................................................... 31 4.2 Diagram från pivottabell ................................................................................................ 32

    4.3 Diagram från manuellt skapad tabell.............................................................................. 33 4.4 Histogram ....................................................................................................................... 34 4.5 Ändra i diagram .............................................................................................................. 36

    5. Statistiska metoder i Excel ................................................................................................... 37

    5.1 Statistiska funktioner och funktioner för hela variabler ................................................. 37 5.2 Statistik via Dataanalys .................................................................................................. 39

    5.2.1 Beskrivande statistik ............................................................................................... 40 5.2.2 T-test för parade observationer................................................................................ 41 5.2.3 T-test för två oberoende grupper ............................................................................. 43

    6. Övningar i Excel 2003 .......................................................................................................... 44 7 Länkar .................................................................................................................................... 46

  • 4

    1. Introduktion

    Excel och SPSS är två program som kan hantera och beskriva data. SPSS är ett rent

    statistikprogram och är därför gjort för att bearbeta ett material statistiskt. Så är inte fallet

    med Excel men man kan ändå göra vissa grundläggande statistiska moment. Vissa moment är

    krångligare i Excel. Två sådana moment är chi-2 test (test av korstabell, tas ej upp i

    kompendiet) och histogram.

    Kompendiet är först och främst gjort till en kurs i grundläggande forskningsmetodik där målet

    är att använda Excel istället för t.ex. SPSS till enklare projekt. De delar som man brukar

    behöva är databearbetning, tabeller, diagram och viss statistisk analys. Det är också den

    huvudsakliga uppdelningen i kompendiet. Sista kapitlet i kompendiet är övningar som är tänkt

    att användas vid datorövningen för att få en bild av de flesta delar i kompendiet.

    Utgångspunkten för övningen är att data redan är inlagt i Excel. Varje kolumn är en variabel

    där variabelnamnet ligger på rad 1 och första värdet på respektive variabeln på rad 2. Delar av

    data ses i kapitel 2.

    Vill man använda SPSS istället kan man läsa in excelfilen i SPSS (Välj bara att öppna en fil i

    SPSS och formatet Excel). Förutsättningen är att Rad 1 i Excel-filen är ett variabelnamn .

    Om man använder pdf-versionen av kompendiet kan man hoppa till ett specifikt kapitel

    genom att klicka på den raden i innehållsförteckningen. Har man Word-versionen måste man

    även hålla ner Ctrl-knappen.

  • 5

    2. Databearbetning

    2.1 Struktur på data

    Nedanstående visar det data som används i kompendiet. Vissa variabler är simulerade. Jag

    visar data på två sätt.

    Varje rad står för respektive persons värden, förutom rad ett som skall vara variabelnamn.

    Variant 1: Data med siffervärden på kategorivariablerna. Det kan vara bra om förklaringen på vad siffrorna betyder finns in samma fil, i en annan flik i

    samma fil eller om man lägger till rader mellan variabelnamn och data med förklaring. Om

    man för variabeln Kön skriver Kvinna=1 på rad 2 och Man=2 på rad 3 så blir värdet för

    person 1 då på rad 4, ovs. När man sen gör analyser, tabeller mm i Excel eller vill föra över

    filen till SPSS måste dessa rader tas bort, som i figuren nedan. Vill man ha kvar info om

    kategorierna kan man t.ex. kopiera över hela data till en annan flik innan raderna tas bort.

    Variant 2: Data med textvärden på kategorivariablerna

    Har du väl skrivit t.ex. Man på rad 1 i variabeln Kön och skriver M på nästa rad så föreslår

    Excel Man, vilket gör inmatningen smidigare. Har man två kategorier som börjar på samma

    bokstav i en variabel behöver skriva t.o.m. den bokstav som skiljer dem åt.

    Om målet är att jobba bara med Excel som analysprogram rekommenderas Variant 2. Är

    målet att använda ett statistikprogram, typ SPSS, kan vara smidigare med Variant 1. men det

    går även att föra över och använda Variant 2 till SPSS.

    Inga mellanrum, dvs se till att det inte är några tomma rader/kolumner mellan första och

    sista person/variabel. Detta gör det enklare när man vill göra Pivottabeller i Excel.

    Låsa Rader och eller kolumner: När man har mycket data så ”försvinner” raden med

    variabelnamnet när man scrollar nedåt. Ett sätt är att låsa första raden så att den alltid är

    synlig. Man markerar då den rad där den skall ”sluta låsa”

    1) Man vill låsa rad 1. Markera därför rad 2 (Klicka på 2:an längst till vänster) 2) Välj FönsterLås fönsterrutor

    För att ta bort låsningen väljer man samma väg.

    Man kan även låsa kolumn, t.ex. för att låsa första kolumnen, markera kolumn B

    Vill man låsa både rad och kolumn, t.ex. rad 1 och kolumn A, sätts markören i cell B2.

  • 6

    2.2 Lägga till en variabel

    I det data som används för övningen finns ej variabeln Person med. Antag nu att vi vill lägga

    till variabeln.

    1) För att Person skall ligga i kolumn A, högerklickar man på A och väljer Infoga. Då flyttas alla kolumner fram ett steg och Person kan läggas in i A.

    ( Om du bara har högerklickat i en cell i kolumn A så får du istället fram en meny. Där väljer

    du Infoga hela kolumnen. så får du samma resultat)

    Du kan förstås också används menyn, InfogaKolumn

    2.3 Lägga till en serie/nummerserie

    Variabeln Person är en ren sifferserie. Man kan förstås manuellt skriva in dessa, men med

    Excel kan man göra det mycket smidigare.

    1) Skriv in de två första värdena 1 och 2 (fig 1). Markera cellerna. 2) För muspekaren till det nedre högra hörnet på den nedersta av cellerna. (fig 1) Då

    visas muspekaren som ett svart kors. Sen finns det 2 sätt.

    a. Tryck på korset och dra neråt så skapas nummerlistan, så långt du nu vill, i detta fall till 40. (fig 2)

    eller

    b. Har du data i kolumnen bredvid kan du också dubbelklicka på det nedre högra hörnet istället. Då så fylls nummerserien tom sista raden det finns information i

    kolumnen bredvid. Så har man lagt in Kön på 100 personer kolumnen bredvid

    så kommer nummerserien skapas tom 100.

    Detta kan också användas i andra sammanhang, t.ex. när man arbetar med formler, se 2.5.

    Om fig 3-4 ovan: När man skapar serien kommer det också upp en liten ruta (fig 3 ovan).

    Klickar man på den så visas några alternativ (fig 4 ovan). Just nu står den på fyll serie, dvs

    skapa serie 1 2 3,…. Hade man bara skrivit in 1 och gjort stegen ovan, valt ”Fyll serie” i rutan

    hade man också fått serien 1,2,3…

  • 7

    2.4 Ändra bredden på kolumner och höjden på rader

    I en ny excelfil är alla kolumner lika breda och raderna lika höga. Principen för att ändra

    kolumn och rad följer samma princip så jag visar bara för kolumn.

    Man kan ändra bredden på lite olika sätt. För man markören mitt emellan 2 kolumnbokstäver

    så visas en linje med en pil åt vänster och en åt höger.

    För att automatanpassa bredden på en kolumn: I exemplet nedan skall bredden ändras på

    kolumn B.

    - Dubbelklicka då bara på linjen mellan B och C längst upp så ändras bredden så att hela texten ryms.

    För att automatanpassa bredden på flera kolumner samtidigt: Säg att man vill ändra bredden

    på kolumn A tom K. Markera då dessa kolumner (klicka på A och dra till K). Gör sedan om

    samma steg som ovan. Det spelar ingen roll i detta fall om man dubbelklickar på linjen mellan

    A och B, B och C,….., huvudsaken det är inom det område man markerat.

    För att ändra bredden manuellt: Om bredden på kolumn B skall ändras, klicka på linjen

    mellan B och C och dra till önskad bredd.

  • 8

    2.5 Ändra format i en cell

    I excel finns det lite olika sätt att ändra formatet i en cell. För att komma in i menyn,

    högerklicka i en cell och välj Formatera celler, så visas 6 flikar. Se nedan. Den första är Tal.

    -Fliken Tal:

    Det som syns i en cell är en kombination av det som skrivits in och vilket format den har.

    Excel försöker sen förstå vad det man skriver in har för format.

    Exempel:

    - Antag att man skriver in 23 i A1. (fig 1). Den visar då talet 23. - Skriv sedan in 2-3 i samma cell istället (fig 2) och det visas då i datumformat (fig 3) - Skriv sedan in 23 igen i samma cell (fig 4) och då blir det 23-jan istället (5)

    - I fig 3 gissar Excel att det är ett datum som skrivs in och det formatet kvarstår så länge man

    inte skriver in ngt som helt motsäger det. En siffra tolkar den fortfarande som datum. Skriver

    man in text så ändrar Excel formatet igen.

    För att ändra formatet gör som ovan, högerklicka och välj Formatera celler och väj rätt

    format.

    Decimaltal: För att Excel skall förstå att det är ett tal med decimaler måste man använda

    komma, inte punkt. Värdet 2,3 tolkas som talet 2,3 medan 2.3 tolkas som ren text. Detta ser

    man också på hur värdet automatiskt placeras i en cell. Siffror blir högerjusterade medan text

    blir vänsterjusterade. (se fig nedan).

    Om man har tal i en eller flera celler kan man styra antalet decimaler i värdena. Man ändra det

    genom att markera cellerna, högerklicka och välja Formatera celler. Välj sedan fliken Tal,

    kategorin Tal och ändra decimaler.

  • 9

    Datum: Under Tal finns diverse format, olika format för Datum mm. Datum visas som t.ex.

    2014-01-01, men egentligen är Datum ett tal, 2014-01-01 = 41640 dagar från 1900-01-01. Så

    ändrar man formatet på 2014-01-01 från Datum till Tal så blir det 41640. Talet 1 är då 1900-

    01-01.

    Fliken Justering (se bild på nästa sida):

    - Här kan man välja att sammanfoga celler, te.x. om två celler markeras. I fliken Justering kryssa i Sammanfoga, så får man en cell över två kolumner.

    - Kryssar man i Radbyte, så kommer texten man skriver in i en cell fördelas på flera rader istället för i en lång rad.

    - Man kan även i samma flik justera texten (centrera, högerjustera mm)

    Fliken Tecken är precis som vanlig teckensnitt, storlek mm

    Fliken Kantlinje:

    - Här kan man lägga till linjer. Säg att man har data där personer fått fylla i 3 enkäter. Då kan man t.ex. lägga till en starkare linje mellan sista svaret på en enkät och första

    svaret på nästa enkät, för att göra det lättare att läsa och få översikt över data.

  • 10

    2.6 Skapa nya variabler av befintliga variabler Det finns två grundvarianter på formler 1) Formler baserat på de vanliga räknesätten, tex

    räkna ut BMI från längd och vikt och 2) Formler baserat på de funktioner som finns i Excel.

    BMI räknas som vikten / (längden i meter)^2. Eftersom längden är i cm i data blir det

    =Vikt/(Längd/100)^2. Man måste alltid börja med ett = - tecken.

    I data finns längd i kolumn D och Vikt i kolumn E.

    1) Låt kolumn L bli variabeln för BMI 2) På rad 2 skriv =E2/(D2/100)^2 (Se fig).

    a. Excel visar samtidigt de variabler som används i formeln. I bilden nedan har vissa delar färgmarkerats. E2 och vikt är markerad blå och D2 resp Längd är

    markerad grön. Detta för att man lättare skall se att t.ex. rätt cell är vald.

    3) Använd sedan kapitel 2.3 för att få BMI beräknat på de andra raderna. a. Observera att här räcker det med att markera den cell du just skapat formeln,

    cell L2, för att kopiera formeln till de andra raderna. Ett annat sätt är att

    kopiera cellen med formeln, markera de andra raderna och klistra in.

    Observera att om man lägger till en variabel, t.ex. före Längd så kommer Längd vara kolumn

    E och Vikt kolumn F, och formeln kommer då läsa från kolumn E och F istället.

    2.6.1 Excels funktioner, te.x. OM-funktionen

    Om man vill veta vad en funktion betyder kan man söka i hjälpen. Ett visst stöd för man bara

    genom att i en cell skriva =OM(

    så visar Excel vad funktionen behöver för att fungera. Se nedan.

    Ett logiskt test kan t.ex. vara Kolesterol>6 Påståendet kommer antingen vara sant eller falskt.

    Funktionerna skrivs normal med stora bokstäver, men små bokstäver fungerar också.

    Exempel

    Antag att vi vill bedöma hur många som ligger för högt i kolesterol 1. För att göra det vill vi

    skapa en ny variabel (t.ex. Hög kolesterol 1) som har alternativen Hög och Normal. Det vi vill

    göra är att skapa en variabel som

    ”Om värdet i kolumn I2(Kolest1) är över 6 så skall värdet bli Hög, annars Normal”.

    Textalternativ som Hög och Medel skrivs som ”Hög” och ”Medel” i funktioner.

  • 11

    _______________________________________________________

    1) Skriv in formeln =OM(I2>6; ”Hög”; ”Normal”) t.ex. i L2, se nedan (L är den kolumn i vilken du skapar den nya variabeln) och tryck sedan Enter,

    2) Du bör då få värdet Hög i den cellen, som nedan.

    3) Markera sedan cellen och kopiera den till de andra raderna, t.ex. genom att dubbelklicka på cellens nedre högra hörn. (Se kapitel 2.3)

    _______________________________________________________

    OBS: Normal i ovanstående exempel betyder att värdena ligger mellan 0 och 6, så

    ovanstående blir rätt så länge resterande celler bara innehåller värden mellan 0 och 6.

    Om det finns tomma celler, t.ex. missing eller felaktiga värde t.ex. negativa:

    Om ni skulle ha tomt i en cell så tolkar Excel det som 0, vilket i detta fall skulle vara Normal.

    Det blir förstås fel. Om det finns tomma celler men värdena i övrigt är 0 eller högre kan man

    skriva

    =OM(I2>6 ; ”Hög”; OM(OCH(I2>=0;I26;”Hög”;”Normal”)),

    dvs är det tomt i cellen, då skall det också vara tomt i den nya variabeln. Här blir allt som inte

    är tomt och inte är >6 Normal. Då förutsätter det att inte det finns negativa värden eller text.

  • 12

    Skapa textetiketter av siffervärden i en variabel

    Antag att vi bara hade skrivit in 1 och 2 på variabeln Kön i kolumn B. Ett sätt att få en

    variabel med Man och Kvinna istället är att skapa en ny variabel i en tom kolumn t.ex.

    =OM(B2=1;”Kvinna”;”Man”)

    Det betyder OM(B2=1 blir värdet Kvinnan, om B2 ≠ 1 blir det Man. Detta stämmer under

    förutsättning att det inte finns några andra värden än 1 och 2 i variabeln.

    Vill var säker skriver man

    =OM(B2=1;”Kvinna”;OM(B2=2;”Man”;””))

    Det betyder att OM B2=1, blir värdet på rad 2 i den nya variabeln Kvinna, annars OM B2=2

    blir värdet Man, och är det något annat än 1 eller 2 blir det tomt.

    Här finns det tre kategorier 1,2 och annat. Har man fler än tre kategorier behöver man

    använda fler OM-satser i samma. Max sju Om kan kapslas i varandra i Excel 2003. Senare

    versioner av Excel tillåter fler.

    Övrigt.

    Semikolon, tecknet ; brukar användas i Excels funktioner för att särskilja de uppgifter man lägger in funktionen

    I Om-funktionen särskiljer vi

    1) Logiskt test, jämförelse av värde i en cell mot ett gränsvärde

    2) vad vill vi att det skall stå Om det Stämmer, och

    3) vad det skall stå Om det Inte stämmer.

    ”Hög” behövs för att Excel skall förstå att Hög är ren text och skall läsas precis som det står. Det kan t.ex. finnas en funktion i Excel som heter Hög som Excel annars

    skulle förväxla den med.

    När man t.ex. kopierar en funktion till andra rader så ändras automatisk t.ex. B2 till B3, dvs den känner av att man kopierar den till en rad ner. Motsvarande gäller för

    kolumner. Det finns tillfällen när man vill att radnumret eller kolumnbokstaven skall

    vara låst. Då kan man använda tecknet $.

    Antag att man i en cell har använt en funktion som använder värdet i cellen B2, och

    sen att man kopierar den till en annan rad och/eller kolumn. Om man har skrivit

    $B2, betyder det att funktionen fortfarande kommer att läsa från kolumn B. B$2, betyder det att funktionen fortfarande kommer att läsa från rad 2. $B$2, betyder att funktionen läser från B2 oberoende till vilken cell man

    kopierar den till.

    Exempel på sista punkten:

    Antag att man skriver in nedanstående i Excel i kolumn A-C, på rad 1-4, men att man också

    vill ha det i andelar/procent (se figur 1). Ett sätt är förstås att man skriver =23/66, och =43/66

    på raderna för procent. (se figur 2)

  • 13

    Ett annat sätt är att skriva =B2/B$4 (se figur 3). Det betyder att när man kopierar den

    funktionen till raderna under så kommer det att stå

    =B3/B$4 för raden med ”Nej”

    =B4/B$4 för raden med ”Totalt”

    dvs värdet för totalt i B4 är låst.

    Har man fler tabeller i samma format kan man bara kopiera C2:C4 ovan till samma position i

    dom tabellerna.

    För att ändra till procent, högerklicka på cell/celler du vill ändra, välj Formatera celler, sen

    fliken Tal, och därefter Procent

    2.6.2 Exempel på funktioner

    OCH – Används med fördel tillsammans med Om-funktionen när man behöver koppla ihop

    två eller fler logiska test, t.ex. om kolesterol är Normal om det ligger mellan 0 och 6 så måste

    det skrivas som två test. Om Kolest1 ligger i kolumn I skriver man

    OCH(I2>=0;I2

  • 14

    Man kan lägga till fler textdelar. Ett exempel ses nedan. Observera att det nedan står

    ”Person ”, inte ”Person”, dvs ett mellanrum mellan n och ”. Här använder vi även variabeln

    Person, kolumn A.

    =SAMMANFOGA("Person ";A2;" heter ";B2;" ";C2).

    Detta skulle på rad 2 i kolumn D resultera i texten Person 1 heter Kalle Svensson.

    AVRUNDA.NEDÅT – Om det står 2,34 i en cell så har värdet två decimaler. Ändrat man

    formatet på cellen, t.ex. till 0 decimaler så har talet fortfarande två decimaler. Det är bara hur

    det visas som har ändrats. Formeln Avrunda.nedåt ändrar själva värdet.

    =AVRUNDA.NEDÅT(H2;0) ändrar antalet decimaler för Kolesterol 1 till en decimal.

    Observera att man måste skapa en ny variabel så det blir en kolumn med originalvariabeln och

    en kolumn med det avrundade värdet

    IDAG() och NU()

    IDAG() = dagens datum. Om IDAG() är inskrivet i en cell så uppdateras den till dagens

    datum varje gång man öppnar filen. Detta kan vara smidigt t.ex. om man skriver ut ett

    diagram och kan då se vilket datum/version den kommer ifrån.

    NU() visar datum och tid.

    Det skall vara tomt inom parenteserna.

  • 15

    2.7 Sortera data

    Sortera data kan man göra via DataSortera eller via Filter (Se 2.7). Det senare är att

    föredra.

    Väljer man första alternativet kan man välja upp till 3 variabler samtidigt. (se bild nedan)

    OBS: Två saker är mycket viktiga.

    1) Se till så att du har en variabel som visar ursprungsordningen. När du har sorterat data tex. efter Kön, är det bra om du kan sortera tillbaka data enligt ursprungsordningen.

    2) Se till att HELA data är markerat innan du sorterar, annars hamnar data i oordning. Excel frågar i allmänhet om man vill markera hela data, om den känner att det finns

    fler kolumner med data utanför det markerade området.

    Observera också längst ner under Dataområdet har. Om det finns rubrikrad, se till att

    Rubrikrad är ikryssat, annars kommen den raden med i sorteringen.

  • 16

    2.8 Selektera och sortera data via Filter

    Ibland vill man kunna se data bara utifrån en eller flera kategorier av en variabel.

    Se först till att du klickat på/har markören i en cell i data (är markören utanför data hittar den

    inte data), alternativt markera kolumnerna.

    Välj sedan DataFilterAutofilter. Resultatet ses nedan.

    Vill du ta bort autofiltret väljer du samma väg och avmarkerar det.

    Klickar du på knappen vid Kön och sen på Kvinna så visas bara kvinnorna i materialet.

    Här kan du också sortera data efter en variabel. Dock är det som i nämnts i 2.6 viktigt att det

    finns en variabel som talar om ursprungsordningen, här variabeln Person, så att man kan

    sortera data i den ordning data är inlagt från början.

    Väljer du Anpassa, kan du t.ex. om du klickat på Kolest1, välja Visa rader där Kolest1 är

    större än : 6. ”. Texten ”är större än” är ett av alternativen du kan välja, och värdet 6 skriver

    du in manuellt. Väljer du detta selekteras bara de som är större än 6 i Kolest1.

    OBS:

    - Skapar du diagram så görs diagrammet bara på de selekterade, men när du selekterar alla igen så anpassas diagrammet till att visa alla.

    - Dataanalys (se 5.2) påverkas inte av Filter.. - Har du selekterat på en eller flera variabler och vill visa alla igen, så behöver du inte

    gå in och ändra i varje. Gå bara till DataFilterVisa alla så tas alla selekteringar

    bort.

  • 17

    2.9 Hantera Blad/Flikar

    Namnge blad: För att ändra namn på ett blad, dubbelklicka på t.ex. bladet Blad 3, så markeras namnet och du

    kan skriva in ett nytt namn.

    Lägga till blad: Högerklicka bara på ett blad, välj Infoga, och därefter Kalkylblad. Då får du ett nytt blad,

    framför det blad du högerklickade på.

    Flytta eller kopiera blad:

    Vill du flytta ett blad, använd bara drag-and-drop, dvs tryck på den blad du vill flytta, dra

    bladet till den plats du vill flytta den till, och släpp.

    Du kan också högerklicka, välja Flytta eller kopiera, och sen välja vilket blad den skall lägga

    sig före. Här kan man även flytta den till en annan fil (måste vara öppen).

    För att istället göra en kopia så görs samma steg som ovan, men Skapa en kopia skall också

    vara ikryssad.

    Välja färg på flik:

    Du kan också byta färg via på flikar, vilket kan ge bättre översikt.

  • 18

    3. Pivottabeller

    DataRapport för pivottabell och pivotdiagram

    Pivottabeller är det verktyg Excel har för att skapa tabeller av exempelvis persondata.

    Detta kapitel är grovt uppdelat i två delar, där kapitel 3.1 visar hur man samlar in

    informationen och tar fram en mall för tabellen, medan kapitel 3.2. om framåt visar hur du

    kan välja hur tabellen skall se ut och vilka variabler den skall bestå av.

    3.1 Skapa pivottabell

    Det finns den korta och den långa vägen. I den korta går man samma väg som den långa men

    man hoppar över de flesta av stegen. Är du t.ex. nöjd med att få en tabell per blad så räcker

    oftast den korta. Man kan också använda en redan gjord tabell för att skapa en ny.

    3.1.1 Den korta vägen

    1) Börja med att sätta markören någonstans i ditt datamaterial. Det viktiga är att den cell markören ligger har ”kontakt” med data.

    2) Gå till DataRapport för pivottabell och pivotdiagram. Nedanstående meny visas.

    3) Tryck sedan Slutför

  • 19

    Man får då en tabell i ett nytt blad. Detta är den snabba vägen.

    Till höger finns variabellistan och till vänster finns radområde, kolumnområde,

    sidområde och dataområde. Det finns två sätt att lägga in variabler i fälten

    a) I variabellistan till höger, markera variabeln av intresse, välj vilket område den skall läggas till, klicka Lägg till i.

    eller

    b) Klicka och dra variabeln av intresse till området den skall läggas till.

    För en ren frekvenstabell lägger man t.ex. på Kön i Radområde/Radfält så att man visar vilka

    kategorier den innehåller, och sen Kön på Dataområde för att visa antalet i respektive

    kategori.

    Kön som variabel innehåller både information om 1) vilka kategorier den består av och 2) hur

    många som finns i respektive kategori, varför Kön både läggs till sidområde och dataområde.

    Om man vill göra en korstabell lägger man också en variabel i Kolumnområde. Vilken av

    Rad- eller Kolumnvariabeln man lägger i Dataområde spelar ingen roll. Excel förstår vad

    den skall göra.

    Om Fältlistan har försvunnit behöver bara klicka på tabellen igen för att visa den igen,

    alternativt högerklicka på tabellen och välja Visa Fältlistan.

    Läs vidare på från 3.2 i respektive kapitel för typ av tabell.

  • 20

    3.1.2 Den långa vägen

    Det är enligt min uppfattning i två saker man missar om man går den korta vägen.

    I första hand en sak handlar det om att kunna välja i vilket blad tabellen skall läggas. Det

    kan vara smidigt att kunna samla flera tabeller i samma blad. Är man nöjd att få en tabell per

    blad räcker den korta vägen.

    I andra hand handlar det om att göra tabeller så att alla tabeller uppdateras när en tabell

    uppdateras.

    1) Börja med att sätta markören (klicka) någonstans i ditt datamaterial. Det viktiga är att den cell markören ligger har kontakt med data.

    2) Gå till DataRapport för pivottabell och pivotdiagram. Nedanstående meny visas.

    3) STEG 1 Varifrån tas data. Om du har ditt data i Excel och bara vill göra en pivottabell kan du välja Nästa.

    a. Väljer du Pivotdiagramrapport kan du göra ett diagram istället för tabell. men man kan enkelt göra ett diagram utifrån tabellen i efterhand, varför detta

    alternativ inte är nödvändigt.

    2) STEG 2 Vilket data skall användas Vilken del som är markerat visas med en streckad linje kring data. Om du har satt markören i data och ej har några tomma rader

    eller kolumner kan man trycka på Nästa

    a. Har du mycket data är det bra att veta vilken kolumn som är den sista och hur många rader du har, ifall man är osäker på om hela data markeras. I fältet

    Område nedan står det A1 till K41, dvs alla rader tom rad 41, och kolumner

    tom kolumn K är markerad.

  • 21

    b. Om inte hela data är markerat, te.x. om du har mellanrum, då föreslår jag att du går ut guiden och korrigerar och tar bort tomma rader/kolumner eller markerar

    hela data. Markera hela data gör du enklast med att trycka Ctrl-A. Är markören

    i data kan du behöva du trycka Ctrl-A 2 gånger efter varandra.

    5) Nästa steg handlar att spara minne och storlek på filen. Är de få tabeller och litet data kan du trycka Nej

    Utgår du hela tiden från samma data och inte har lagt till några variabler, välj JA,

    speciellt om det blir många tabeller. En fördel med detta är att om man uppdaterar data

    i en tabell så uppdateras alla tabeller som utgår från tabelldata. Se kap 3.7

    I nästa steg välj bara en tabell som använder samma data, vilket blir vilken som helst

    om alla använder samma data.

    OBS: Detta steg kan man också göra genom att kopiera en annan tabell och klistra in.

    Resultatet blir detsamma. Se ”Lägga till en ny tabell” i 3.7.

    6) STEG 3 plats och layout. Tryck Slutför om du är nöjd med att få tabellen i ett nytt blad. Det som i första hand är användbar innan man trycker Slutför här är Plats.

    i. Plats: Default är På nytt kalkylblad. Vill man t.ex. ha flera tabeller i samma blad väljer man alternativet På detta kalkylblad. Klicka på det

    blad du vill använda (klicka på Bladnamnet) och klicka sedan på en

    plats/cell i dokumentet. Har du redan en tabell i den fliken, se till att ha

    ca fyra rader mellan den senaste tabellen och den tabell du vill skapa.

    Tryck sen Slutför

    ii. Layout: Här kan du skapa en tabell direkt, via drag and drop i ungefär samma vy som i bilden nedan. Tas inte upp mer här.

    iii. Alternativ. Här finns alternativ som t.ex. hur tomma fält skall visas mm. Tas inte upp mer här.

  • 22

    3.1.3 Skapa pivottabell från tidigare skapad pivottabell

    Har man redan gjort en tabell kan man förstås gå den vanliga vägen för att göra en ny tabell,

    den korta eller långa. Man kan också kopiera en tidigare gjord tabell, klistra in och sen bara

    byta ut variablerna.

    När man markerar tabellen så är det enklast att börja markeringen utanför tabellen, t.ex. från

    raden nedanför eller ovanför tabellen.

    Kom ihåg bara att när man tar bort variablerna från tabellen så blir tabellen större, innan man

    lagt dit nya variabler igen. En tom tabell tar 7 kolumner och 16 rader i utrymme.

    Uppdaterar man sedan den tabell man kopierar från eller den kopierade så kommer båda att

    uppdateras. Det blir som steg 5) och 6) (Plats) på sid 19.

    Fördelen med detta är flera. Man kan då direkt styra vart tabeller skall lägga någonstans,

    uppdateras den ena tabellen så uppdateras automatisk den andra. Storleken på filen blir också

    mindre, än om man skulle skapat flera tabeller via den ”korta vägen”.

  • 23

    3.2 Vanlig frekvenstabell

    DataRapport för pivottabell och pivotdiagram

    Antag att vi vill göra en frekvenstabell på Kön. Utgångspunkten är att man fått fram bilden

    från kapitel 3.1 med Radområde, Kolumnområde mm. Får man inte fram fältlistan, klicka på

    tabellen eller högerklicka och välj Visa fältlista.

    1) Markera variabeln Kön i Fältlistan för pivottabell, och sen Lägg till i Radområde. 2) Upprepa samma sak med Kön till Dataområde. Resultatet ses nedan.

    Blev det fel variabel, vänsterklicka på Kön i tabellen och dra variabeln utanför tabellen, och

    släpp.

    3.3 Korstabell

    DataRapport för pivottabell och pivotdiagram

    Antag att vi vill göra en korstabell på Kön och Rökv. Utgångspunkten är att man fått fram

    bilden från kapitel 3.1 med Radområde, Kolumnområde mm.

    1) Markera variabeln Kön i Fältlistan för pivottabell, och sen Lägg till i Radområde. 2) Markera variabeln Rökv i Fältlistan för pivottabell, och sen Lägg till i

    Kolumnområde.

    3) Lägg även till Kön eller Rökv till Dataområde. Resultatet ses nedan. a. Siffrorna i tabellen blir desamma vilken av de två variablerna man lägger dit,

    men om man vill undersöka rökvanorna mellan könen är Rökv lämpligast att

    lägga till Dataområde, bl.a. då variabelnamnen är synligt i övre vänstra hörnet

    på tabellen.

    4) Vill man visa det i procent istället, högerklicka på det du vill ändra, dvs Antal av

    Rökv. Välj Fältinställningar, tryck på Alternativ och välj sedan Visa data som % av

    rad. högra bilden. Man ser också i vänster bild några av de alternativ som finns

    istället för Antal.

  • 24

    Tyvärr kan man inte göra ett chi2-test direkt från tabellen. I chi2-test jämförs den tabell man

    skapat från data, med hur motsvarande tabell skulle ha sett ut om det inte finns någon skillnad

    i andel. För att göra ett chi2-test behöver man även skapa den tabellen. Detta tas ej upp här.

    Se länkar till chi2-test i Kapitel 7.

    3.4 Tabell med beskrivande statistik (medelvärde mm)

    DataRapport för pivottabell och pivotdiagram

    Antag att man vill skapa en tabell med medelvärde av Ålder, Längd och Vikt för män

    respektive kvinnor. Utgångspunkten är att man fått fram fältet med Radområde,

    Kolumnområde mm. För denna tabell används bara Radområde och Dataområde.

    1) Markera variabeln Kön i Fältlistan för pivottabell, och sen Lägg till i Kolumnområde.

    2) Markera variabeln Ålder och sen Lägg till i dataområde 3) Ändra från Summa av Ålder till Medel av Ålder genom att högerklicka på Summa av

    Ålder, välj Fältinställningar, och därefter Medel, Ok, så fås den högra bilden

    4) Upprepa sedan steg 2)-3) med variablerna Längd och Vikt så fås den högra bilden nedan.

  • 25

    5) Vill man även lägga in andra mått som max, min, standardavvikelse, mm så lägger man in samma variabel igen i Dataområde, men för att lägga till samma variabel som

    redan finns i tabellen kan man inte använda knappen Lägg till i . Man måste istället

    dra och släppa variabeln till Dataområde.

    Tag t.ex. variabeln Ålder från fältlistan, dra och släpp den i Dataområde, spelar ingen

    roll vart. Ändra sedan till ett annat mått (se 3) ).

    Vill man ta bort en variabel fungerar det inte att dra variabel/måttet och släppa den utanför

    tabellen i denna typ av tabell. Välj istället att högerklicka på den rad/variabel du inte vill visa

    och välj Dölj.

    OBS: Här passar det bäst att lägga en kategorivariabel som Kön på Kolumn. För någon kan

    det vara bättre att lägga Kön på kolumn och Ålder på rad. Det beror på inställningen i Excel.

    Att lägga Kön på rad istället för kolumn i ovanstående exempel hade inte fungerat.

    3.5 Split file, dvs göra en tabell uppdelad på en annan variabel

    Antag att vi vill titta på Blodgrupp och Rökvanor, uppdelat på Kön. Ett sätt att göra det är att

    t.ex. först lägga Kön till Radområde och sedan Rökv till Radområde, och sedan Blodgrupp

    till Kolumnområde. Därefter läggs en av variablerna in i Dataområde, spelar ingen roll

    vilken. Se nedan.

  • 26

    3.6 Select file, dvs göra en tabell för en kategori av en annan variabel

    Antag att vi vill titta på Blodgrupp och Rökvanor, men bara för män. Ett sätt är att använda

    samma mall som i 3.5. Om man klickar på knappen vid Kön (se pil i fig ovan), visas fönstret

    nedan. Avmarkera Kvinna så visas bara Man som i bilden nedan till höger

    Ett annat sätt är att använda Sidområde i fältlistan.

    Lägg Rökv till Radområde, Blodgr till Kolumnområde, Kön till Sidområde och Rökv eller

    Blodgr till Dataområde.

    Klicka på den knapp som pilen visar. Man kan välja Man eller Kvinna, i detta fall är Man valt.

  • 27

    3.7 Ändra i tabell

    Uppdatera tabell: Observera att om du har gjort en tabell och därefter ändrat i data så ändras inte tabellen automatisk. Du behöver dock inte göra om tabellen. Högerklicka

    bara på tabellen och välj Uppdatera data, så uppdateras tabellen. Har du även om gjort

    ett diagram från tabellen så uppdateras den automatisk när tabellen uppdateras.

    Observera att om du gjort andra tabeller så uppdateras de också automatisk, förutsatt

    att dessa tabeller har skapats från den tabell du uppdaterar. Om inte, så måste de de

    tabellerna uppdateras var för sig.

    Fältlistan har försvunnit: Om man vill gå tillbaka till en tabell och göra om eller ändra i tabellen, visas inte alltid variablerna, variabellistan. Vänsterklicka på tabellen.

    Funkar inte det, högerklicka på tabellen och välj Visa fältlista

    Byta ut en variabel: Välj antingen Ångra om du nyss gjort tabellen, eller dra en variabel utanför tabellen och släpp. Om man t.ex. vill ta bort Rökv i tabellen ovan,

    klicka på det gråa fältet där det står Rökv, tryck och dra utanför tabellen (ett rött kors

    skall synas), och släpp. Så har du tagit bort den variabeln från tabellen. Observera att

    den fortfarande finns kvar i Fältlistan

    Missing eller andra kategorier: I data kan det finnas missing eller värden som är felaktigt inskrivna. Det ser du när du lägger in en variabel i t.ex. Radområde. Du får

    då förutom kategorierna Kvinna och Man andra kategorier, som tom och t.ex., Kvina.

    Värden som matats in fel ändrar man förstås i data. Därefter måste man uppdatera

    tabellen genom att högerklicka på tabellen och välja just Uppdatera för att

    ändringarna skall synas i tabellen.

    Man kan även avmarkera dessa alternativ genom att klicka på knappen vid

    variabelnamnet. Klicka då på den lilla rutan med en triangel vid variabel Kön.

    Avmarkera de kategorier du inte vill visa. I detta fall är tom lämplig att avmarkera.

    Däremot Kvina bör ändras i data så att den visas korrekt i tabellen.

  • 28

    Gör man en vanlig frekvenstabell (bara en variabel) på Kön kan det vara bra att det

    syns att det är missing. Då kan man förstås hantera det på samma sätt som Kvina, och

    byta ut tomma celler mot t.ex. texten Missing. Observera att det inte gäller

    kontinuerliga variabler som Ålder, Blodtryck, där man räknar medelvärde ed.

    Byta ordning på kategorier i radområde och kolumnområde: Man kan byta ordningen på kategorier, både på rad och kolumn.

    a) Klicka på den ena kategorin (tex. Kvinna) och kopiera, klistra in där det står Man. Då kommer kategorierna byta plats. Det som händer är att hela den övre

    raden/kategorin, flyttas och läggs under den andra. Det kan vara enklare att se

    vad som händer om det är fler än två kategorier, t.ex. med en tabell på Blodgr.

    Observera att det bara funkar i radområde.

    b) Ett annat sätt är att t.ex. skriva Man där det står Kvinna. Då kommer raden för Man och Kvinna byta plats. Detta funkar även på kolumnområde.

    Ändra typ av mått (summa,..): När man skapar en tabell i Excel så väljer den typ av mått. Det är inte alltid det är det mått man vill ha. För att ändra det, högerklicka på det

    fält där måttet står, t.ex. i exemplet ovan Antal av Blodgr. Välj Fältinställningar. Där

    finns olika alternativ.

    Ändra format: Anta att man har en tabell som visar medelvärde och visar fler decimaler än vad man vill ha . För att ändra det, högerklicka på fältet med måttet, eller

    på ett av värdena för måttet, välj Fältinställningar, därefter Tal (se bild ovan) så

    kommer man till Formatera celler. Menyn nedan till höger visas. Välj sedan t.ex.

    enligt nedan så ger det en tabell med där siffrorna har en decimal.

  • 29

    4. Diagram

    Diagram kan göras antingen via Infogadiagram eller via knappen .

    Det finns många diagram man kan göra, men det är inte alla som fungerar att göra direkt från

    data. Många kräver att du utgår från en tabell.

    Det finns (vad jag vet) tre sätt att göra diagram 1) Direkt från persondata 2) från en pivottabell

    3) från en manuellt skapad tabell. Kapitel 4.1 visar de olika menystegen när man gör diagram.

    Skapar man ett diagram från en pivottabell skapas diagrammet direkt, varför dessa steg ej är

    aktuella för en pivottabell.

    Vill man skapa diagram för kategorivariabler måste man först skapa en tabell.

    4.1 Skapa diagram från persondata

    För det mesta är det bara diagram baserade på kontinuerliga variabler som funkar här.

    Histogram kan inte göras direkt utan man behöver ett mellansteg. Tas inte upp här.

    Som exempel så väljer vi att göra ett diagram på Längd och Vikt.

    1) Välja variabler: Vilka variabler man vill göra diagram på väljer man enklast först. I exemplet, markera kolumn D med Längd (enklast är att bara klicka på D), tryck och

    dra till E så markeras både D och E.

    a. Vill man markera två kolumner som ej är bredvid varandra, håll ner Ctrl och markera de variabler/kolumner du vill använda.

    2) Klicka på diagram-knappen, eller via menyn InfogaDiagram. STEG 1: Diagramtyp Excel föreslår ett linjediagram. Tryck på knappen (se pil), för

    att se hur bilden kommer att se ut. Välj istället diagramtyp Punkt. Klicka sen på Nästa.

    a. Denna meny kan man få fram efteråt genom att högerklicka på det skapade diagrammet och välja Diagramtyp

    b. På samma sätt som när man skapar en pivottabell kan man här välja den korta vägen, dvs bara tryck på Slutför för att visa diagrammet. Det mesta kan man

    korrigera i efterhand.

  • 30

    3) STEG 2 vilket data: Tryck vidare till Nästa om variablerna redan har markerats. Om du inte har markerat några variabler skall du göra det nu.

    a. Denna meny kan man få fram efteråt genom att högerklicka på det skapade diagrammet och välja Källdata

    b. Testa att trycka på Rader. Det som händer är att Excel växlar mellan att läsa variablerna kolumnvis till att läsa dem radvis. Det är smidigt om data av någon

    anledning ligger ”fel håll”, speciellt stapeldiagram.

    c. Under fliken Serie kan man mer manuellt styra vad som skall plottas, te.x. om man vill dela upp diagrammet i Man och Kvinna. Lägg i så fall till en serie för

    Män och en för Kvinna. Se till att var och en läser från raderna för resp Kön.

    Tar ej upp mera från denna meny.

    4) STEG 3 Diagramalternativ Här finns kan man skriva in Titel, Namn på axlar mm. a. Denna meny kan man få fram efteråt genom att högerklicka på det skapade

    diagrammet och välja Diagramalternativ

    5) STEG 4 Diagrammets placering: Här kan man välja plats för diagrammet. a. Denna meny kan man få fram efteråt genom att högerklicka på det skapade

    diagrammet och välja Plats

    b. Väljer man Som nytt blad kan man döpa ett nytt blad. Diagrammet kommer sen att uppta hela fönstret i det bladet.

    c. Väljer du istället Som objekt så kan man lägga diagrammet i ett existerande blad. Om det bladet redan har information kommer diagrammet att kunna

    flyttas och ändras i storlek (se 4.4). Är bladet tomt funkar det som Nytt blad.

    Välj sedan Slutför för att skapa diagrammet.

  • 31

    4.1.1 Punktdiagram

    Här visas en exempel på diagram. Följer man exemplet från 4.1 så valdes ett punktdiagram av

    Längd och Vikt. Nedanstående figur är kopierat från Excel. (klicka bara på diagrammet i

    Excel, välj RedigeraKopiera ovs.)

    1) Först skall vi lägga till titel, och namn på axlarna. Högerklicka på diagrammet, välj Diagramalternativ och skriv in ”Punktdiagram av Längd och Vikt” under

    Diagramrubrik, Längd under Värdeaxel (X) och Vikt under Värdeaxel (Y) sedan OK

    2) För att få korrekt bild av sambandet bör skalan båda axlarna starta från 0. Men Som övning skall vi ändra på dem. Högerklicka eller dubbelklicka på siffrorna eller linjen

    på respektive axel och välj fliken Skala. Ändra minimum på Längden till 150 och

    minimum på Vikt till 40.

    3) Därefter, i menyn välj DiagramInfoga trendlinje. Observera att diagrammet måste vara markerat för att menyn Diagram skall synas. Välj sen fliken Typ. Typen Linjär

    skall vara markerad, vilket är den vi vill ha. Klicka också på fliken Alternativ och

    kryssa i Visa R-kvadratvärde i diagrammet. Därefter OK.

    Diagrammet är lämpligt för att se linjära samband. R-kvadrat (R2) talar om hur stor andel av

    variationen i Vikt som kan förklaras av variabeln Längd. Den kallas också förklaringsgrad.

    Vikt

    0

    20

    40

    60

    80

    100

    120

    0 50 100 150 200 250

    Vikt

    Punktdiagram av Längd och Vikt

    R2 = 0,4474

    40

    50

    60

    70

    80

    90

    100

    110

    150 160 170 180 190 200Längd

    Vik

    t Vikt

    Linjär (Vikt)

  • 32

    Korrelationen (Pearsons linjära korrelationskoefficient) är kvadraten på R-kvadrat t.ex. om vi

    har en linjär korrelation på 0,5 så motsvarar den ett R-kvadrat på 0,25.

    4.2 Diagram från pivottabell

    Utgångspunkten är man har skapat en pivottabell. Se kapitel 3.2-3.4. Testa att göra diagram

    från dessa tabeller, eller skapa nya tabeller.

    1) Klicka någonstans i tabellen. Klicka på knappen för diagramguiden, eller gå via Infoga Diagram.

    Ett diagram kommer automatisk att skapas. Vilken typ beror på vad det är för typ av

    tabell. En vanlig korstabell ger ett stapeldiagram.

    2) Vill du ha en annan diagramtyp, högerklicka i figuren och välj Diagramtyp. Du kan sen trycka på knappen ”Håll nere för att se ett exempel” så ser du hur diagrammet

    kommer att se ut. Se 4.1 2).

    3) Vill du att diagrammet och tabellen skall finnas i samma blad, bestäm först till vilken blad diagrammet skall flyttas:

    Högerklicka och välj Plats, därefter Som objekt i: Välj förslagsvis det blad där du har

    skapat pivottabellen.

    I övrigt se 4.5.

  • 33

    4.3 Diagram från manuellt skapad tabell

    Man kan också skapa diagram från manuellt skapade tabeller i Excel. Här visas några

    exempel på hur man kan lägga upp manuella tabeller. För att göra diagrammen, markera först

    hela fältet kring tabellen, klicka på knappen för diagramguiden, eller via Infoga Diagram.

    Lämplig diagramtyp för dessa är Stapeldiagram.

    Byt ut till siffrorna till procent om man vill ha det i andelar.

    Tabell 1 ger samma resultat vare sig fråga 1 är på rad eller kolumn

    Tabell 2 och 3 är samma tabell men rader och kolumner har växlats.

    Tabell 4 och 5 är samma tabell men rader och kolumner har växlats.

    Ramen runt varje tabell är bara för syns skull

    Jämför tabell 2 och 3, eller 4 och 5. Testa t.ex. att högerklicka på tabell 4, välj Källdata och

    välj Serie i: Kolumner. Hur ser den ut i förhållande till ett diagram för tabell 5?

    Längst ner visas en slags mall på hur variabelnamn resp kategorier kan skrivas för en 2*2

    korstabell, utifrån tabell 5.

  • 34

    4.4 Histogram

    Ett histogram är ett slags stapeldiagram som visar intervalldata. Data med Kolesterol 1 har

    värden mellan 2,7 och 6,4. Säg att man vill se hur många som har värden mellan 2-3, 3-4, 4-

    5,… dvs om man skapar en intervall med 1 enhet inom varje intervall.

    I statistikprogram som SPSS kan Histogram göras direkt från originaldata. I Excel måste man

    först skapa en frekvenstabell som visar gränserna för intervallen och många värden som faller

    inom respektive intervall. Därefter kan man göra diagram från tabellen.

    För att göra det används ett tillägg Analysis Toolpak. I den finns det menyer för olika test

    mm, bl.a. histogram. För att ta fram menyn, gå till Verktyg Tillägg, kryssa i Analysis

    Toolpak, tryck Ok. Nu bör det finnas ett nytt alternativ längst ner i menyn för Verktyg,

    VerktygDataanalys.

    Skapa frekvenstabell och diagram

    1) Skapa först en ny variabel. Kalla den t.ex. Kolesterol 1 kat. Här har jag valt kolumn P. 2) Skriv in de gränser man önskar på intervallen. Här väljer jag heltal mellan 3 och 6, dvs

    respektive intervalls övre gräns är 3,4,5 och 6. Den kommer automatiskt att skapa ett

    intervall till med de värden som är högre än den sista gränsen.

    3) Välj VerktygDataanalys och sedan Histogram

    4) Under Indata skall kolumnen för Kolesterolvärdena läggas in. Klicka först i rutan och sen på variabeln för Kolesterol (Det räcker med att klicka på I).

    I Fackområden skall man skriva in vart värdena för intervallgränserna ligger.

    Klicka även i Etiketter.

  • 35

    a. Klickar man även i Diagramutdata så får man även ett diagram. Diagrammet kan man också göra i efterhand

    b. OBS: För Fackområde, markera bara området där det finns data. Man kan markera hela kolumnen också, men av ngn anledning förstår inte Excel att den

    bara skall läsa till rad 5, vilket gör att det tar mycket längre tid för Excel att

    skapa histogrammet.

    5) Trycker man Ok så skapas en tabell med antalet värden som faller inom respektive intervall.

    Får man bara fram tabellen så är det bara att markera tabellen och skapa diagrammet, som

    i. 4.3)

    Här ser man att med fyra intervallsgränser blir det fem intervall, eftersom det skapas ett

    intervall för de som är över 6.

    Tolkning: Värdet 2 betyder är att det är två värden som är 3 eller lägre, det är elva värden

    som är större eller lika med 3 men mindre än 4. ovs. Så värdet under respektive stapel

    anger övre gränsen på intervallet.

    Vill man vara mer tydlig kan man ändra namnet på kategorin. Ändra bara i tabellen så

    ändras också motsvarande fält i diagrammet. För att skilja dem så skriver jag också med

    en decimal.

    Observera att du inte bara skriva 3-4 för då tolkar Excel det som datum. Om det händer,

    markera och högerklicka i cellerna, välj Formatera celler välj Tal och sedan Text så tolkar

    Excel det som text.

  • 36

    4.5 Ändra i diagram

    Högerklickar man i ett diagram får man fram olika alternativ, av vilka många av dem är

    samma som kommer upp i STEG 1-STEG 4 i 4.1) när man skapar diagrammet.

    OBS: Får du inte fram nedanstående alternativ, utan en annan meny, klicka igen. Det kan

    ibland vara känsligt med vart man klickar i diagrammet.

    1) Diagramtyp 2) Källdata: Här kan man ändra data och t.ex. ändra så att den läser variablerna i rader

    istället för kolumner

    3) Diagramalternativ: Om du vill lägga till text (Titel, namn på axlar) 4) Plats: Om du vill flytta diagrammet till ett annat blad

    Ändra på värden på axlar; Dubbelklicka bara på värdena eller linjen på x-axeln eller y-axeln.

    o Ändringar på vart den skall starta och sluta görs under Skala. o Ändra på antalet decimaler görs under Tal. Välj sedan Kategori: Tal och sedan

    antal decimaler.

    o Om man vill ta bort skalstreck gör man det under Mönster, välj Inga under Huvudskalstreck och/eller Delskalstreck

    Uppdatera diagram: Om diagrammet är skapad direkt från data uppdateras diagrammet automatisk när något i data ändras. Är diagrammet baserat på en

    pivottabell uppdateras diagrammet automatisk när tabellen uppdateras eller ändras.

    Observera att det också gäller om du t.ex. väljer ut bara kvinnor ur tabellen

    (se 3.6)

    1) Testa att klicka i tabellen, på rutan vid Kön. Avmarkera Man och se vad som händer med diagrammet.

    2) Markera sedan Man igen.

    Slutföra diagram/Snygga till: För att slutligen snygga till diagrammet, högerklicka på ett av de gråa fälten i diagrammet (t.ex. om det står Data, Summan av.., Antal av

    kön, ed) i diagrammet. Välj Dölj knappar för pivotdiagramfält .

    o Vill man ta tillbaka knapparna, klicka på menylisten Pivotdiagram (se nedan) och avmarkera Dölj knappar…….. Observera att diagrammet måste vara markerat för

    att menyn skall synas.

    Olika färger på staplar: Om man gör ett stapeldiagram för en variabel får man oftast samma färg på alla staplar. Detta kan ändras. Dubbelklicka på en av staplarna, Välj

    fliken Alternativ, kryssa i Variera punktfärg olika färg på staplarna. Är man inte

    nöjd med färgerna, vänsterklicka på den stapel man vill ändra två ggr (första gången

    markeras alla staplar, andra gången bara den du klickar på), högerklicka och välj

    Formatera datapunkt, välj sedan Mönster och du kan nu ändra färgen på stapeln.

    Under Alternativ kan du ändra bredden på staplarna

  • 37

    5. Statistiska metoder i Excel

    I Excel finns det lite statistiska verktyg, dels 1) via Excels funktioner, 5.1 och dels 2) via

    Dataanalys, 5.2 I allmänhet får man fram statistik smidigare via Dataanalys.

    Vill man ta fram viss statistik, t.ex. medelvärde, direkt i anslutning till bladet med data kan

    5.1 vara lämpligare.

    Vill man t.ex. ta fram en tabell med beskrivande statistik, få det mer samlat i ett annat blad

    kan 5.2 vara lämpligare.

    5.1 Statistiska funktioner och funktioner för hela variabler

    Vilka dessa funktioner är ses enklast om man söker på statistiska funktioner i Hjälp.

    Dessa funktioner skiljer sig från de som nämndes i kapitel 2.5. Om vi t.ex. vill se hur många

    som är över 30 år kan man först skapa en ny variabel som är 1 om en person är över 30 år och

    0 om personen är under (se 2.5). Alltså ett nytt värde för varje person. Därefter kan man skapa

    en tabell på den nya variabeln och ser då hur många i gruppen som är över 30.

    Man kan också göra en formel som direkt tar fram hur många i gruppen som är över 30.

    De funktioner som nämns nedan skapar ett värde för hela gruppen.

    De som kan var aktuella är

    MEDEL, KONFIDENS (konfidensintervall), KORREL eller PEARSON (Pearsons linjära

    korrelationskoefficient), MEDIAN, MAX, MIN, TTEST (Både för parat och två oberoende

    grupper), STDAV (Standardavvikelse)

    Andra funktioner som kan vara av intresse är

    ANTAL.TOMMA – Visar hur många rader av en viss variabel som inte har något värde

    ANTAL.OM – Här kan man t.ex. välja hur många av en vissa variabel/kolumn som antar ett

    visst värde, t.ex. om Ålder finns i kolumn C, hur många är över 30 år. Det skrivs

    =ANTAL.OM(C2:C41;">30") vilket ger 25, dvs 25 personer är över 30 år. Om man vill kolla

    ett värde i en specifik cell får man skriva =ANTAL.OM(C2:C41;">” & C2) .

    Hur gör man Om man te.x. vill räkna ut medelvärdet för Ålder i en cell nedanför data så

    räcker det ofta med att sätta markören nedanfördata, välj Autosumma i menyn, välj MEDEL,

    tryck Enter, så räknas medelvärdet ut.

    Man kan också göra det steg för steg. Skriv

    - =MEDEL(

    - Markera data för Ålder, eller skriv in gränserna

    - Avsluta med ) och tryck Enter få får ni medelvärdet

    - Det ger formeln =MEDEL(C2:C41)

    Om man sen kopierar formeln i cellen och kopierar den till nästa kolumn på samma rad, så får

    man medelvärdet på samma individer i nästa kolumn, i detta fall variabeln Längd.

    Man kan också göra som i 2.3, klicka i cellen (där formeln är inskriven) klicka på korset i det

    nedre högra hörnet och dra det till höger, så kopieras formeln till de celler du drar formeln.

    Vill man inte att rader och/eller kolumner skall ändras när man kopierar formeln kan man

    skriva - ANTAL.OM($C2:$C41;">30"), vilket betyder att om du kopierar formeln och

  • 38

    klistrar in den någon annanstans i Excel så är kolumnerna låsta, dvs läser fortfarande från

    kolumn C. Motsvarande gäller för rader om man skriver ANTAL.OM(C$2:C$41;">30").

    Kombinerar man dem ($C$2:$C$41) så läses både rad och kolumn.

  • 39

    5.2 Statistik via Dataanalys

    I Excel finns ett tillägg som heter Analysis Toolpak. I den finns det menyer för olika test

    mm. För att ta fram den, gå till Verktyg Tillägg, kryssa i Analysis Toolpak, tryck Ok.

    Nu bör ni ha ett nytt alternativ, längst ner, VerktygDataanalys.

    Nedanstående metoder finns:

    Jag visar principen för att göra beskrivande statistik och t-test för parade observationer och

    två oberoende grupper som antar olika varians. Tillvägagångssättet är ungefär densamma på

    de andra.

    Chi2-test finns ej med som verktyg i denna. Korrelation finns, men den tar inte fram p-värde.

    Om man t.ex. gör en analys som t-test på oberoende grupper eller variansanalys använder

    statistikprogram som t.ex. SPSS en variabel för mätvärde och en variabel som talar om vilken

    grupp man tillhör. I Excel funkar inte det, utan man behöver en kolumn för varje grupps

    mätvärden. Man behöver då förslagsvis kopiera respektive grupps värden till en kolumn

    vardera.

    Resultaten från verktygen ovan läggs smidigast i ett nytt blad. Antingen behåller man det så

    eller samlar delar eller allt i ett blad. Vill man samla in det i samma blad är det klippa och

    klistra som gäller.

  • 40

    5.2.1 Beskrivande statistik

    VerktygDataanalys

    1) Väljer du Beskrivande Statistik så visas nedanstående fönster.

    2) Sätt markören i fältet för Indataområde, a. Klicka på C i bladet med data så markeras hela kolumnen C. b. Vill man välja flera variabler samtidigt, t.ex. både Ålder, Längd och Vikt.

    Klicka på C och dra till E så markeras C tom E.

    Observera att man bara kan välja variabler som ligger bredvid varandra

    3) Klicka också i Etiketter i första raden och Summeringsstatik. Minst en av de fyra nedersta alternativen måste väljas.

    4) Välj vart du att resultatet skall visas, t.ex. i ett Nytt kalkylblad. Alternativet Utdataområde innebär att du markerar en plats i nuvarande blad, inte på valfri plats i

    ett nytt blad.

  • 41

    5.2.2 T-test för parade observationer

    Använd VerktygDataanalys och därefter Parat två-sampel för medelvärde

    Här har vi valt variabeln Kolest1 och Kolest2. Dessa är parade eftersom varje person har både

    ett värde för Kolest1 (före) och för Kolest2 (efter). Dessa är i kolumn I respektive J.

    Sätt markören i Variabel 1-område och markera kolumn I. Upprepa för det för Variabel 2-

    området.

    Gör sen enligt nedanstående. Antagen medelvärdesskillnad är här 0, eftersom vi antar att de

    båda variablerna har samma medelvärde, dvs ingen skillnad i medelvärde mellan mätning 1

    och 2. Defaultvärdet är också 0, varför man inte behöver skriva något i det fältet.

    Kryssa i Etiketter, dvs att första raden betår av variabelnamn

    Resultatet blir: Se nästa sida

    t-test: Parat två-sampel för medelvärde

  • 42

    Kolest1 Kolest2

    Medelvärde 4,5 4,66

    Varians 0,8538462 0,797846

    Observationer 40 40

    Pearson-korrelation 0,9562129 Antagen medelvärdesskillnad 0

    fg 39

    t-kvot 3,7394108

    P(T

  • 43

    5.2.3 T-test för två oberoende grupper

    Använd VerktygDataanalys och därefter t-test: 2 Sampel antar olika varians

    T-test för två oberoende grupper innebär t,ex. att jämföra Kolest1 mellan Män och Kvinnor. I

    ett t-test i statistikprogrammet SPSS väljer man en variabel där mätvärdena finns (Kolest1)

    och en variabel som talar om vilken grupp respektive person tillhör (Kön). I Excel används

    inte Kön som variabel, utan man måste skapa en variabel för mätvärden på Kolest1, dels för

    män och dels för kvinnor.

    Här finns det två alternativ, dels 2 Sampel antar olika varians och dels 2 Sampel antar lika

    varians. Vi väljer här olika varians. Olika varians innebär att vi antar att spridningen i

    mätvärdena för Män är större eller mindre än för Kvinnor. I statistikprogram som t.ex. SPSS

    visas båda i samma t-test, men där antagandet om lika varians testas. Är man osäker här, välj

    olika varians. Är spridningen lika som kommer testen ge ungefär samma svar.

    Det man behöver göra är att kopiera männen och kvinnornas värden till två olika kolumner, i

    samma eller i ett nytt blad. Skriv Man resp. Kvinna på rad 1 i 2 kolumner och mätvärdena

    under. Se vänster figur nedan. Lägg sedan in det på samma sätt som i 5.2.2. Se höger figur

    nedan.

    För att få ut respektive köns värden är ett sätt att sortera data på kön, se 2.6 och 2.7. Här

    använder vi Filter (se 2.7), sorterar data på Kön, och kopierar sedan respektive köns värden.

    Du kan också bara markera bara de rader i variabeln Kön som tillhör kvinnor och män från

    samma kolumn då testet skapas, men då kommer man inte att se vilka värden som är Man

    respektive Kvinna i resultatet. Jag rekommenderar inte den varianten.

  • 44

    Utskriften tolkas ungefär som parat t-test. Skillnaden är att vi nu har två grupper med värden,

    vardera med ett beräknat medelvärde och spridningsmått (standardavvikelse eller varians). Ju

    större medelvärdesskillnad, ju mindre spridningen i respektive grupp och ju fler individer i

    respektive grupp, desto större testvärde (lägre p-värde), och desto större ”chans” att erhålla en

    statistiskt signifikant skillnad mellan grupperna.

    6. Övningar i Excel 2003

    Uppgifterna är kopplade till kompendiet Litet kompendium om Excel 2003 som statistiskt

    statistik

    Variabler i data: Vissa variabler är tagna från annat data medan andra är simulerade. Alkov

    tolkas som ett mått på alkoholkonsumtion. Kolest1 och Kolest2 kan ses som mätning av

    kolesterol vid två tidpunkter, t.ex. före och efter en intervention. S-gt är en alkoholmarkör.

  • 45

    1) I data finns inte variabeln Person inlagd. Den är bra att ha, speciellt om man behöver sortera data och vill sortera tillbaka i en ursprungsordning.

    Lägg till variabeln Person (Tanken är inte att ni manuellt skall lägga in sifferserien.)

    Använd kapitel 2.2 och 2.3

    2) Nu vill vi skapa två variabler, dels en med BMI på personerna, och dels en variabel som visar hur många som har mer än 6 i kolesterolvärde för Kolest1.

    Skapa båda dessa variabler.

    Använd kapitel 2.6 och 2.6.1.

    (Om man vill kan man använda kapitel 2.8 bara för att selektera de som har över 6 i

    Kolesterol, bara för att undersöka hur många det är)

    3) Hur många är rökare i data? a. Ta fram en tabell för Rökare, Namnge bladet Rökare.

    Använd kapitel 3.1.1 och 3.2.

    b. Är det lika många män som kvinnor? Ta fram en tabell för det också. Lägg den tabellen under den föregående. Lägg nu till variabeln Rökv i kolumnfältet för

    att bedöma hur fördelningen för rökare är mellan könen.

    Använd kapitel 3.1.2 (för att lägga tabellen i samma blad som a), och

    kapitel 3.3 för korstabellen.

    c. Ändra nu så att tabellen i b) visar procent av Kön, så man ser andelen rökare bland Kvinnor och Män.

    Använd kapitel 3.3.

    4) Vi är fortfarande intresserade av rökare. a. Hur många rökare finns det bland de olika blodgrupperna (Kanske inte alltför

    intressant, men för den här övningen säger vi det). Gör en korstabell på dessa

    två variabler.

    Man är också intresserad av att se antalet för respektive Kön. Lägg därför först

    in Kön i Radområde innan du lägger in de andra. Du skall alltså ha två

    variabler på radområdet.

    Använd kapitel 3.5 (3.3 om man vill se mer om korstabell)

    b. Testa att använd Kön i Sidområde. Man kan använda den för att selektera en kategori av t.ex. Kön.

    Använd kapitel 3.6

    5) Är det någon skillnad mellan könen i andelen med Kolesterol över 6?

    Använd kapitel 3.1 och 3.3 Utgångspunkten här är att man har skapat en variabel med två kategorier, ”> 6” eller

  • 46

    7) Diagram på pivottabeller. Namnge först bladen med tabeller från uppgifterna ovan. Gör ett diagram av de tabeller du gjort i uppgifterna i 4)-6).

    Använd kapitel 4.2.

    Om du vill, testa att ändra i diagrammet. I kapitel 4.4 finns några punkter på vad man kan göra.

    8) Finns det något samband mellan Längd och Vikt? Tanken är bara att man skall bedöma detta utifrån diagrammet.

    a. Gör en bedömning utifrån ett punktdiagram. Ändra sen skalan på Längd (te.x. minimum 150) och Vikt (t.ex. minimum 40). Lägg in namn på axlarna.

    Använd kapitel 4.1, 4.1.1 för diagrammet och kapitel 4.4 för ändringar i diagram.

    b. För en bättre bild av sambandet mellan variablerna, lägg till trendlinje.

    Använd kapitel 4.1.1. Bedöm sambandet!

    I följande uppgifter skall ett tillägg i Excel användas. Det är inget som behöver installeras.

    Använd 5.2 för att lägga in tillägget

    9) För att få en bild av materialet, ta fram beskrivande statistik för Ålder, Längd och vikt.

    Använd kapitel 5.2.1

    10) Är det någon skillnad i medelvärde på Kolesterol före och efter?

    Använd kapitel 5.2.2

    11) Hur ser fördelningen på Kolesterol 1. Testa att göra ett histogram.

    Använd kapitel 4.4

    12) Är det någon skillnad i medelvärde på Kolesterol 1 mellan män och kvinnor.

    Använd kapitel 5.2.3

    7 Länkar

    Youtube –klipp på hur man kan göra chi2-test i Excel, Performing a chi squared test in Excel

    https://www.youtube.com/watch?v=ODxEoDyF6RI

    chi-2 test via webben: http://graphpad.com/quickcalcs/contingency1.cfm

    https://www.youtube.com/watch?v=ODxEoDyF6RIhttp://graphpad.com/quickcalcs/contingency1.cfm

  • 47