36
2010- 2011 Eerste Bachelor Criminologie Cindy Stevens [STATISTIEK IN DE CRIMINOLOGISCHE WETENSCHAP ]  

2010-2011 Statistiek

Embed Size (px)

Citation preview

Page 1: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 1/36

2010-2011

Eerste BachelorCriminologie

Cindy Stevens

[STATISTIEK IN DECRIMINOLOGISCHE

WETENSCHAP] 

Page 2: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 2/36

DDEELEEL 1: G1: GESCHIEDENISESCHIEDENIS VANVAN DEDE ((CRIMINELECRIMINELE)) STATISTIEK STATISTIEK  

DDEELEEL 2: I2: INLEIDENDENLEIDENDE BEGRIPPENBEGRIPPEN 

IINLEIDINGNLEIDING

Objecten/onderzoekseenheden = de personen of zaken waarover je iets zegt; overwie/wat je obv het onderzoek een uitspraak doet.

Variabelen = kenmerken zoals leeftijd, geslacht, studiekeuze…

Onderzoekspopulatie = de verzameling van individuen waarover we een uitspraakwillen doen

Steekproef = een staal uit de onderzoekspopulatie (we kunnen niet alle Belgentussen 15 en 90 jaar ondervragen)

Respondenten = de personen die we uiteindelijk bevraagd hebben;deelverzameling van de onderzoekspopulatie

Representativiteit = een kenmerk in de steekproef komt evenveel voor als in deonderzoekspopulatie

BBESCHRIJVENESCHRIJVEN,, SCHATTENSCHATTEN ENEN

VERALGEMENENVERALGEMENEN ALSALS STATISTISCHESTATISTISCHE

BEDRIJVIGHEIDBEDRIJVIGHEID

Statistiek = het geheel van regels en procedures om gemeten kenmerken te

verwerkenBeschrijvende statistiek = het op een overzichtelijke ensamenvattende/synthetische manier weergeven van kenmerken die voorkomen ineen onderzoekspopulatie of steekproef, wanneer we niet alle eenheden kunnenbevragen

- Laat toe gegevens te beschrijven voor een groep personen of andereeenheden die onderzocht werden. De resultaten kunnen niet veralgemeendworden naar andere personen of eenheden, tijden.

- Biedt momentopname die uitsluitend geldig is voor de onderzochte groep- Laat niet toe causaliteit vast te stellen

Inductieve/inferentiële statistiek = het veralgemenen van de gegevens verzameldvoor een steekproef naar de onderzoekspopulatie waaruit ze getrokken werden

Hypothesen = veronderstellingen; specifieke stellingen betreffende de causalerelatie tussen 2 of 2+ concepten, die afgeleid zijn uit de theorie

 Toetsbare stellingen = criminologen kunnen bepaalde veronderstellingen hebben,vb over het voorkomen van een kenmerk in de onderzoekspopulatie of over desamenhang tussen een aantal kenmerken.

Onderzoekshypothese = formuleert de betrokken stelling in een positieve zin, dwz

in de richting van de verwachtingen van de onderzoeker

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 2

Page 3: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 3/36

Nulhypothese = de omkering van de onderzoekshypothese; de hypothese dat ergeen verband bestaat tussen de kenmerken die men onderzoekt

Alternatieve hypothese = indien we vaststellen dat de nulhypothese magverworpen worden, concluderen we (voorlopig) dat onze onderzoekshypothese (nualternatieve hypothese) opgaat

SS TATISTIEK  TATISTIEK  ENEN DEDE BEANTWOORDINGBEANTWOORDING

VANVAN BESCHRIJVENDEBESCHRIJVENDE ENEN

VERKLARENDEVERKLARENDE ONDERZOEKSONDERZOEKS--VRAGENVRAGEN

Beschrijvende onderzoeksvraag = betreft de kwantitatieve beschrijving van eenfenomeen onder studie

Verkennend onderzoek = gaat verder dan enkel beschrijven; ze heeft betrekking

op het aftasten van (nieuwe) veronderstellingen

Verklarende onderzoeksvraag = op gericht geobserveerde verschillen of veranderingen in uitkomstvariabelen te gaan verklaren vanuit kenmerken dieeigen zijn aan een theoretisch paradigmaVerklarend onderzoek wil een statistische verklaring bieden voor de geobserveerdeverschillen tussen eenheden obv één of meerdere kenmerken van die eenheden.

SS TATISTISCHE TATISTISCHE EENHEDENEENHEDEN

Statistische eenheden = de onderzoekseenheden waar men een uitspraak over wildoenDeze eenheden kan men beschrijven adhv een aantal kenmerken, waarin deonderzoeker geïnteresseerd is.

Variabelen = de kenmerken van statistische eenheden die variëren en dieverschillende scores hebben op een bepaald kenmerk

Variabiliteit/spreiding = er is vb spreiding in crimineel gedrag wanneer deverschillende onderzoekseenheden met een verschillende frequentie crimineelgedrag vertonen

Voldoende spreiding = dat er per kenmerk tenminste twee verschillende waardenzijn en dat de eenheden verspreid zijn over deze categorieën of waarden van diekenmerken

Indien de spreiding onvoldoende is over de verschillende categorieën vanvariabelen kan men soms beslissen het kenmerk uit het onderzoek te schrappen,het aantal eenheden in de steekproef op te drijven of de probleemstelling teherzien

UUNIVARIATENIVARIATE,, BIVARIATEBIVARIATE ENEN MULTIVARIATEMULTIVARIATE BESCHRIJVENDEBESCHRIJVENDE

ANALYSEANALYSE

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 3

Page 4: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 4/36

Univariate analyse = een analyse van één kenmerk dat varieert. Het komt eropneer de verdeling van een kenmerk accuraat te beschrijven

Bivariate analyse = wanneer 2 variabelen (x en y) met elkaar in verband gebrachtworden

Multivariate analyse = wanneer je 2+ variabelen gebruikt (komt niet aan bod indeze syllabus)

Onderzoeksvragen in de kwantitatieve criminologie worden behandeldadhv univariate, bivariate en multivariate analyses

MMEETNIVEAUEETNIVEAU VANVAN VARIABELENVARIABELEN

Het nominale en ordinale meetniveau vormen samen het categorische meetniveau,terwijl het interval en ratio meetniveau samen het metrische meetniveau vormen.

Nominale meetniveau = op basis van een bepaald kenmerk sorteren enbeslissingen nemen over wie hetzelfde kenmerk heeft en wie hiervan verschiltEr is geen sprake van een rangorde, ookal worden de categorieën voorgesteld dooreen getalNationaliteit en geslacht bijvoorbeeld zijn altijd nominaal

Exclusiviteit = de categorieën mogen elkaar niet overlappen; hetclassificatiesysteem verliest zijn bruikbaarheid als de te classificeren data kunnenworden ondergebracht in meer dan 1 categorie

Exhaustiviteit = het classificatiesysteem dient alle bestudeerde data te omvatten;maw elk geval moet in een categorie kunnen worden gebracht

Ordinale meetniveau = kenmerkt zich door het principe van de ordenbaarheidvan de categorieënWe zijn ook in staat (los van te classificeren) de categorieën onderling terangschikken

Dichotomie = een variabele die slechts 2 waarden kan aannemen

Polytomie = een variabele die meer dan 2 waarden kan aannemen

Intervalniveau = niet enkel sprake van rangordening, maar de intervallen tussen

de verschillende waarden die een variabele kan aannemen, hebben ook eenbetekenis. Vb temperatuur

Rationiveau = het niveau waarbij sprake is van rangordening en waarbij deintervallen betekenis hebben en er een natuurlijk nulpunt aanwezig is. Op ditniveau is nul ook werkelijk een absoluut, niet-arbitrair nulpunt. Vb lengte, gemetenin cm

DDISCRETEISCRETE ENEN CONTINUECONTINUE

VARIABELENVARIABELEN

Continue meetschalen = hierbij kunnen alle mogelijke waarden die uitkomst zijnvan de meetprocedure: niet enkel de waarde 1 en 2, maar ook 1,2 en 1,75

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 4

Page 5: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 5/36

Discrete meetschaal = beperkt tot een telbaar aantal waardenEen continu verschijnsel wordt vaak toch met een discrete meetschaal gemeten,maar dan hebben tussenliggende waarden wel een betekenis (enkel “ronde”getallen)

DDEE DATAMATRIXDATAMATRIX ALSALS INPUTINPUT

VOORVOOR STATISTISCHESTATISTISCHE ANALYSEANALYSE

Datamatrix/gegevensmatrix = bevat de info van elke statistische eenheidwaarvoor men info heeft verzameld

Codeboek = een lijst waarin uitgelegd staat welke inhoudelijke betekenis wordtgegeven aan de numerieke code

AAFRONDINGSREGELFRONDINGSREGEL VOORVOOR

STATISTISCHESTATISTISCHE GEGEVENSGEGEVENS

Men rondt naar beneden af van 1 tot 5Men rondt af naar boven van 6 tot 9

NNOTATIESYSTEEMOTATIESYSTEEM ININ STATISTIEK STATISTIEK 

ENEN ALGEMENEALGEMENE AFSPRAKENAFSPRAKEN

Aggregatie = het sommeren of optellen van de waarden in de rijen binnen dekolommen. Deze wordt aangegeven met het sigmateken: ∑

AAFSPRAKENFSPRAKEN BIJBIJ PRESENTERENPRESENTEREN

 TABELLEN TABELLEN

We onderscheiden 2 tabellen:- Frequentietabellen = tellingen van hoe vaak iedere waarde van een

variabele voorkomt- Kruistabellen = tellingen van hoe vaak waarden van 2 variabelen in

combinatie met elkaar voorkomen

Een tabel heeft altijd:- een titel- een bronvermelding onderaan de gegevens

- een vermelding van de waarnemingseenheid- een vermelding van de variabelen- een vermelding van de meeteenheid- een logische en overzichtelijke indeling

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 5

Page 6: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 6/36

DDEELEEL 3: D3: DEE UNIVARIATEUNIVARIATE BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK  

IINLEIDINGNLEIDING

Datamatrix voor statistische analyse = bestaat uit één of meerdere metingen,scores of waarden voor verschillende individuen, objecten, gebieden of criminelegebeurtenissen.

Beschrijvende statistiek = de methodologie voor het organiseren ensamenvatten/beschrijven van de gegevens voor een steekproef of de gehelepopulatie

 Toegepaste technieken:- de onderzoeksvraag- het meetniveau van de kenmerken van de respondenten

Frequentieverdelingen en grafieken maken gegevens visualiseren ensamenvatten

= centrale tendensen worden duidelijk = bijzondere observaties (weinig voorkomende observaties) worden duidelijk

Algemene regel: de mogelijkheid die we hebben bij het laagstemeetniveau mogen ook gebruikt worden voor de hogere meetniveaus.Omgekeerd niet!

DDEE VERDELINGVERDELING VANVAN ÉÉNÉÉN KENMERK KENMERK ::ABSOLUTEABSOLUTE ENEN RELATIEVERELATIEVE

FREQUENTIEFREQUENTIE

Frequentietabel = een variabel (kenmerk) met de daarbij bijhorende waarden kunhe op een overzichtelijke manier hier presenteren

 Tellen van streepjes brengt je op de absolute frequentie

Men dient op basis van absolute frequenties de relatieve frequenties, depercentages,cumulatieve frequenties en de cumulatieve percentages kunnenberekenen.

De absolute frequentie van een waarde = het aantal elementen met een bepaaldewaarde van die variabele

Geldige percentages = percentages berekend op diegenen die een geldigantwoord hebben op de vraag

Cumulatieve percentages = de percentages van elke volgende waarde wordt bij devoorgaande opgeteld (k)

Cumulatieve frequenties = K 

Som van alle frequenties = n

Proporties = elke absolute frequentie delen door het aantal waarnemingenPercentages = proporties x100

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 6

Page 7: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 7/36

Het voordeel van het gebruik van relatieve frequenties en percentages is dat defrequentieverdelingen voor verschillende, niet even grote groepen personen betervergelijkbaar worden. Wanneer minstens op een ordinaal niveau werd gemeten,heeft het verder ook geen zin om de cumulatieve percentages weer te geven.

!!! Bevat de totale steekproef minder dan 30 eenheden, dan werkt men beter met absolute aantallen.

Incidentie = het aantal nieuwe gevallen van een bepaalde conditie dat voorkomt ineen populatie gedurende een bepaalde periode

Prevalentie = het totaal aantal personen in een bepaalde conditie in een populatieop een bepaald moment

IINDELINGNDELING ININ KLASSENKLASSEN VANVAN

KENMERKENKENMERKEN

Bij het samenvoegen van categorieën moeten we rekening houden met hetmeetniveau van de variabelen.

Hercoderen = diverse groepen samenbrengen dmv statistischeverwerkingspaketten

We zouden categorieën “akkoord” en “helemaal akkoord” kunnen samenvoegenals blijkt dat er één categorie is waar slechts weinig respondenten hebben opgeantwoord. Ordinale variabelen worden niet beïnvloed door de cijfers die wetoekennen aan klassen

Indeling van klassen van metrische variabelen:- indeling obv gelijke klasselengtes- indeling obv kwartielen- inhoudelijk relevante indeling

De eerste 2 zijn statistische indelingen, en steeds correct. Niet in alle gevallen aante bevelen!

Indeling obv klasselengtesKlassegrenzen = de grenzen van de intervallen

Klassebreedte = de lengte van elk interval

Klassemidden = vertegenwoordigd de gehele klasseOm het klassemidden te bepalen, moeten eerst klassegrenzen bepaald worden

Indeling obv kwartielenBij een indeling obv kwartielen wordt ervoor gezorgd dat er in elke klasse eenzelfde proportie van het totale aantal respondenten zit

Inhoudelijke indelingWanneer we geïnteresseerd zijn in slachtofferschap van minder- enmeerderjarigen, dan is de leeftijd slechts een indicator voor de minderjarigheid dan

wel meerderjarigheid. In dat geval kan men kiezen voor een inhoudelijke indeling.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 7

Page 8: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 8/36

GGRAFISCHERAFISCHE VOORSTELLINGENVOORSTELLINGEN

Grafische voorstelling = streeft naar het overbrengen van de informatie vancomplexe gegevens via beelden (tekeningen). Hierbij is het belangrijk dat hetgeconstrueerde beeld in overeenstemming is met de reële informatie in degegevens

 Taartdiagram/cirkelgrafiek/pie chart = obv verschillende frequenties/percentageswordt een cirkelschijf verdeeld in sectorenPopulair bij kenmerken op ordinaal en nominaal niveau. met beperkt aantal categorieën (verwarring voorkomen)Nominale variabelen willekeurige volgorde

Ordinale en metrische variabelen ordeningscriterium volgen

Staafdiagram = de gegevens worden op 2 assen voorgesteld

We plaatsen de staafjes los van elkaar wanneer de variabele nominaal of ordinaalis.Metrische variabele staafjes aaneensluiten (histogram)

Cumulatief frequentiediagram = absolute of relatieve frequenties kunnen wordenvoorgesteld in een cumulatief frequentiediagram, vanaf het ordinale niveau.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 8

Page 9: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 9/36

Wanneer de waarden in klassen zijn ingedeeld, zal het er anders uitzien. Bijindeling in klassen gaan we immers uit van de hypothese dat de waarnemingengelijkmatig verdeeld zijn over de verschillende klassen. Gevolg diagram geentrapfunctie maar gebroken lijn

Histogram = een veelgebruikte visuele voorstelling voor metrische kenmerkenSlechts één verschil met staafdiagram blokjes aan elkaar omdat de waarden vanX elkaar opvolgen. Door deze voorstelling wordt duidelijk gemaakt dat decategorieën op een continuüm liggen

Lijndiagram = de in niet klassen gegroepeerde gegevens worden visueelvoorgesteld door hun frequentie op een as aan te duiden en de punten vervolgensdmv een lijn met elkaar te verbinden.

Frequentiepolygoon = een lijndiagram voor in klassen gegroepeerde gegevens. Decategorieën worden voorgesteld door hun klassemiddens en punten gevormd doorhet aanduiden van de hoogte van de frequentie; met elkaar verbonden

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 9

Page 10: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 10/36

OOPGELETPGELET METMET GRAFISCHEGRAFISCHE

VOORSTELLINGENVOORSTELLINGEN

De wijze waarop men de x-as en y-as ijkt, is bepalend voor de mate waarin metdetaillering ziet in het verloop van de cijfers en dus ook voor de wijze waarop hetbeeld zal overkomen bij de lezer

PPARAMETERSARAMETERS VANVAN CENTRACENTRA--LITEITLITEIT

Parameters van centraliteit = geven een antwoord op beschrijvende

onderzoeksvragen

Centrale tendensen = vinden we door te kijken naar centrale waarden

Centrummaten = hanteren we wanneer we de frequentieverdeling willenkenmerken adhv een centraal gelegen waarde. Deze waarde wordt dan als eenrepresentatieve maat beschouwd die de volledige verdeling van de waarnemingenzo goed mogelijk karakteriseert

ModusCategorie van de variabele met de frequentie die het vaakst voorkomt. Aangeziende modus enkel verwijst naar de waarde met de hoogste frequentie is er geenenkel probleem om de modus te bepalen bij nominale variabelen, ordinale enmetrische variabelen.

Berekenen

MediaanHet midden van de verdeling

 Je moet minstens het ordinaal meetniveau hebben om de mediaan te mogengebruiken. Strikt genomen enkel van toepassing als n oneven is.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 10

Modus = meest voorkomende waarde

Page 11: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 11/36

 Berekenen

KwantielenInterpreteren, niet berekenenZie p. 56onderaan

Rekenkundig gemiddeldeGebruikt bij variabelen gemeten op het metrisch niveau (bij interval en ratio)Wordt verkregen door alle voorkomende waarden bij elkaar op te tellen envervolgens het totaal te delen door het aantal respondenten

Berekenen

Enkele belangrijke kenmerken:- enkel voor metrische variabelen- evenwichtspunt van de verdeling- geen robuuste maat (dus gevoelig voor uitschieters)- de som van alle afwijkingen tegenover het rek.gem is 0

Deviatiescores = de afwijkingen tegenover het gemiddelde Berekenen

Verantwoord kiezen tussen centrummaten

Belangrijk is te weten dat bij de berekening van het rekenkundig gemiddelde allewaarnemingen worden betrokken.Nadeel: extreme waarden beïnvloeden resultaten van het gemiddelde

PPARAMETERSARAMETERS VANVAN SPREIDINGSPREIDING

Parameters van spreiding = bieden een antwoord op beschrijvendeonderzoeksvragen die de ongelijke spreiding van criminologisch relevantefenomenen willen bestuderen

Variatieratio (VR)

De proportie waarnemingen die niet tot de modale categorie behoren. Ze neemt dewaarde van nul aan indien alle waarnemingen tot de modale categorie behoren.Een minder aangename eigenschap: er is geen maximumwaarde.

 

BerekenenDe variatieratio is hier 100%-75% oftewel 25%VR= 100%-modus (in %) of 1 –

modus (p)

Index van diversiteit 

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 11

Slachtofferschapafgelopen vijf jaar

Percentage

NietMinstens één maal deafgelopen vijf jaar

7525

Mediaan = (n+1)/2

Rekenkundig gemiddelde =n

 xx x x n

+++=

...21

Page 12: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 12/36

Spreidingsmaat gebaseerd op de relatieve frequenties van de categorieën, maarhet enige verschil is nu dat rekening wordt gehouden met de proportie vanwaarnemingen binnen iedere categorie of equivalentieklasse

Berekenen

Spreidingsmaat ‘d’ Drukt uit in hoeverre de modus afwijkt van de situatie waarbij alle eenheden zich inde modale klasse zouden bevinden

M = het aantal categorieën van een kenmerk

Pmo = relatieve frequentie van de modusklasse

Berekenen

VariatiebreedteHet verschil tussen de grootste en de kleinste waargenomen waarde

Berekenen

De variatiebreedte is een zeer rudimentaire parameter van spreiding. Ze geeftimmers enkel aan over welke afstand de waarnemingen verspreid zijn

Interkwartielafstand (K3-K1)Het verschil tussen het derde en het eerste kwartiel Berekenen

Interdeciel-afstand = het verschil tussen het negende en het eerste deciel

Spreidingsmaten op metrisch niveauZelfde principe bij metrische spreidingsmaten.Men bepaalt eerst het rekenkundig gemiddelde en gaat dan voor elke waarneming

en hun frequenties nu, hoever ze van het rekenkundig gemiddelde verwijderdliggen. De spreidingsmaten zijn niet zo robuust.

De gemiddelde absolute afwijkingDe som van de absolute waarden van de afwijkingen van elke waarde ten aanzienvan het rekenkundig gemiddelde, gedeeld door het aantal waarnemingen.

Niet berekenen

Variatie (sum of squares/var)De optelsom van de kwadraatafwijking geeft een indicatie van spreading: hoegroter de maat, hoe groter de verschillen tussen de statistische eenheden

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 12

ID = 1 – (f1*f1 + f2*f2 +f3*f3 +…fn*fn)

V= max x – min x

Page 13: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 13/36

Berekenen

SteekproefvariantieDe variatie gedeeld door het aantal onderzoekseenheden wanneer we overpopulatiegegevens beschikken en gedeeld door het aantal steekproefeenhedenminus 1

Berekenen

SteekproefstandaardafwijkingDe vierkantswortel van de steekproefvariantie

Berekenen

Variatiecoëfficiënt Laat toe de spreiding van verdelingen die worden uitgedrukt in verschillende

meeteenheden, te vergelijken.Wordt berekend door de standaardafwijking te delen door het rekenkundiggemiddelde

Berekenen

ZZELFELF UITREKENENUITREKENEN VANVAN GEMIDDELDEGEMIDDELDE,,VARIANTIEVARIANTIE ENEN STANDAARDSTANDAARD--

AFWIJKINGAFWIJKING

zie p. 69 (!)

PPARAMETERSARAMETERS VANVAN VORMVORM

Wanneer we vergelijking inzake vorm, kunnen we vaststellen dat verdelingenverschillen in de mate waarin zij afwijken van een symmetrische verdeling

Symmetrie kan enkel bestudeerd worden voor metrische meetschalen.

Symmetrie = als het rek.gem en de mediaan aan elkaar gelijk zijn

Positief asymmetrisch = als de verdeling een langere staart naar rechts heeft

(rek.gem > mediaan)

coëfficiënt positieve waarde

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 13

1

1

2

2)(

−=

∑ −=

n

i

n

i

 x x s

 s x x

 sn

i

n

i 21

2

1

)(=

−=

∑ −=

V= s/X

Page 14: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 14/36

Negatief asymmetrisch = langere staart naar links (rek.gem < mediaan) coëfficiënt negatieve waarde

Empirisch coëfficiënt van Pearson:- bereken het verschil tussen het gemiddelde en de mediaan

- deel deze waarde door de standaardafwijkingKurtosis/afplatting = de mate van afplatting van de gegevens rondom het rek.gem.de kurtosis wordt steeds met de standaardnormale of Gauss-verdeling alsstandaard vergeleken

DDEE BBOXOX-P-PLOTLOT

Box-plot = een overzichtelijke manier om gegevens vanaf ordinaal meetniveauvisueel voor te stellen; visuele weergave van de positie, spreiding en symmetrievan de verdeling.Vorm kan worden afgeleid uit de waarde van de mediaan, eerste en derde kwartiel.

Symmetrie afleiden uit verdeling van waarden rond de mediaan: liggen dewaarnemingen gelijk verspreid rond de mediaan, dan is de verdeling symmetrisch

Een box-plot laat toe de extreme waarden (uitbijters/outliniers) te detecteren

Samenstelling zie p. 72-73

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 14

Page 15: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 15/36

DDEELEEL 4: D4: DOELSTELLINGOELSTELLING VANVAN DEDE BIVARIATEBIVARIATE BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK  

DDOELSTELLINGOELSTELLING VANVAN DEDE BIVARIATEBIVARIATE

BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK 

Bivariate beschrijvende statistiek = gebruiken we indien we de relatie tussen tweekenmerken willen beschrijven

Doelstelling de belangrijkste aspecten van een relatie tussen twee veriabelensamen te vatten op een eenduidige en economische manier

Keuze hangt af van het meetniveau van de twee variabelen.

Een criminoloog kan twee soorten onderzoeksvragen stellen die kunnenbeantwoord worden adhv bivariate beschrijvende statistiek:

- oorzakelijke (etiologische) onderzoeksvragen- vragen naar samenhang, zonder uitspraken te doen over causale relaties

BBIVARIATEIVARIATE FREQUENTIEFREQUENTIE--VERDELINGVERDELING

Bivariate frequentieverdeling = de frequentieverdeling van twee kenmerken; zokunnen we nagaan of de frequentieverdeling van één variabele samenloopt met defrequentieverdeling van een ander kenmerk.Ze worden vooropgesteld adhv een kruistabel.

Kruistabel (contingentietabel) = een tabel waarin de categorieën van tweevariabelen tegenover elkaar worden uitgezet en waarin de waargenomenfrequentie van elke combinatie van categorieën vermeld staat.

Celfrequenties = geven aan hoeveel keer een bepaalde combinatie vancategorieën van variabelen voorkomen

Rijtotalen en kolomtotalen worden ook wel de marginalen genoemd

Marginalen = geven de univariate frequentieverdeling van de respectievelijkevariabelen weer

Steekproefomvang = de som van alle celfrequenties

Voor metrische variabelen ligt het iets moeilijker om te werken met eencontingentietabel. Bij metrische variabelen komen meestal heel veel verschillendewaarden voor.

Puntenwolk/scatterplot = grafische voorstelling van de frequentieverdeling vantwee variabelen die gemeten zijn op metrisch niveau. In een puntenwolk wordentwee variabelen tegen elkaar uitgezet door de waarden van de variabele X op deabscis te plaatsen, en de waarden van de variabele Y op de ordinaat te zetten.

SS YMMETRISCHE YMMETRISCHE ENEN ASYMMETRISCHEASYMMETRISCHE

RELATIESRELATIES  TUSSEN TUSSEN VARIABELENVARIABELEN

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 15

Page 16: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 16/36

Basisformat = de visuele vertaling van de onderzoeksvraag in de formelesymbolische taal die in de statistiek gebruikt wordt. Daartoe wordt een bepaaldnotitiesysteem gehanteerd.

Asymmetrische relatie = wordt veroorzaakt doordat de ene variabele een causaleinvloed uitoefent op de andere. X is een oorzaak van YEr is steeds een afhankelijke en een onafhankelijke variabele

De afhankelijke variabele wordt steeds voorgesteld met de hoofdletter Y en deonafhankelijke variabele steeds met hoofdletter X

Rechtstreeks effect = betekent dat een onafhankelijke variabele een rechtstreekseinvloed heeft op de afhankelijke variabeleSymmetrische relatie = hierbij kan men op theoretische gronden geen onderscheidmaken tussen de beide variabelen. Het enige wat we kunnen zeggen is dat debeide kenmerken samenhangen. Er bestaat een verband, maar we kunnen nietzeggen hoe de invloed verloopt

- ten eerste kan er sprake zijn van een wederzijdse (reciproke) invloed tussenbeide variabelen

- ten tweede kan er sprake zijn van een schijnverband. Dan is er sprake vaneen gemeenschappelijke oorzaak

- ten derde kan er een samenhang bestaan tussen twee variabelen omdatdeze indicatoren van hetzelfde begrip zijn

In dat geval vertonen beide metingen meetfouten en is de doorsnee het gevolgvan het gemeenschappelijke achterliggende theoretische kenmerk dat beideindicatoren delen.

HHETET VOORSTELLENVOORSTELLEN VANVAN

STATISTISCHESTATISTISCHE RELATIESRELATIES

VIAVIA EENEEN BASISFORMATBASISFORMAT

Om de statistische analyse overzichtelijk te houden is het verstandig hetbasisformat van een onderzoeksvraag te zoeken en schematisch voor te stellen.Hiervoor bestaat een notitiesysteem dat door sociale wetenschappers standaardgehanteerd wordt bij het visualiseren van onderzoeksvragen.Dit notitiesysteem is een taal die door onderzoekers overal ter wereld wordtbegrepen. Het is dus van belang deze taal te kennen.

Stochastische afhankelijkheid = kennis van één variabele is nooit voldoende om de

waarde te kennen van een andere variabele

Statistische onafhankelijkheid = er bestaat geen enkele vorm van samenhangtussen twee kenmerken.

Analytische afhankelijkheid = een perfecte statistische relatie. In dit geval is ersprake van een deterministisch verband

De ovale vorm = staat voor een latente variabele of een niet rechtstreeks gemetenkenmerk

Het vierkant = wordt gebruikt om een kenmerk van het metrisch niveau voor te

stellen. Manifeste variabelen of een kenmerk rechtstreeks gemeten bij deonderzoekseenheid

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 16

Page 17: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 17/36

Blokken = worden gebruikt om variabelen van ordinaal of nominaal niveau voor testellen

De dubbele gebogen pijl = staat voor een symmetrisch statistisch verband; er iseen symmetrie tussen de varabelen, geen interdependentie

De gerichte pijl = een oorzaak-gevolgrelatie (X onafh.variabele; Y afh.variabele)

De gevorkte pijl = wordt gehanteerd voor het weergeven van een interactie-effectOm ineractie op te sporen, treedt er steeds een derde variabele in het spel, endaarom wordt het fenomeen van de interactie pas later uiteengezet

CCAUSALEAUSALE RELATIESRELATIES

VSVSSTATISTISCHESTATISTISCHE RELATIESRELATIES

We kunnen met statistiek NOOIT het bestaan van causale relaties bevestigen. Hetenige wat we kunnen doen, is de kenmerken (sterkte, richting en vorm) van eenverband nagaan.

VVERANTWOORDERANTWOORD KIEZENKIEZEN  TUSSEN TUSSEN

EENEEN REEKSREEKS VANVAN ASSOCIATIEASSOCIATIE--MATENMATEN

Associatiematen zijn voor de kwantitatieve criminoloog-onderzoeker “the tools of the trade” zoals scalpels en andere operatiegereedschappen tot degereedschapskist van de chirurg behoren.Bij de keuze voor een best passebde associatiemaat houdt men rekening met tweecriteria:

- ten eerste is er het meetniveau van de (on)afhankelijke variabele. Alsbeiden verschillend zijn meetniveau op laagste niveau gemeten

- ten tweede is er de verwachte theoretische richting van de associatie:symmetrische of asymmetrische analysetechnieken worden dan gekozen infunctie van de verwachte theoretische associatie.

Asymmetrische analyse = wanneer we uitspraken willen doen in de trant van “Xleidt tot Y” of “als X dan Y”

AASSOCIATIEMATENSSOCIATIEMATEN VOORVOOR

KENMERKENKENMERKEN OPOP NOMINAALNOMINAAL

NIVEAUNIVEAU

Het percentageverschil BerekenenKruistabellen worden gebruikt wanneer we de relatie tussen twee nominalekenmerken willen bestuderen. De verschillen in de afhankelijke variabele wordenvergeleken over de verschillende categorieën van de onafhankelijke variabele. Wegebruiken hiervoor vaak het percentageverschil en de odds ratio.

Statistisch dienen we bij het maken van een bivariate kruistabel het onderscheid temaken tussen een onafhankelijke en een afhankelijke variabele. Een afhankelijke

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 17

Page 18: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 18/36

variabele is een kenmerk dat beïnvloedt wordt door één of meerdere kenmerken.Een onafhankelijke variabele is een kenmerk dat invloed uitoefent op een anderkenmerk.

!!! Geslacht kan nooit een afhankelijke variabele zijn

Als een theorie stelt dat één variabele een andere veroorzaakt, dan zettenwe vaak de oorzakelijke of onafhankelijke variabele in de kolom,

 Terwijl we de afhankelijke variabele in de rij plaatsen. Verschillen op één categorie van de afhankelijke variabele bestuderen voor

de verschillende categorieën van de onafhankelijke variabele Verschil= percentagepunten!!!

Zie p. 87-88 vb

Richtlijnen bij het percenteren van de tabellen; regels:

vermeld altijd het totale aantal waarnemingen indien enkel de percentages of proporties in een tabel werden opgenomen bereken nooit een percentage wanneer het aantal gevallen kleiner is dan 30(met 1 eenheid verminderen verlaging van 3% geen significantie meer!)

De odds ratioOdds ratio = om 2 nominale kenmerken te bestuderen. Het is een maat om deverhouding tussen het voorkomen van een gebeurtenis en het niet voorkomen vaneen gebeurtenis uit te drukken (symmetrische associatiemaat)

Berekenen

Kruisproduct ratio = de verhouding tussen twee odds

De odds is tevens de basis voor de logistische regressie-analyse. De interpretatievan de odds ratio is relatief eenvoudig. De odds ratio neemt de waarde aan van 1bij afwezigheid van een verband en wijkt af van 1 naarmate dat het sterker wordt.De afwijking gebeurt naar 0 of naar +∞

Chi-kwadraat (X²) BerekenenX² = wordt gebruikt om na te gaan of waargenomen celfrequenties systhematischafwijken van verwachte celfrequenties indien geen associatie zou bestaan tussende twee kenmerken.

Vooral om kruistabellen te analyseren.Kan beschouwd worden als een maat voor de sterkte van een relatie tussen tweevariabelen gemeten op nominaal niveau, of tussen de nominale en ordinalevariabele..De waarde van X² neemt toe naarmate de associatie tussen de variabelen sterkeris.Moeilijk te interpreteren.Erg gevoelig voor het aantal meeteenheden in onze tabel.

Voorwaarden:- de data in de frequentietabel dienen ruwe frequenties te zijn, geen

scores/percentages

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 18

Page 19: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 19/36

- de onderzochte variabelen dienen categorisch te zijn, en de meetwaardendienen elkaar uit te sluiten. Elke observatie mag slechts in één celthuishoren

- de X² waarde mag maar geïnterpreteerd worden indien aan een aantalvoorwaarden is voldaan max 20% van de cellen bevat een frequentie van

<5 en geen enkele van 0Phi Interpreteren, niet berekenenPhi = een associatiemaat die gebaseerd is op X² en neemt de waarde 0 aan bijgeen associatie; 1 bij perfecte associatie.

Phi wordt gebruikt bij de berekening van de associatie tussen kenmerken in een2*2 tabel

Cramer’s V  Interpreteren, niet berekenenCramer’s V = de meest aangewezen coëfficiënt van die associatiematen diesteunen op X². V is belangrijk want deze associatiemaat corrigeert voor de

gevoeligheid van X² voor de steekproefgrootte en het aantal rijen en kolommenvan variabelen.V varieert van 0 tot 1 en wordt gebruikt bij associaties tussen kenmerken in eenr*k tabel.

AASSOCIATIEMATENSSOCIATIEMATEN VOORVOOR

KENMERKENKENMERKEN OPOP ORDINAALORDINAAL

NIVEAUNIVEAU

Gamma Interpreteren, niet berekenenGamma = voor de samenhang tussen variabelen van het ordinale niveau teberekenen.Waarde: -1 tot +1Gebaseerd op de verhouding tussen consistente paren en inconsistente paren.

-1 perfect negatief verband+1 perfect positief verband0 afwezigheid van een verband

Hoe verder van 0, hoe sterker de associatie

Negatieve relatie = waarde <0 hoge waarden op de variabele gaan samen metlage waarden op de andere variabele

Positieve relatie = waarde >0 hoge waarden op de variabele gaan samen methoge waarden op de andere variabele

Consistente paren = ieder paar van de elementen waarbij de waarde van het eneelement op beide variabelen hoger is dan van het andere element.

Inconsistente paren = ieder paar van elementen waarbij de waarde van het eneelement op de ene variabele hoger is en op de andere variabele lager is dan hetandere element

Gamma kan ook berekend worden voor metrische variabelen die men ordinaalmaakt door deze variabelen in categorieën te brengen. Echter, het is mogelijk dat

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 19

Page 20: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 20/36

de associatie hierdoor verschilt omdat de categorisering arbitrair is gebeurt. Alsdat gebeurt, kan dat zijn dat de associatie niet rechtlijnig is.

De rangcorrelatiecoëfficiënt van Spearman en Kendall’s Tau-b Interpreteren,niet berekenenRangcorrelatiecoëfficiënt = in dit geval toetsen we de nulhypothese dat beiderangordeningen niet van elkaar verschillen

Rangcorelatiecoëfficiënt van Spearman = afgeleid van de product-momentcorrelatiecoëfficiënt van Pearson. Deze varieert van -1 tot +1.Om Rho te berekenen bepalen we per eenheid het verschil tussen de beiderangordeningen.

Kendall’s Tau-b = symmetrische associatiemaat die varieert tussen -1 en +1. Bijperfecte statistische associatie worden -1 of +1 slechts bereikt onder conditie vanhet aantal rijen even groot is als het aantal kolommen.

SS YMMETRISCHE YMMETRISCHE ASSOCIATIEASSOCIATIE--MATENMATEN VOORVOOR KENMERKENKENMERKEN 

OPOP METRISCHMETRISCH NIVEAUNIVEAU

Als blijkt dat hoge criminaliteitsgraden in buurten samenhangen met hogewerkloosheidspercentages, dan is er sprake van een positieve samenhang.Hoge criminaliteitsgraden, lage werkloosheidspercentages: negatieve samenhang.Geen samenhang covariantie, covariatie en correlatie = 0

Sterkte = duidt op de mate waarin beide variabelen al dan niet samenhangen

Als in een puntenwolk de punten een lineair patroon vormen, is er sprake van eenzekere lineaire samenhang tussen de variabelen.

Covariaties, covarianties en correlaties worden gebruikt om de samenhang tussentwee variabelen in te schatten en het gaat hierbij om symmetrischeassociatiematen.Geen sprake van (on)afhankelijke variabele.

CovariatieStelt de mate voor waarin beide variabelen samen variëren. Het is de som van de

kruisproducten van de afwijkingen van X waarden tov hun gemiddelde enerzijds,en de afwijkingen van Y tov hun gemiddelde anderzijds.

SS(x,y) = { ( 1 x -  x )·( 1 y - y ) + ... + (n

 x -  x )·(n y - y ) }

B

erekenen

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 20

Page 21: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 21/36

De gesommeerde deviatiescores van de twee variabelen worden vermenigvuldigd.

CovariantieGezien de covariantie afhankelijk is van de meeteenheid waarin de variabelen zijnopgenomen kan de absolute waarde van de covariantie weinig informatie biedenover de sterkte van de samenhang.

Een grotere waarde van de covariantie duidt niet op een sterkere samenhang maaris een rechtstreeks gevolg van het feit dat de numerieke waarde en de spreidingvan inkomen groter is bij jaarlijks dan bij wekelijks inkomen (zie vb p103)

Berekenen

Covariatie gedeeld door n-1.

De product-moment correlatiecoëfficiënt van PearsonIs gelijk aan de covariantie tussen X en Y in gestandaardiseerde vorm

Berekenen

Standaardisatie maakt de interpretatie van de associatie tussen twee metrischevariabelen eenvoudiger.

Zeer sterke correlatie r>0.50Matige tot sterke correlatie 0.2<r<0.50

CCOVARIATIEOVARIATIE,, COVARIANTIECOVARIANTIE

ENEN CORRELATIECORRELATIE:: EENEEN UITGEWERKTUITGEWERKT

REKENVOORBEELDREKENVOORBEELD

Stappen te volgen bij het uitrekenen van een correlatie:• 1:Bereken het rekenkundig gemiddelde van de twee variabelen, zoals

eerder werd uiteengezet.• 2:Bereken de afwijkingen van elke eenheid ten opzichte van het

rekenkundig gemiddelde voor de beide variabelen X en Y.

• 3:Kwadrateer de afwijkingen van elke eenheid met het rekenkundiggemiddelde. Op die manier leg je de basis voor de berekening van devariatie in X en Y en covariatie tussen X en Y.

• 4:Neem de som van de gekwadrateerde afwijkingen tegenover degemiddelde waarde van X en neem de som van de gekwadrateerdeafwijkingen tegenover de gemiddelde waarde van Y.

• 5:Bereken de variantie van X en de variantie van Y. Dit gebeurt door zowelvariatie van X als de variatie van Y delen door N-1.

• 6: Bereken de vierkantswortel van de variantie in X en de vierkantswortelvan de variantie in Y. Je hebt nu ook de standaardafwijking van X en van X.

• 7: Bereken de kruisproductensom en je hebt de covariatie. 

• 8: Deel de kruisproductensom door n-1 en je hebt de covariantie tussen Xen Y.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 21

1

))((1

−−

=

∑=

n

 y xn

iii

 xy

 y x s

R= Cov / (Sx*Sy)

Page 22: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 22/36

• 9: Vermenigvuldig de standaardafwijking van X met de standaardafwijkingvan Y

• 10: Deel de covariantie tussen X en Y door de vermenigvuldiging van destandaardafwijking van X met de standaardafwijking van Y. Dit resultaat isde correlatiecoëfficiënt.

DDEE BIVARIATEBIVARIATE LINEAIRELINEAIRE

REGRESSIEREGRESSIE--ANALYSEANALYSE ALSALS

ASYMMETRISCHEASYMMETRISCHE ANALYSEANALYSE-- TECHNIEK  TECHNIEK 

Het intercept in een bivariate lineaire regressieanalyse kunnenberekenen

OLS = Ordinary Least Squares principe dat wordt gebruikt om de regressie-analyse mathematisch uit te voeren (regressie-analyse = asymmetrischeassociatiemaat)

Enkelvoudige lineaire regressie-analyse = levert een statistische vergelijking opwaarmee de afhenkelijke bariabele voorspeld kan worden obv de onafhankelijkevariabele

• ‘enkelvoudig’ – bivariaat: 1 onafhankelijke variabele

• ‘lineair’ – Eenvoudige samenvatting van puntenwolk dmv rechte

• ‘regressie’ –  Techniek om de positie van de rechte te bepalen

Regressiecoëfficiënten = de B’s zijn de populatieparameters die met een regressie-analyse geschat worden en worden daarom ook zo genoemd

Zie p 108 verdere uitleg formule

Regressiecoëfficiënten bepalen = gebeurt via “de gewone kleinstekwadratenoplossing”

Residuele variatie = de kwadratische afwijking van de punten tov deregressierechte is een kwaliteitsmaat voor de gevonden rechte

Het mag duidelijk zijn dat we met het blote oog niet in staat zijn preciezeuitspraken te doen. Daarom doen we beroep op een reeks coëfficiënten die dekwaliteit van de regressielijn helder uitdrukken. Eénmaal de regressiecoëfficiëntengekend zijn, dient nog bepaald te worden of en hoe goed men de waarden van de

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 22

 Y = B0 + B1X + eOf 

 Y = a + b1X + e

Page 23: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 23/36

afhankelijke variabele (Y) kan voorspellen obv de waarden van de onafhankelijkevariabele (X)

De afwijkingen van het gemiddelde van Y bestaan uit twee componenten:- toevallige afwijkingen (residual)- verklaarde afwijkingen (afwijkingen van rek.gem verklaard door de

regressielijn)

 Totale variantie van Y:- Regression sum of squares = de variantie Y die vertegenwoordigd wordt

door X- Residual sum of squares/foutenvariatie = de mate waarin de voorspelde

waarden van Y afwijken van de geobserveerde waarden van YNiet berekenen, wel betekenis kennen

Determinatiecoëfficiënt R² = de verhouding van de verklaarde variatie tov detotale variatie

R² is de proportionele reductie in de voorspellingsfout die intstaat door op deregressielijn te steunen boj de voorspelling van de afhankelijke variabele en is dusde proportie van de totale variatie in Y die door X wordt verklaard.Het is een symmetrische maat, maar het is wel mogelijk om een asymmetrischeinterpretatie aan R² te geven.Berekenen

 Teller = bevat variatie die bestaat uit de variatie tussen de voorspelde waarde ende gemiddelde waarde. De gemiddelde waarde is immers onze beste voorspellerals we geen onafhankelijke variabele hebben

Noemer = bevat de variatie in Y

ZZELFELF UITREKENENUITREKENEN VANVAN

DEDE PARAMETERSPARAMETERS VANVAN DEDE

REGRESSIERECHTEREGRESSIERECHTE

Zie p. 115-116!! Uitrekenen bivariate regressie (!)

VVERONDERSTELLINGENERONDERSTELLINGEN BIJBIJ

HETHET UITVOERENUITVOEREN VANVAN EENEEN

LINEAIRELINEAIRE REGRESSIEREGRESSIE--ANALYSEANALYSE

- Ten eerste wordt wat betreft het meetniveau verondersteld dat zowel deafhankelijke als de onafhankelijke variabele gemeten zijn op interval- of ratio-meetniveau.

- Een tweede veronderstelling is dat er een lineair verband bestaat tussen deonafhankelijke en afhankelijke variabele

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 23

Page 24: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 24/36

Zo wordt er verondersteld dat voor elke waarde van de onafhankelijke variabele deafhankelijke variabele een normale verdeling kent

Heteroscedasticiteit = een regressieassumptie voor de lineaire regressie: hetbetekent dat de variatie van de afhankelijke variabele voor elke waarde van deonafhankelijke variabele gelijk dient te zijn

Outliers/uitbijters = extreme waarden die de regressierechte beïnvloeden

DDEE RAPPORTAGERAPPORTAGE VANVAN DEDE

BELANGRIJKSTEBELANGRIJKSTE PARAMETERSPARAMETERS

VANVAN DEDE REGRESSIERECHTEREGRESSIERECHTE ININ EENEEN

RAPPORTRAPPORT

Lees p 118

EENN WATWAT ALSALS DEDE MEETNIVEAUSMEETNIVEAUS VANVAN 22

VARIABELENVARIABELEN VERSCHILLENDVERSCHILLEND ZIJNZIJN??

Is een onafhankelijke variabele “opleidingsniveau” gemeten op ordinaal niveau eneen afhankelijke variabele “slachtoffer of niet” op een nominaal niveau, dan kiestmen strikt genomen op een analysetechniek op nominaal niveau.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 24

Page 25: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 25/36

DDEELEEL 5: D5: DEE STANDAARDNORMALESTANDAARDNORMALE VERDELINGVERDELING ENEN DIENSDIENS EIGENSCHAPPENEIGENSCHAPPEN 

IINLEIDINGNLEIDING

Gauss-curve/normale verdeling = de verdeling bendadert een ‘perfecte klokvorm’.Deze (theoretische) verdeling is uitermate belangrijk omdat er een aantaleigenschappen aan verbonden zijn, die we nodig hebben wanneer we later gaanpogen om uitspraken obv steekproeven gaan veralgemenen naar de populatie.

DDEE NORMALENORMALE ENEN STANDAARDSTANDAARD--NORMALENORMALE VERDELINGVERDELING

Buigpunten = zijn punten waar de vorm van de kromme overgaat van bol naar hol

Zie vb p 123-124

VVANAN NORMALENORMALE VERDELINGVERDELING

NAARNAAR STANDAARDNORMALESTANDAARDNORMALEVERDELINGVERDELING

Standaardisering = om te vermijden dat men telkens de oppervlakte onder decurve moet berekenen obv de formule, hebben statictici gezocht naar dit. Hierdoordiende men de oppervlakte eenmalig te berekenen en vast te leggen in een tabel.

Z-verdeling =a) het gemiddelde van de standaardnormale verdeling wordt op 0 gesteld door vaniedere waarde het gemiddelde van de oorspronkelijke reeks af te trekkenb) de standaardafwijki,g wordt op 1 gesteld door de absolute waarde van het bij (a)berekende verschil te delen door de standaardafwijking van de oorspronkelijkereeks

Z-Z-SCORESSCORES ENEN HETHET GEBRUIK GEBRUIK 

VANVAN DEDE  TABEL TABEL VANVAN DEDE

STANDAARDNORMALESTANDAARDNORMALE

VERDELINGVERDELING

Een Z-score wordt als volgt berekend:

Berekenen

zie vb p 128-130

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 25

σ 

 µ −

= x

 z 

Page 26: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 26/36

DDEELEEL 6: E6: EENEN INLEIDINGINLEIDING ININ KANSREKENENKANSREKENEN 

WWAAROMAAROM KANSREKENENKANSREKENEN VOORVOOR

CRIMINOLOGENCRIMINOLOGEN??

 Toevalsmechanisme = elk element heeft een zelfde kans om getrokken te wordenin de steekproef 

K K ANSDEFINITIESANSDEFINITIES

Kansexperimenten = experimenten waarvan wordt geëist dat ze een onbeperktaantal keren kunnen worden herhaald onder gelijkblijvende omstandigheden

Kans = steeds tussen 0 en 1Notatie PKans om 6 te gooien met één dobbelsteen P(6)

Kansdefinitie van Laplace = het aantal uitkomsten waarin je geïnteresseerd bentgedeeld door het aantal mogelijke uitkomsten van een kansexperiment

A uitkomst kansexperiment waarin jegeïnteresseerd bent

N(A) aantal uitkomsten waarin je geïnteresseerd bentN aantal uitkomstenBerekenen

Relatieve frequentie = te bepalen door het kansexperiment te herhalen envervolgend te kijken hoe vaak de uitkomst die je interesseert zich voordoet tov het

totaal aantal herhaalde kansexperimenten

n(A) aantal uitkomsten waarin je geïnteresseerd bent bijherhaling van experiment

n aantal herhalingen van het experimentBerekenen

De experimentele wet = naarmate het aantal herhalingen van een toevalsprocestoeneemt, zullen de kansen van de elementen van S(steekproef) zich meer enmeer stabiliseren.

Criminologen zien steekproefgegevens als een uitkomst van een kansproces!

Subjectieve kans = wanneer je mensen over straat hoort praten over hun eigenimpressies; de eigen inschatting en is gebaseerd op de perceptie van het individu

K K ANSREGELSANSREGELS

 Algemene somregel

Zie vb p 134 Berekenen

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 26

Formule Laplace: N(A)/N

P(A)=n(A)/n

P(AofB) = P(A) + P(B) – P(AenB)

Page 27: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 27/36

De speciale somregel

A en B hebben niets met elkaar gemeen!!

De algemene productregelVoorwaardelijke kans = de kans op een bepaalde uitkomst als je al gedeeltelijkeinfo hebt over de uitkomst van een kansexperimentDe kans op gebeurtenis A, onder conditie van gebeurtenis B.

Dit is de kans op B gegeven A. als we deze regeltoepassen en we willen weten wat de kans is op het

gooien van een getal niet hoger dan 3 (kans op B), gegeven het feit dat het eeneven getal moet zijn (kans op A) dan bekomen we:

P(AenB) = de probabiliteit dat een getal even is Enhoogstens 3 is : 1/6 (enkel 2 is kleiner of gelijk aandrie en even)P(A) = de probabiliteit dat een getal even is : 3/6De voorwaardelijke kans = 1/6 gedeeld door3/6 of 1/6

* 6/3 = 6/18

De speciale productregel

PPERMUTATIESERMUTATIES ENEN

COMBINATIESCOMBINATIES

Permutaties = het aantal manieren waarop je een aantal verschillende objectentov elkaar kan plaatsenBerekenen

Volgorde is van belang

Wordt weergegeven als n! (faculteit)

K K ANSVARIABELENANSVARIABELEN ENEN DEDE

BINOMIALEBINOMIALE VERDELINGVERDELING

Kansvariabele = geeft aan in welk getal een kansexperiment resulteert. De notatievan een kansvariabele is bijvoorbeeld k of x. het streepje verwijst naar het feit datwe te maken hebben met een kansexperiment en dat niet bij voorbaat vast staatwat de uitkomst zal zijn

Verdelingsfunctie = het overzicht van de uitkomsten van een kansvariabele met dehierbij behorende gecumuleerde kansen

Verwachte waarde = de som ban de uitkomsten vermenigvuldigd met de kans opiedere uitkomst

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 27

P(AofB) = P(A) + P(B)

P(B A) = P (AenB) / P (A)│

P(A) = 1-P (complement van A)

Page 28: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 28/36

BBINOMIALEINOMIALE VERDELINGVERDELING

Lees p 140-143 vbn

BBINOMIALEINOMIALE DERDELINGDERDELING GAATGAAT

OVEROVER ININ EENEEN NORMALENORMALE VERDELINGVERDELING

zie p 144-148 oef n

WWAAROMAAROM ISIS DEDE BINOMIALEBINOMIALE VERDELINGVERDELING

ZOZO BELANGRIJK BELANGRIJK  ININ KWANTITATIEFKWANTITATIEF

CRIMINOLOGISCHCRIMINOLOGISCH ONDERZOEK ONDERZOEK ??

Vele kenmerken waarin de criminoloog geïnteresseerd is, volgen een binomialeverdeling.

Het al dan niet plaatsvinden van criminele gebeurtenissen, zoals slachtofferschap,is zo een vb. Deze kenmerken zijn categorische variabelen, dichotomieën.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 28

Page 29: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 29/36

DDEELEEL 7: I7: INFERENTIËLENFERENTIËLE STATISTIEK STATISTIEK  ININ DEDE PRAKTIJK PRAKTIJK  

WWAAROMAAROM GEBRUIKENGEBRUIKEN WEWE

INFERENTIËLEINFERENTIËLE STATISTIEK STATISTIEK ??

We gebruiken steekproeven die een zo goed mogelijke afspiegeling zijn van depopulatie en die, in theorie, een excellente basis vormen om conclusies voor deganse populatie te trekken. Een steekproef is steeds een subgroep van depopulatie die moet bestudeerd worden.

Inferentiële statistiek = kunnen we uitspraken dien over een breder geheel aaneenheden dan diegenen die we bevraagd hebben. Dit doen we via het gebruik vanbetrouwbaarheidsintervallen en significatietoetsen.

DDEE REPRESENTATIVITEITREPRESENTATIVITEIT VANVAN

STEEKPROEVENSTEEKPROEVEN

Het doel van inductieve statistiek = het veralgemenen van de gegevens verzameldvoor een steekproef naar de populatie waaruit ze getrokken werden

Meetfout = door onprecieze metingen bepaalde onjuiste waarnemingen bekomen.Waarnemingen gedaan op een bepaald ogenblik in de tijd, kunnen later andereresultaten opleveren

Statistische inferentie houdt zich met deze onzekerheden bezig door 2 functies tevervullen:

- schatting gebruik van steekproefkenmerken om ze naar de populatie teveralgemenen

-hypothesen testen of toetsen kan men met voldoende zekerheid eenbepaalde onderzoekshypothese aannemen of moet men ze op basis van degegevens verwerpen?

SS TEEKPROEVEN TEEKPROEVEN ENEN

POPULATIEPOPULATIE

 Afbakenbare populatiesOpgeslagen in computers of in een kaartenbakkensysteem leveren ons lijsten

Hypothetische populaties

Bestuderen van invloed van roken op longkanker, cijfers slachtofferschap… geenduidelijke populatieHypothetische populaties omdat we ze niet op lijsten terugvinden of kunnenidentificeren

SS TEEKPROEVEN TEEKPROEVEN ENEN HETHET

PRINCIPEPRINCIPE VANVAN  TOEVAL TOEVAL

Goede afspiegeling = om die te verkrijgen moeten we een steekproef lukraaksamenstellen (random sample)

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 29

Page 30: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 30/36

Steekproeffout = wordt bepaald en onder controle gehouden door voldoendeaandacht te besteden aan het steekproefkader, -ontwerp en de implementatieervan.

Steekproefkader = geeft weer wie (administratief) deel uitmaakt van de teonderzoeken doelpopulatie, en bijgevolg kans heeft of moet hebben om in desteekproef opgenomen te worden

DDEE  THEORIE THEORIE VANVAN

 TOEVALSSTEEKPROEVEN TOEVALSSTEEKPROEVEN

Aselecte steekproeven = steekproeven waarin elke elementaire eenheid uit deempirische populatie een berekenbare kans heeft om in de steekproef opgenomente worden.

Steekproefgrootheden = statistieken afkomstig uit steekproeven zoals gemiddelde,standaardafwijking, rico

Populatieparameters = verwijzen naar het gemiddelde, standaardafwijking, rico..inde populatie

Inferentiële statistiek = hier doen we uitspraken over de populatie obv wat wevinden in een aselecte steekproef uit die populatie. We grbeuiken dussteekproefkenmerken om iets te zeggen over de populatiekenmerken.

∏, µ en σ zijn de parameters van de populatie

2 hoofdactiviteiten binnen inferentiële statistiek:- schattenPuntschatting = de schatting van een kenmerk in de populatie obvsteekproefgegevens. Vb de schatting van het gemiddeld aantal delicten waarvaniemand slachtoffer wordt

Intervalschatting = de marges waarbinnen we met een zekere graag vanonzekerheid een puntschatting inschatten

- toetsenKansrekenen vormt de basis van de inferentiële statistiek

Werkelijke waarde = naarmate het aantal toevalssteekproeven van dezelfdeomvang (in ons vb n=100) groter wordt, de concentratie van de uitkomsten rondde werkelijke waarde toeneemt.Het is de waarde in de populatie die we kennen via de studentenadministratie

K K ENMERKENENMERKEN VANVAN

STEEKPROEVENVERDELINGSTEEKPROEVENVERDELING

Een (theoretische) steekproevenverdeling is altijd een theoretische kansverdelingdie de functionele relatie toont tussen de mogelijke waarden van een bepaalde

statistiek, gebaseerd op een steekproef van n eenheden, en de kans (dichtheid)

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 30

Page 31: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 31/36

verbonden met elke waarde, voor alle mogelijke steekproeven van identiekeomvang n die uit een specifieke populatie getrokken worden.

Lees p 155

GGEBRUIK EBRUIK  VANVAN DEDE NORMALENORMALE

VERDELINGVERDELING ININ DEDE INFERENTIËLEINFERENTIËLE

STATISTIEK STATISTIEK 

Als we een reeks grote steekproeven trekken uit de populatie, dan weten we datde steekproefgemiddelden normaal verdeeld zijn. Deze eigenschap vansteekproefgemiddeldenverdeling is heel belangrijk in de inferentiële statistiek.Deze verdeling is symmetrisch en ééntoppig, gekenmerkt door de ‘klokvorm’ en

wordt volledig bepaald door de parameters µ (populatiegemiddelde) en σ(standaardafwijking)

Z-scores het verschil van een warde en het gemiddelde en dit delen door destandaardafwijking

DEDE CENTRALECENTRALE

LIMIETSTELLINGLIMIETSTELLING

68-95-99 regel zie p 157

Centrale limietstelling = adhv voorbeeld uitgelegd p 157

We kunnen steeds bepalen welke de kans id op een welbepaaldesteekproefuitkomst indien we het populatiegemiddelde en de populatievariantiekennen.

Betrouwbaarheidsinterval/-gordel = binnen welk interval rond desteekproefuitkomst het populatiegemiddelde valt

PPUNTSCHATTINGUNTSCHATTING ENEN INTERVALSCHATTINGINTERVALSCHATTING

vb oef p 159-160

Schatter = een grootheid die berekend wordt adhv een bepaalde functie obv deinformatie van de steekproef en wordt uitgedrukt in een formule. Een schatter ishet resultaat van een schatting

Zuivere schatter/onvertekende schatter = een statistische grootheid waarvan deverwachtingswaarde samenvalt met de te schatten populatieparameter.

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 31

Page 32: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 32/36

Grote steekproeven leiden tot een kleinere variatie in de prevalentieschattingen.We krijgen dus een zekerder resultaat als de steekproefgrootte toeneemt.

Betrouwbaarheidsinterval = wordt berekend uit de steekproefdata volgens eenmethode die een bepaalde kans heeft een interval op te leveren waarin depopulatiewaarde ligt

HHETET BEREKENENBEREKENEN VANVAN EENEEN

BETROUWBAARHEIDSINTERVALBETROUWBAARHEIDSINTERVAL

RONDROND EENEEN PARAMETERPARAMETER

Zie p 162-164 Berekenen

SS TATISTISCHE TATISTISCHE HYPOTHESEHYPOTHESE-- TOETSING TOETSING

Statistische hypothesetoetsing = hiermee kan men testen hoe aannemelijk eenbepaalde uitspraak over de populatie, op grond van de steekproef in kwestie,werkelijk is

Significantietoets = een procedure om gegevens zoals uitkomsten van eensteekproef te vergelijken met een vooropgestelde hypothese, die we nulhypothesegaan noemenDe uitkomst van zo’n toets wordt uitgedrukt in termen van een kans die aangeefthoe goed data en hypothese met elkaar kunnen overeenkomen

Overschrijdingskans (p) = de significantietoets meet de kans op het krijgen vaneen uitkomst die even extreem is of nog extremer dan de waargenomen uitkomst

Parallel kan men stellen dat de nulhypothese veronderstelt dat een bepaaldeuitkomst of een steekproefgrootheid uit onze steekproef, eigenlijk nul is. Dealternatieve hypothese is dat de beklaagde wel schuldig is, de alternatievehypothese is dat de steekproefgrootte verschilt van 0.

 Type I fout = dat men een correcte nulhypothese verwerpt

 Type II fout = dat men een foute nulhypothese aanvaardt

P-waarde = kan worden gezien als een uitdrukking van de waarschijnlijkheid of het

‘waarheidsgehalte’ van een nulhypothese

EEENZIJDIGENZIJDIG OFOF  TWEEZIJDIG TWEEZIJDIG

 TOETSEN TOETSEN VANVAN EENEEN

NULHYPOTHESENULHYPOTHESE??

 Tweezijdige toets = houdt in dat we stellen via de alternatieve hypothese dat depopulatieparameter significant verschilt van 0, zonder een uitspraak te doen overde richting. Eigenlijk spreken we beter van toetsen met tweezijdig alternatief 

Eenzijdig getoetst = als de formulering is dat de populatieparameter positief verschilt van 0

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 32

Page 33: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 33/36

Rechtseenzijdig = als de waarde van de populatieparameter een positieve waardeheeft

Linkseenzijdig = als de waarde van de populatieparameter een negatieve waardeheeft

AANDERENDERE BELANGRIJKEBELANGRIJKE

VERDELINGENVERDELINGEN

  T-verdeling/ Student’s t = een verdeling die uiterlijk heel erg lijkt op de normaleverdeling. De frequentieverdeling heeft dezelfde symmetrische klokvorm als dievan de normale verdeling.Wordt gebruikt in de inf.stat waarbij we obv info uit één steekproef veralgemeningen willen bekomen naar de populatie toe.

F-verdeling = is een quotiënt van twee chi-kwadraat verdeelde grootheden. Deze

wordt oa gebruikt bij het quotiënt van twee steekproef varianties uit twee normaalverdeelde populaties. De F-verdeling is net als X² asymmetrisch.Wordt gebruikt in situaties waar men wil weten of een determinatiecoëfficiënt diegevonden wordt in een steekproef statistisch significant verschilt van 0.

Bernoullie-verdeling = Bernoullie experiment is een experiment met slecxhts tweemogelijke uitkomsten: succes en mislukking

DDEE VARIANTIEVARIANTIE--ANALYSEANALYSE ALSALS  TOETS TOETS

VOORVOOR VERSCHILLENVERSCHILLEN  TUSSEN TUSSEN GROEPENGROEPEN

INZAKEINZAKE METRISCHEMETRISCHE KENMERKENKENMERKEN

Variatie-analyse = is een toets voor de relatie tussen een nominale en eenmetrische variabele

Onder de aanname dat de standaardafwijkingen in de populatie gelijk zijn, kun jeobv de steekproeven de variantie op twee manieren inschatten:

- het gewogen gemiddelde van de variantie binnen iedere groep gemeenten:de binnengroepsvariantie

- de variantie van de gemiddelden van de drie groepen gemeenten rondomhet algemeen gemiddelde: de tussengroepsvariantie

Variantie-analyse beide schatters van de variantie in de populatie worden

vergeleken door ze op elkaar te delenHoe groter F, hoe kleiner de kans dat dit door toeval komt.Als de p-waarde kleiner is dan 0.05, is de kans dat de waarde aan het toeval tewijten is, kleiner dan 5%Berekenen

ZZELFELF UITREKENENUITREKENEN VANVAN EENEEN

VARIANTIEVARIANTIE--ANALYSEANALYSE

zie F berekenen p 174-176 Berekenen

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 33

Page 34: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 34/36

Eta-kwadraat = deze is de verhouding tussen de tussengroepsvariantie en detotale variantie in Y

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 34

Page 35: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 35/36

DDEELEEL 8: D8: DEE GRENZENGRENZEN VANVAN DEDE BIVARIATEBIVARIATE STATISTIEK STATISTIEK  

Niets zelf berekenen

IINLEIDINGNLEIDING

Waarom is de multivariate analyse van statistische gegevens zo belangrijk in desociale wetenschappen in het algemeen en de criminologie in het bijzonder?Hiervoor zijn verschillende redenen

de sociale werkelijkheid is multivariaat . Er zijn nu eenmaal meerderedeterminanten verbonden aan criminaliteitsgerelateerde fenomenen of uitkomstvariabelen

ten tweede is het zo dat het in de criminologie moeilijk is om fenomenengeïsoleerd te bestuderen

Zowel de causale als de niet causale analyse van criminaliteitsfenomenen maaktdaarom gebruik van het niet experimentele onderzoeksdesign als alternatief. Dit ishet principe van de statistische controleElke variabele die gecorreleerd is met de onafhankelijke variabele en die medebepalend kan zijn voor de score op de afhankelijke variabele, is een storendevariabele

ten derde is het zo dat achter een bivariaat verband meer kan schuilgaandan op het eerste zicht lijkt.

DDEE MEERVOUWIGEMEERVOUWIGE LINEAIRELINEAIREREGRESSIEREGRESSIE--ANALYSEANALYSE

De meervoudige regressie-analyse = wordt gebruikt wanneer men geïnteresseerdis in het verklaren van de spreiding in een variabele van het metrisch niveau obvmeerdere onafhankelijke variabelen die eveneens van het metrische niveau zijn

DDEE PROEFPROEF OPOP DEDE SOMSOM: 2: 2 BIVARIATEBIVARIATE

VS 1VS 1 MEERVOUWIGEMEERVOUWIGE REGRESSIEREGRESSIE

Multicollineariteit = de samenhang tussen onafhankelijke variabelen

DDEE PARTIËLEPARTIËLE CORRELATIECOËFFICIËNTCORRELATIECOËFFICIËNT

ENEN DEDE DETECTIEDETECTIE VANVAN SCHIJNVERBANDENSCHIJNVERBANDEN

Partiële correlatie = de correlatie tussen 2 variabelen, onder statistische controlevan één of meerdere storende variabelen waarvoor je wenst te controleren. Ditwordt gedaan wanneer men een schijnverband wil detecteren

SS TATISTISCHE TATISTISCHE INTERACTIEINTERACTIE

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 35

Page 36: 2010-2011 Statistiek

5/17/2018 2010-2011 Statistiek - slidepdf.com

http://slidepdf.com/reader/full/2010-2011-statistiek 36/36

Simpsons paradox = toont aan dat achter een bivariate analyse meer kanschuilgaan dan men op het eerste zicht zou vermoeden: Simpson presenteerdepercentageverschillen voor de categorieën van één onafhankelijke variabele

Wanneer we interactie willen opsporen tussen één variabele gemeten op metrischniveau en één op niet-metrisch niveau bij de studie van de invloed van tweekenmerken op een metrische afhankelijke variabele, kunnen we deregressiecoëfficiënt in subgroepen naar de categorische variabele bestuderen

Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 36