Upload
kronkie1
View
401
Download
1
Embed Size (px)
Citation preview
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 1/36
2010-2011
Eerste BachelorCriminologie
Cindy Stevens
[STATISTIEK IN DECRIMINOLOGISCHE
WETENSCHAP]
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 2/36
DDEELEEL 1: G1: GESCHIEDENISESCHIEDENIS VANVAN DEDE ((CRIMINELECRIMINELE)) STATISTIEK STATISTIEK
DDEELEEL 2: I2: INLEIDENDENLEIDENDE BEGRIPPENBEGRIPPEN
IINLEIDINGNLEIDING
Objecten/onderzoekseenheden = de personen of zaken waarover je iets zegt; overwie/wat je obv het onderzoek een uitspraak doet.
Variabelen = kenmerken zoals leeftijd, geslacht, studiekeuze…
Onderzoekspopulatie = de verzameling van individuen waarover we een uitspraakwillen doen
Steekproef = een staal uit de onderzoekspopulatie (we kunnen niet alle Belgentussen 15 en 90 jaar ondervragen)
Respondenten = de personen die we uiteindelijk bevraagd hebben;deelverzameling van de onderzoekspopulatie
Representativiteit = een kenmerk in de steekproef komt evenveel voor als in deonderzoekspopulatie
BBESCHRIJVENESCHRIJVEN,, SCHATTENSCHATTEN ENEN
VERALGEMENENVERALGEMENEN ALSALS STATISTISCHESTATISTISCHE
BEDRIJVIGHEIDBEDRIJVIGHEID
Statistiek = het geheel van regels en procedures om gemeten kenmerken te
verwerkenBeschrijvende statistiek = het op een overzichtelijke ensamenvattende/synthetische manier weergeven van kenmerken die voorkomen ineen onderzoekspopulatie of steekproef, wanneer we niet alle eenheden kunnenbevragen
- Laat toe gegevens te beschrijven voor een groep personen of andereeenheden die onderzocht werden. De resultaten kunnen niet veralgemeendworden naar andere personen of eenheden, tijden.
- Biedt momentopname die uitsluitend geldig is voor de onderzochte groep- Laat niet toe causaliteit vast te stellen
Inductieve/inferentiële statistiek = het veralgemenen van de gegevens verzameldvoor een steekproef naar de onderzoekspopulatie waaruit ze getrokken werden
Hypothesen = veronderstellingen; specifieke stellingen betreffende de causalerelatie tussen 2 of 2+ concepten, die afgeleid zijn uit de theorie
Toetsbare stellingen = criminologen kunnen bepaalde veronderstellingen hebben,vb over het voorkomen van een kenmerk in de onderzoekspopulatie of over desamenhang tussen een aantal kenmerken.
Onderzoekshypothese = formuleert de betrokken stelling in een positieve zin, dwz
in de richting van de verwachtingen van de onderzoeker
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 2
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 3/36
Nulhypothese = de omkering van de onderzoekshypothese; de hypothese dat ergeen verband bestaat tussen de kenmerken die men onderzoekt
Alternatieve hypothese = indien we vaststellen dat de nulhypothese magverworpen worden, concluderen we (voorlopig) dat onze onderzoekshypothese (nualternatieve hypothese) opgaat
SS TATISTIEK TATISTIEK ENEN DEDE BEANTWOORDINGBEANTWOORDING
VANVAN BESCHRIJVENDEBESCHRIJVENDE ENEN
VERKLARENDEVERKLARENDE ONDERZOEKSONDERZOEKS--VRAGENVRAGEN
Beschrijvende onderzoeksvraag = betreft de kwantitatieve beschrijving van eenfenomeen onder studie
Verkennend onderzoek = gaat verder dan enkel beschrijven; ze heeft betrekking
op het aftasten van (nieuwe) veronderstellingen
Verklarende onderzoeksvraag = op gericht geobserveerde verschillen of veranderingen in uitkomstvariabelen te gaan verklaren vanuit kenmerken dieeigen zijn aan een theoretisch paradigmaVerklarend onderzoek wil een statistische verklaring bieden voor de geobserveerdeverschillen tussen eenheden obv één of meerdere kenmerken van die eenheden.
SS TATISTISCHE TATISTISCHE EENHEDENEENHEDEN
Statistische eenheden = de onderzoekseenheden waar men een uitspraak over wildoenDeze eenheden kan men beschrijven adhv een aantal kenmerken, waarin deonderzoeker geïnteresseerd is.
Variabelen = de kenmerken van statistische eenheden die variëren en dieverschillende scores hebben op een bepaald kenmerk
Variabiliteit/spreiding = er is vb spreiding in crimineel gedrag wanneer deverschillende onderzoekseenheden met een verschillende frequentie crimineelgedrag vertonen
Voldoende spreiding = dat er per kenmerk tenminste twee verschillende waardenzijn en dat de eenheden verspreid zijn over deze categorieën of waarden van diekenmerken
Indien de spreiding onvoldoende is over de verschillende categorieën vanvariabelen kan men soms beslissen het kenmerk uit het onderzoek te schrappen,het aantal eenheden in de steekproef op te drijven of de probleemstelling teherzien
UUNIVARIATENIVARIATE,, BIVARIATEBIVARIATE ENEN MULTIVARIATEMULTIVARIATE BESCHRIJVENDEBESCHRIJVENDE
ANALYSEANALYSE
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 3
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 4/36
Univariate analyse = een analyse van één kenmerk dat varieert. Het komt eropneer de verdeling van een kenmerk accuraat te beschrijven
Bivariate analyse = wanneer 2 variabelen (x en y) met elkaar in verband gebrachtworden
Multivariate analyse = wanneer je 2+ variabelen gebruikt (komt niet aan bod indeze syllabus)
Onderzoeksvragen in de kwantitatieve criminologie worden behandeldadhv univariate, bivariate en multivariate analyses
MMEETNIVEAUEETNIVEAU VANVAN VARIABELENVARIABELEN
Het nominale en ordinale meetniveau vormen samen het categorische meetniveau,terwijl het interval en ratio meetniveau samen het metrische meetniveau vormen.
Nominale meetniveau = op basis van een bepaald kenmerk sorteren enbeslissingen nemen over wie hetzelfde kenmerk heeft en wie hiervan verschiltEr is geen sprake van een rangorde, ookal worden de categorieën voorgesteld dooreen getalNationaliteit en geslacht bijvoorbeeld zijn altijd nominaal
Exclusiviteit = de categorieën mogen elkaar niet overlappen; hetclassificatiesysteem verliest zijn bruikbaarheid als de te classificeren data kunnenworden ondergebracht in meer dan 1 categorie
Exhaustiviteit = het classificatiesysteem dient alle bestudeerde data te omvatten;maw elk geval moet in een categorie kunnen worden gebracht
Ordinale meetniveau = kenmerkt zich door het principe van de ordenbaarheidvan de categorieënWe zijn ook in staat (los van te classificeren) de categorieën onderling terangschikken
Dichotomie = een variabele die slechts 2 waarden kan aannemen
Polytomie = een variabele die meer dan 2 waarden kan aannemen
Intervalniveau = niet enkel sprake van rangordening, maar de intervallen tussen
de verschillende waarden die een variabele kan aannemen, hebben ook eenbetekenis. Vb temperatuur
Rationiveau = het niveau waarbij sprake is van rangordening en waarbij deintervallen betekenis hebben en er een natuurlijk nulpunt aanwezig is. Op ditniveau is nul ook werkelijk een absoluut, niet-arbitrair nulpunt. Vb lengte, gemetenin cm
DDISCRETEISCRETE ENEN CONTINUECONTINUE
VARIABELENVARIABELEN
Continue meetschalen = hierbij kunnen alle mogelijke waarden die uitkomst zijnvan de meetprocedure: niet enkel de waarde 1 en 2, maar ook 1,2 en 1,75
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 4
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 5/36
Discrete meetschaal = beperkt tot een telbaar aantal waardenEen continu verschijnsel wordt vaak toch met een discrete meetschaal gemeten,maar dan hebben tussenliggende waarden wel een betekenis (enkel “ronde”getallen)
DDEE DATAMATRIXDATAMATRIX ALSALS INPUTINPUT
VOORVOOR STATISTISCHESTATISTISCHE ANALYSEANALYSE
Datamatrix/gegevensmatrix = bevat de info van elke statistische eenheidwaarvoor men info heeft verzameld
Codeboek = een lijst waarin uitgelegd staat welke inhoudelijke betekenis wordtgegeven aan de numerieke code
AAFRONDINGSREGELFRONDINGSREGEL VOORVOOR
STATISTISCHESTATISTISCHE GEGEVENSGEGEVENS
Men rondt naar beneden af van 1 tot 5Men rondt af naar boven van 6 tot 9
NNOTATIESYSTEEMOTATIESYSTEEM ININ STATISTIEK STATISTIEK
ENEN ALGEMENEALGEMENE AFSPRAKENAFSPRAKEN
Aggregatie = het sommeren of optellen van de waarden in de rijen binnen dekolommen. Deze wordt aangegeven met het sigmateken: ∑
AAFSPRAKENFSPRAKEN BIJBIJ PRESENTERENPRESENTEREN
TABELLEN TABELLEN
We onderscheiden 2 tabellen:- Frequentietabellen = tellingen van hoe vaak iedere waarde van een
variabele voorkomt- Kruistabellen = tellingen van hoe vaak waarden van 2 variabelen in
combinatie met elkaar voorkomen
Een tabel heeft altijd:- een titel- een bronvermelding onderaan de gegevens
- een vermelding van de waarnemingseenheid- een vermelding van de variabelen- een vermelding van de meeteenheid- een logische en overzichtelijke indeling
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 5
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 6/36
DDEELEEL 3: D3: DEE UNIVARIATEUNIVARIATE BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK
IINLEIDINGNLEIDING
Datamatrix voor statistische analyse = bestaat uit één of meerdere metingen,scores of waarden voor verschillende individuen, objecten, gebieden of criminelegebeurtenissen.
Beschrijvende statistiek = de methodologie voor het organiseren ensamenvatten/beschrijven van de gegevens voor een steekproef of de gehelepopulatie
Toegepaste technieken:- de onderzoeksvraag- het meetniveau van de kenmerken van de respondenten
Frequentieverdelingen en grafieken maken gegevens visualiseren ensamenvatten
= centrale tendensen worden duidelijk = bijzondere observaties (weinig voorkomende observaties) worden duidelijk
Algemene regel: de mogelijkheid die we hebben bij het laagstemeetniveau mogen ook gebruikt worden voor de hogere meetniveaus.Omgekeerd niet!
DDEE VERDELINGVERDELING VANVAN ÉÉNÉÉN KENMERK KENMERK ::ABSOLUTEABSOLUTE ENEN RELATIEVERELATIEVE
FREQUENTIEFREQUENTIE
Frequentietabel = een variabel (kenmerk) met de daarbij bijhorende waarden kunhe op een overzichtelijke manier hier presenteren
Tellen van streepjes brengt je op de absolute frequentie
Men dient op basis van absolute frequenties de relatieve frequenties, depercentages,cumulatieve frequenties en de cumulatieve percentages kunnenberekenen.
De absolute frequentie van een waarde = het aantal elementen met een bepaaldewaarde van die variabele
Geldige percentages = percentages berekend op diegenen die een geldigantwoord hebben op de vraag
Cumulatieve percentages = de percentages van elke volgende waarde wordt bij devoorgaande opgeteld (k)
Cumulatieve frequenties = K
Som van alle frequenties = n
Proporties = elke absolute frequentie delen door het aantal waarnemingenPercentages = proporties x100
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 6
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 7/36
Het voordeel van het gebruik van relatieve frequenties en percentages is dat defrequentieverdelingen voor verschillende, niet even grote groepen personen betervergelijkbaar worden. Wanneer minstens op een ordinaal niveau werd gemeten,heeft het verder ook geen zin om de cumulatieve percentages weer te geven.
!!! Bevat de totale steekproef minder dan 30 eenheden, dan werkt men beter met absolute aantallen.
Incidentie = het aantal nieuwe gevallen van een bepaalde conditie dat voorkomt ineen populatie gedurende een bepaalde periode
Prevalentie = het totaal aantal personen in een bepaalde conditie in een populatieop een bepaald moment
IINDELINGNDELING ININ KLASSENKLASSEN VANVAN
KENMERKENKENMERKEN
Bij het samenvoegen van categorieën moeten we rekening houden met hetmeetniveau van de variabelen.
Hercoderen = diverse groepen samenbrengen dmv statistischeverwerkingspaketten
We zouden categorieën “akkoord” en “helemaal akkoord” kunnen samenvoegenals blijkt dat er één categorie is waar slechts weinig respondenten hebben opgeantwoord. Ordinale variabelen worden niet beïnvloed door de cijfers die wetoekennen aan klassen
Indeling van klassen van metrische variabelen:- indeling obv gelijke klasselengtes- indeling obv kwartielen- inhoudelijk relevante indeling
De eerste 2 zijn statistische indelingen, en steeds correct. Niet in alle gevallen aante bevelen!
Indeling obv klasselengtesKlassegrenzen = de grenzen van de intervallen
Klassebreedte = de lengte van elk interval
Klassemidden = vertegenwoordigd de gehele klasseOm het klassemidden te bepalen, moeten eerst klassegrenzen bepaald worden
Indeling obv kwartielenBij een indeling obv kwartielen wordt ervoor gezorgd dat er in elke klasse eenzelfde proportie van het totale aantal respondenten zit
Inhoudelijke indelingWanneer we geïnteresseerd zijn in slachtofferschap van minder- enmeerderjarigen, dan is de leeftijd slechts een indicator voor de minderjarigheid dan
wel meerderjarigheid. In dat geval kan men kiezen voor een inhoudelijke indeling.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 7
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 8/36
GGRAFISCHERAFISCHE VOORSTELLINGENVOORSTELLINGEN
Grafische voorstelling = streeft naar het overbrengen van de informatie vancomplexe gegevens via beelden (tekeningen). Hierbij is het belangrijk dat hetgeconstrueerde beeld in overeenstemming is met de reële informatie in degegevens
Taartdiagram/cirkelgrafiek/pie chart = obv verschillende frequenties/percentageswordt een cirkelschijf verdeeld in sectorenPopulair bij kenmerken op ordinaal en nominaal niveau. met beperkt aantal categorieën (verwarring voorkomen)Nominale variabelen willekeurige volgorde
Ordinale en metrische variabelen ordeningscriterium volgen
Staafdiagram = de gegevens worden op 2 assen voorgesteld
We plaatsen de staafjes los van elkaar wanneer de variabele nominaal of ordinaalis.Metrische variabele staafjes aaneensluiten (histogram)
Cumulatief frequentiediagram = absolute of relatieve frequenties kunnen wordenvoorgesteld in een cumulatief frequentiediagram, vanaf het ordinale niveau.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 8
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 9/36
Wanneer de waarden in klassen zijn ingedeeld, zal het er anders uitzien. Bijindeling in klassen gaan we immers uit van de hypothese dat de waarnemingengelijkmatig verdeeld zijn over de verschillende klassen. Gevolg diagram geentrapfunctie maar gebroken lijn
Histogram = een veelgebruikte visuele voorstelling voor metrische kenmerkenSlechts één verschil met staafdiagram blokjes aan elkaar omdat de waarden vanX elkaar opvolgen. Door deze voorstelling wordt duidelijk gemaakt dat decategorieën op een continuüm liggen
Lijndiagram = de in niet klassen gegroepeerde gegevens worden visueelvoorgesteld door hun frequentie op een as aan te duiden en de punten vervolgensdmv een lijn met elkaar te verbinden.
Frequentiepolygoon = een lijndiagram voor in klassen gegroepeerde gegevens. Decategorieën worden voorgesteld door hun klassemiddens en punten gevormd doorhet aanduiden van de hoogte van de frequentie; met elkaar verbonden
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 9
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 10/36
OOPGELETPGELET METMET GRAFISCHEGRAFISCHE
VOORSTELLINGENVOORSTELLINGEN
De wijze waarop men de x-as en y-as ijkt, is bepalend voor de mate waarin metdetaillering ziet in het verloop van de cijfers en dus ook voor de wijze waarop hetbeeld zal overkomen bij de lezer
PPARAMETERSARAMETERS VANVAN CENTRACENTRA--LITEITLITEIT
Parameters van centraliteit = geven een antwoord op beschrijvende
onderzoeksvragen
Centrale tendensen = vinden we door te kijken naar centrale waarden
Centrummaten = hanteren we wanneer we de frequentieverdeling willenkenmerken adhv een centraal gelegen waarde. Deze waarde wordt dan als eenrepresentatieve maat beschouwd die de volledige verdeling van de waarnemingenzo goed mogelijk karakteriseert
ModusCategorie van de variabele met de frequentie die het vaakst voorkomt. Aangeziende modus enkel verwijst naar de waarde met de hoogste frequentie is er geenenkel probleem om de modus te bepalen bij nominale variabelen, ordinale enmetrische variabelen.
Berekenen
MediaanHet midden van de verdeling
Je moet minstens het ordinaal meetniveau hebben om de mediaan te mogengebruiken. Strikt genomen enkel van toepassing als n oneven is.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 10
Modus = meest voorkomende waarde
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 11/36
Berekenen
KwantielenInterpreteren, niet berekenenZie p. 56onderaan
Rekenkundig gemiddeldeGebruikt bij variabelen gemeten op het metrisch niveau (bij interval en ratio)Wordt verkregen door alle voorkomende waarden bij elkaar op te tellen envervolgens het totaal te delen door het aantal respondenten
Berekenen
Enkele belangrijke kenmerken:- enkel voor metrische variabelen- evenwichtspunt van de verdeling- geen robuuste maat (dus gevoelig voor uitschieters)- de som van alle afwijkingen tegenover het rek.gem is 0
Deviatiescores = de afwijkingen tegenover het gemiddelde Berekenen
Verantwoord kiezen tussen centrummaten
Belangrijk is te weten dat bij de berekening van het rekenkundig gemiddelde allewaarnemingen worden betrokken.Nadeel: extreme waarden beïnvloeden resultaten van het gemiddelde
PPARAMETERSARAMETERS VANVAN SPREIDINGSPREIDING
Parameters van spreiding = bieden een antwoord op beschrijvendeonderzoeksvragen die de ongelijke spreiding van criminologisch relevantefenomenen willen bestuderen
Variatieratio (VR)
De proportie waarnemingen die niet tot de modale categorie behoren. Ze neemt dewaarde van nul aan indien alle waarnemingen tot de modale categorie behoren.Een minder aangename eigenschap: er is geen maximumwaarde.
BerekenenDe variatieratio is hier 100%-75% oftewel 25%VR= 100%-modus (in %) of 1 –
modus (p)
Index van diversiteit
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 11
Slachtofferschapafgelopen vijf jaar
Percentage
NietMinstens één maal deafgelopen vijf jaar
7525
Mediaan = (n+1)/2
Rekenkundig gemiddelde =n
xx x x n
+++=
...21
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 12/36
Spreidingsmaat gebaseerd op de relatieve frequenties van de categorieën, maarhet enige verschil is nu dat rekening wordt gehouden met de proportie vanwaarnemingen binnen iedere categorie of equivalentieklasse
Berekenen
Spreidingsmaat ‘d’ Drukt uit in hoeverre de modus afwijkt van de situatie waarbij alle eenheden zich inde modale klasse zouden bevinden
M = het aantal categorieën van een kenmerk
Pmo = relatieve frequentie van de modusklasse
Berekenen
VariatiebreedteHet verschil tussen de grootste en de kleinste waargenomen waarde
Berekenen
De variatiebreedte is een zeer rudimentaire parameter van spreiding. Ze geeftimmers enkel aan over welke afstand de waarnemingen verspreid zijn
Interkwartielafstand (K3-K1)Het verschil tussen het derde en het eerste kwartiel Berekenen
Interdeciel-afstand = het verschil tussen het negende en het eerste deciel
Spreidingsmaten op metrisch niveauZelfde principe bij metrische spreidingsmaten.Men bepaalt eerst het rekenkundig gemiddelde en gaat dan voor elke waarneming
en hun frequenties nu, hoever ze van het rekenkundig gemiddelde verwijderdliggen. De spreidingsmaten zijn niet zo robuust.
De gemiddelde absolute afwijkingDe som van de absolute waarden van de afwijkingen van elke waarde ten aanzienvan het rekenkundig gemiddelde, gedeeld door het aantal waarnemingen.
Niet berekenen
Variatie (sum of squares/var)De optelsom van de kwadraatafwijking geeft een indicatie van spreading: hoegroter de maat, hoe groter de verschillen tussen de statistische eenheden
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 12
ID = 1 – (f1*f1 + f2*f2 +f3*f3 +…fn*fn)
V= max x – min x
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 13/36
Berekenen
SteekproefvariantieDe variatie gedeeld door het aantal onderzoekseenheden wanneer we overpopulatiegegevens beschikken en gedeeld door het aantal steekproefeenhedenminus 1
Berekenen
SteekproefstandaardafwijkingDe vierkantswortel van de steekproefvariantie
Berekenen
Variatiecoëfficiënt Laat toe de spreiding van verdelingen die worden uitgedrukt in verschillende
meeteenheden, te vergelijken.Wordt berekend door de standaardafwijking te delen door het rekenkundiggemiddelde
Berekenen
ZZELFELF UITREKENENUITREKENEN VANVAN GEMIDDELDEGEMIDDELDE,,VARIANTIEVARIANTIE ENEN STANDAARDSTANDAARD--
AFWIJKINGAFWIJKING
zie p. 69 (!)
PPARAMETERSARAMETERS VANVAN VORMVORM
Wanneer we vergelijking inzake vorm, kunnen we vaststellen dat verdelingenverschillen in de mate waarin zij afwijken van een symmetrische verdeling
Symmetrie kan enkel bestudeerd worden voor metrische meetschalen.
Symmetrie = als het rek.gem en de mediaan aan elkaar gelijk zijn
Positief asymmetrisch = als de verdeling een langere staart naar rechts heeft
(rek.gem > mediaan)
coëfficiënt positieve waarde
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 13
1
1
2
2)(
−=
∑ −=
n
i
n
i
x x s
s x x
sn
i
n
i 21
2
1
)(=
−=
∑ −=
V= s/X
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 14/36
Negatief asymmetrisch = langere staart naar links (rek.gem < mediaan) coëfficiënt negatieve waarde
Empirisch coëfficiënt van Pearson:- bereken het verschil tussen het gemiddelde en de mediaan
- deel deze waarde door de standaardafwijkingKurtosis/afplatting = de mate van afplatting van de gegevens rondom het rek.gem.de kurtosis wordt steeds met de standaardnormale of Gauss-verdeling alsstandaard vergeleken
DDEE BBOXOX-P-PLOTLOT
Box-plot = een overzichtelijke manier om gegevens vanaf ordinaal meetniveauvisueel voor te stellen; visuele weergave van de positie, spreiding en symmetrievan de verdeling.Vorm kan worden afgeleid uit de waarde van de mediaan, eerste en derde kwartiel.
Symmetrie afleiden uit verdeling van waarden rond de mediaan: liggen dewaarnemingen gelijk verspreid rond de mediaan, dan is de verdeling symmetrisch
Een box-plot laat toe de extreme waarden (uitbijters/outliniers) te detecteren
Samenstelling zie p. 72-73
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 14
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 15/36
DDEELEEL 4: D4: DOELSTELLINGOELSTELLING VANVAN DEDE BIVARIATEBIVARIATE BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK
DDOELSTELLINGOELSTELLING VANVAN DEDE BIVARIATEBIVARIATE
BESCHRIJVENDEBESCHRIJVENDE STATISTIEK STATISTIEK
Bivariate beschrijvende statistiek = gebruiken we indien we de relatie tussen tweekenmerken willen beschrijven
Doelstelling de belangrijkste aspecten van een relatie tussen twee veriabelensamen te vatten op een eenduidige en economische manier
Keuze hangt af van het meetniveau van de twee variabelen.
Een criminoloog kan twee soorten onderzoeksvragen stellen die kunnenbeantwoord worden adhv bivariate beschrijvende statistiek:
- oorzakelijke (etiologische) onderzoeksvragen- vragen naar samenhang, zonder uitspraken te doen over causale relaties
BBIVARIATEIVARIATE FREQUENTIEFREQUENTIE--VERDELINGVERDELING
Bivariate frequentieverdeling = de frequentieverdeling van twee kenmerken; zokunnen we nagaan of de frequentieverdeling van één variabele samenloopt met defrequentieverdeling van een ander kenmerk.Ze worden vooropgesteld adhv een kruistabel.
Kruistabel (contingentietabel) = een tabel waarin de categorieën van tweevariabelen tegenover elkaar worden uitgezet en waarin de waargenomenfrequentie van elke combinatie van categorieën vermeld staat.
Celfrequenties = geven aan hoeveel keer een bepaalde combinatie vancategorieën van variabelen voorkomen
Rijtotalen en kolomtotalen worden ook wel de marginalen genoemd
Marginalen = geven de univariate frequentieverdeling van de respectievelijkevariabelen weer
Steekproefomvang = de som van alle celfrequenties
Voor metrische variabelen ligt het iets moeilijker om te werken met eencontingentietabel. Bij metrische variabelen komen meestal heel veel verschillendewaarden voor.
Puntenwolk/scatterplot = grafische voorstelling van de frequentieverdeling vantwee variabelen die gemeten zijn op metrisch niveau. In een puntenwolk wordentwee variabelen tegen elkaar uitgezet door de waarden van de variabele X op deabscis te plaatsen, en de waarden van de variabele Y op de ordinaat te zetten.
SS YMMETRISCHE YMMETRISCHE ENEN ASYMMETRISCHEASYMMETRISCHE
RELATIESRELATIES TUSSEN TUSSEN VARIABELENVARIABELEN
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 15
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 16/36
Basisformat = de visuele vertaling van de onderzoeksvraag in de formelesymbolische taal die in de statistiek gebruikt wordt. Daartoe wordt een bepaaldnotitiesysteem gehanteerd.
Asymmetrische relatie = wordt veroorzaakt doordat de ene variabele een causaleinvloed uitoefent op de andere. X is een oorzaak van YEr is steeds een afhankelijke en een onafhankelijke variabele
De afhankelijke variabele wordt steeds voorgesteld met de hoofdletter Y en deonafhankelijke variabele steeds met hoofdletter X
Rechtstreeks effect = betekent dat een onafhankelijke variabele een rechtstreekseinvloed heeft op de afhankelijke variabeleSymmetrische relatie = hierbij kan men op theoretische gronden geen onderscheidmaken tussen de beide variabelen. Het enige wat we kunnen zeggen is dat debeide kenmerken samenhangen. Er bestaat een verband, maar we kunnen nietzeggen hoe de invloed verloopt
- ten eerste kan er sprake zijn van een wederzijdse (reciproke) invloed tussenbeide variabelen
- ten tweede kan er sprake zijn van een schijnverband. Dan is er sprake vaneen gemeenschappelijke oorzaak
- ten derde kan er een samenhang bestaan tussen twee variabelen omdatdeze indicatoren van hetzelfde begrip zijn
In dat geval vertonen beide metingen meetfouten en is de doorsnee het gevolgvan het gemeenschappelijke achterliggende theoretische kenmerk dat beideindicatoren delen.
HHETET VOORSTELLENVOORSTELLEN VANVAN
STATISTISCHESTATISTISCHE RELATIESRELATIES
VIAVIA EENEEN BASISFORMATBASISFORMAT
Om de statistische analyse overzichtelijk te houden is het verstandig hetbasisformat van een onderzoeksvraag te zoeken en schematisch voor te stellen.Hiervoor bestaat een notitiesysteem dat door sociale wetenschappers standaardgehanteerd wordt bij het visualiseren van onderzoeksvragen.Dit notitiesysteem is een taal die door onderzoekers overal ter wereld wordtbegrepen. Het is dus van belang deze taal te kennen.
Stochastische afhankelijkheid = kennis van één variabele is nooit voldoende om de
waarde te kennen van een andere variabele
Statistische onafhankelijkheid = er bestaat geen enkele vorm van samenhangtussen twee kenmerken.
Analytische afhankelijkheid = een perfecte statistische relatie. In dit geval is ersprake van een deterministisch verband
De ovale vorm = staat voor een latente variabele of een niet rechtstreeks gemetenkenmerk
Het vierkant = wordt gebruikt om een kenmerk van het metrisch niveau voor te
stellen. Manifeste variabelen of een kenmerk rechtstreeks gemeten bij deonderzoekseenheid
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 16
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 17/36
Blokken = worden gebruikt om variabelen van ordinaal of nominaal niveau voor testellen
De dubbele gebogen pijl = staat voor een symmetrisch statistisch verband; er iseen symmetrie tussen de varabelen, geen interdependentie
De gerichte pijl = een oorzaak-gevolgrelatie (X onafh.variabele; Y afh.variabele)
De gevorkte pijl = wordt gehanteerd voor het weergeven van een interactie-effectOm ineractie op te sporen, treedt er steeds een derde variabele in het spel, endaarom wordt het fenomeen van de interactie pas later uiteengezet
CCAUSALEAUSALE RELATIESRELATIES
VSVSSTATISTISCHESTATISTISCHE RELATIESRELATIES
We kunnen met statistiek NOOIT het bestaan van causale relaties bevestigen. Hetenige wat we kunnen doen, is de kenmerken (sterkte, richting en vorm) van eenverband nagaan.
VVERANTWOORDERANTWOORD KIEZENKIEZEN TUSSEN TUSSEN
EENEEN REEKSREEKS VANVAN ASSOCIATIEASSOCIATIE--MATENMATEN
Associatiematen zijn voor de kwantitatieve criminoloog-onderzoeker “the tools of the trade” zoals scalpels en andere operatiegereedschappen tot degereedschapskist van de chirurg behoren.Bij de keuze voor een best passebde associatiemaat houdt men rekening met tweecriteria:
- ten eerste is er het meetniveau van de (on)afhankelijke variabele. Alsbeiden verschillend zijn meetniveau op laagste niveau gemeten
- ten tweede is er de verwachte theoretische richting van de associatie:symmetrische of asymmetrische analysetechnieken worden dan gekozen infunctie van de verwachte theoretische associatie.
Asymmetrische analyse = wanneer we uitspraken willen doen in de trant van “Xleidt tot Y” of “als X dan Y”
AASSOCIATIEMATENSSOCIATIEMATEN VOORVOOR
KENMERKENKENMERKEN OPOP NOMINAALNOMINAAL
NIVEAUNIVEAU
Het percentageverschil BerekenenKruistabellen worden gebruikt wanneer we de relatie tussen twee nominalekenmerken willen bestuderen. De verschillen in de afhankelijke variabele wordenvergeleken over de verschillende categorieën van de onafhankelijke variabele. Wegebruiken hiervoor vaak het percentageverschil en de odds ratio.
Statistisch dienen we bij het maken van een bivariate kruistabel het onderscheid temaken tussen een onafhankelijke en een afhankelijke variabele. Een afhankelijke
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 17
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 18/36
variabele is een kenmerk dat beïnvloedt wordt door één of meerdere kenmerken.Een onafhankelijke variabele is een kenmerk dat invloed uitoefent op een anderkenmerk.
!!! Geslacht kan nooit een afhankelijke variabele zijn
Als een theorie stelt dat één variabele een andere veroorzaakt, dan zettenwe vaak de oorzakelijke of onafhankelijke variabele in de kolom,
Terwijl we de afhankelijke variabele in de rij plaatsen. Verschillen op één categorie van de afhankelijke variabele bestuderen voor
de verschillende categorieën van de onafhankelijke variabele Verschil= percentagepunten!!!
Zie p. 87-88 vb
Richtlijnen bij het percenteren van de tabellen; regels:
vermeld altijd het totale aantal waarnemingen indien enkel de percentages of proporties in een tabel werden opgenomen bereken nooit een percentage wanneer het aantal gevallen kleiner is dan 30(met 1 eenheid verminderen verlaging van 3% geen significantie meer!)
De odds ratioOdds ratio = om 2 nominale kenmerken te bestuderen. Het is een maat om deverhouding tussen het voorkomen van een gebeurtenis en het niet voorkomen vaneen gebeurtenis uit te drukken (symmetrische associatiemaat)
Berekenen
Kruisproduct ratio = de verhouding tussen twee odds
De odds is tevens de basis voor de logistische regressie-analyse. De interpretatievan de odds ratio is relatief eenvoudig. De odds ratio neemt de waarde aan van 1bij afwezigheid van een verband en wijkt af van 1 naarmate dat het sterker wordt.De afwijking gebeurt naar 0 of naar +∞
Chi-kwadraat (X²) BerekenenX² = wordt gebruikt om na te gaan of waargenomen celfrequenties systhematischafwijken van verwachte celfrequenties indien geen associatie zou bestaan tussende twee kenmerken.
Vooral om kruistabellen te analyseren.Kan beschouwd worden als een maat voor de sterkte van een relatie tussen tweevariabelen gemeten op nominaal niveau, of tussen de nominale en ordinalevariabele..De waarde van X² neemt toe naarmate de associatie tussen de variabelen sterkeris.Moeilijk te interpreteren.Erg gevoelig voor het aantal meeteenheden in onze tabel.
Voorwaarden:- de data in de frequentietabel dienen ruwe frequenties te zijn, geen
scores/percentages
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 18
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 19/36
- de onderzochte variabelen dienen categorisch te zijn, en de meetwaardendienen elkaar uit te sluiten. Elke observatie mag slechts in één celthuishoren
- de X² waarde mag maar geïnterpreteerd worden indien aan een aantalvoorwaarden is voldaan max 20% van de cellen bevat een frequentie van
<5 en geen enkele van 0Phi Interpreteren, niet berekenenPhi = een associatiemaat die gebaseerd is op X² en neemt de waarde 0 aan bijgeen associatie; 1 bij perfecte associatie.
Phi wordt gebruikt bij de berekening van de associatie tussen kenmerken in een2*2 tabel
Cramer’s V Interpreteren, niet berekenenCramer’s V = de meest aangewezen coëfficiënt van die associatiematen diesteunen op X². V is belangrijk want deze associatiemaat corrigeert voor de
gevoeligheid van X² voor de steekproefgrootte en het aantal rijen en kolommenvan variabelen.V varieert van 0 tot 1 en wordt gebruikt bij associaties tussen kenmerken in eenr*k tabel.
AASSOCIATIEMATENSSOCIATIEMATEN VOORVOOR
KENMERKENKENMERKEN OPOP ORDINAALORDINAAL
NIVEAUNIVEAU
Gamma Interpreteren, niet berekenenGamma = voor de samenhang tussen variabelen van het ordinale niveau teberekenen.Waarde: -1 tot +1Gebaseerd op de verhouding tussen consistente paren en inconsistente paren.
-1 perfect negatief verband+1 perfect positief verband0 afwezigheid van een verband
Hoe verder van 0, hoe sterker de associatie
Negatieve relatie = waarde <0 hoge waarden op de variabele gaan samen metlage waarden op de andere variabele
Positieve relatie = waarde >0 hoge waarden op de variabele gaan samen methoge waarden op de andere variabele
Consistente paren = ieder paar van de elementen waarbij de waarde van het eneelement op beide variabelen hoger is dan van het andere element.
Inconsistente paren = ieder paar van elementen waarbij de waarde van het eneelement op de ene variabele hoger is en op de andere variabele lager is dan hetandere element
Gamma kan ook berekend worden voor metrische variabelen die men ordinaalmaakt door deze variabelen in categorieën te brengen. Echter, het is mogelijk dat
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 19
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 20/36
de associatie hierdoor verschilt omdat de categorisering arbitrair is gebeurt. Alsdat gebeurt, kan dat zijn dat de associatie niet rechtlijnig is.
De rangcorrelatiecoëfficiënt van Spearman en Kendall’s Tau-b Interpreteren,niet berekenenRangcorrelatiecoëfficiënt = in dit geval toetsen we de nulhypothese dat beiderangordeningen niet van elkaar verschillen
Rangcorelatiecoëfficiënt van Spearman = afgeleid van de product-momentcorrelatiecoëfficiënt van Pearson. Deze varieert van -1 tot +1.Om Rho te berekenen bepalen we per eenheid het verschil tussen de beiderangordeningen.
Kendall’s Tau-b = symmetrische associatiemaat die varieert tussen -1 en +1. Bijperfecte statistische associatie worden -1 of +1 slechts bereikt onder conditie vanhet aantal rijen even groot is als het aantal kolommen.
SS YMMETRISCHE YMMETRISCHE ASSOCIATIEASSOCIATIE--MATENMATEN VOORVOOR KENMERKENKENMERKEN
OPOP METRISCHMETRISCH NIVEAUNIVEAU
Als blijkt dat hoge criminaliteitsgraden in buurten samenhangen met hogewerkloosheidspercentages, dan is er sprake van een positieve samenhang.Hoge criminaliteitsgraden, lage werkloosheidspercentages: negatieve samenhang.Geen samenhang covariantie, covariatie en correlatie = 0
Sterkte = duidt op de mate waarin beide variabelen al dan niet samenhangen
Als in een puntenwolk de punten een lineair patroon vormen, is er sprake van eenzekere lineaire samenhang tussen de variabelen.
Covariaties, covarianties en correlaties worden gebruikt om de samenhang tussentwee variabelen in te schatten en het gaat hierbij om symmetrischeassociatiematen.Geen sprake van (on)afhankelijke variabele.
CovariatieStelt de mate voor waarin beide variabelen samen variëren. Het is de som van de
kruisproducten van de afwijkingen van X waarden tov hun gemiddelde enerzijds,en de afwijkingen van Y tov hun gemiddelde anderzijds.
SS(x,y) = { ( 1 x - x )·( 1 y - y ) + ... + (n
x - x )·(n y - y ) }
B
erekenen
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 20
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 21/36
De gesommeerde deviatiescores van de twee variabelen worden vermenigvuldigd.
CovariantieGezien de covariantie afhankelijk is van de meeteenheid waarin de variabelen zijnopgenomen kan de absolute waarde van de covariantie weinig informatie biedenover de sterkte van de samenhang.
Een grotere waarde van de covariantie duidt niet op een sterkere samenhang maaris een rechtstreeks gevolg van het feit dat de numerieke waarde en de spreidingvan inkomen groter is bij jaarlijks dan bij wekelijks inkomen (zie vb p103)
Berekenen
Covariatie gedeeld door n-1.
De product-moment correlatiecoëfficiënt van PearsonIs gelijk aan de covariantie tussen X en Y in gestandaardiseerde vorm
Berekenen
Standaardisatie maakt de interpretatie van de associatie tussen twee metrischevariabelen eenvoudiger.
Zeer sterke correlatie r>0.50Matige tot sterke correlatie 0.2<r<0.50
CCOVARIATIEOVARIATIE,, COVARIANTIECOVARIANTIE
ENEN CORRELATIECORRELATIE:: EENEEN UITGEWERKTUITGEWERKT
REKENVOORBEELDREKENVOORBEELD
Stappen te volgen bij het uitrekenen van een correlatie:• 1:Bereken het rekenkundig gemiddelde van de twee variabelen, zoals
eerder werd uiteengezet.• 2:Bereken de afwijkingen van elke eenheid ten opzichte van het
rekenkundig gemiddelde voor de beide variabelen X en Y.
• 3:Kwadrateer de afwijkingen van elke eenheid met het rekenkundiggemiddelde. Op die manier leg je de basis voor de berekening van devariatie in X en Y en covariatie tussen X en Y.
• 4:Neem de som van de gekwadrateerde afwijkingen tegenover degemiddelde waarde van X en neem de som van de gekwadrateerdeafwijkingen tegenover de gemiddelde waarde van Y.
• 5:Bereken de variantie van X en de variantie van Y. Dit gebeurt door zowelvariatie van X als de variatie van Y delen door N-1.
• 6: Bereken de vierkantswortel van de variantie in X en de vierkantswortelvan de variantie in Y. Je hebt nu ook de standaardafwijking van X en van X.
• 7: Bereken de kruisproductensom en je hebt de covariatie.
• 8: Deel de kruisproductensom door n-1 en je hebt de covariantie tussen Xen Y.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 21
1
))((1
−
−−
=
∑=
n
y xn
iii
xy
y x s
R= Cov / (Sx*Sy)
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 22/36
• 9: Vermenigvuldig de standaardafwijking van X met de standaardafwijkingvan Y
• 10: Deel de covariantie tussen X en Y door de vermenigvuldiging van destandaardafwijking van X met de standaardafwijking van Y. Dit resultaat isde correlatiecoëfficiënt.
DDEE BIVARIATEBIVARIATE LINEAIRELINEAIRE
REGRESSIEREGRESSIE--ANALYSEANALYSE ALSALS
ASYMMETRISCHEASYMMETRISCHE ANALYSEANALYSE-- TECHNIEK TECHNIEK
Het intercept in een bivariate lineaire regressieanalyse kunnenberekenen
OLS = Ordinary Least Squares principe dat wordt gebruikt om de regressie-analyse mathematisch uit te voeren (regressie-analyse = asymmetrischeassociatiemaat)
Enkelvoudige lineaire regressie-analyse = levert een statistische vergelijking opwaarmee de afhenkelijke bariabele voorspeld kan worden obv de onafhankelijkevariabele
• ‘enkelvoudig’ – bivariaat: 1 onafhankelijke variabele
• ‘lineair’ – Eenvoudige samenvatting van puntenwolk dmv rechte
• ‘regressie’ – Techniek om de positie van de rechte te bepalen
Regressiecoëfficiënten = de B’s zijn de populatieparameters die met een regressie-analyse geschat worden en worden daarom ook zo genoemd
Zie p 108 verdere uitleg formule
Regressiecoëfficiënten bepalen = gebeurt via “de gewone kleinstekwadratenoplossing”
Residuele variatie = de kwadratische afwijking van de punten tov deregressierechte is een kwaliteitsmaat voor de gevonden rechte
Het mag duidelijk zijn dat we met het blote oog niet in staat zijn preciezeuitspraken te doen. Daarom doen we beroep op een reeks coëfficiënten die dekwaliteit van de regressielijn helder uitdrukken. Eénmaal de regressiecoëfficiëntengekend zijn, dient nog bepaald te worden of en hoe goed men de waarden van de
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 22
Y = B0 + B1X + eOf
Y = a + b1X + e
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 23/36
afhankelijke variabele (Y) kan voorspellen obv de waarden van de onafhankelijkevariabele (X)
De afwijkingen van het gemiddelde van Y bestaan uit twee componenten:- toevallige afwijkingen (residual)- verklaarde afwijkingen (afwijkingen van rek.gem verklaard door de
regressielijn)
Totale variantie van Y:- Regression sum of squares = de variantie Y die vertegenwoordigd wordt
door X- Residual sum of squares/foutenvariatie = de mate waarin de voorspelde
waarden van Y afwijken van de geobserveerde waarden van YNiet berekenen, wel betekenis kennen
Determinatiecoëfficiënt R² = de verhouding van de verklaarde variatie tov detotale variatie
R² is de proportionele reductie in de voorspellingsfout die intstaat door op deregressielijn te steunen boj de voorspelling van de afhankelijke variabele en is dusde proportie van de totale variatie in Y die door X wordt verklaard.Het is een symmetrische maat, maar het is wel mogelijk om een asymmetrischeinterpretatie aan R² te geven.Berekenen
Teller = bevat variatie die bestaat uit de variatie tussen de voorspelde waarde ende gemiddelde waarde. De gemiddelde waarde is immers onze beste voorspellerals we geen onafhankelijke variabele hebben
Noemer = bevat de variatie in Y
ZZELFELF UITREKENENUITREKENEN VANVAN
DEDE PARAMETERSPARAMETERS VANVAN DEDE
REGRESSIERECHTEREGRESSIERECHTE
Zie p. 115-116!! Uitrekenen bivariate regressie (!)
VVERONDERSTELLINGENERONDERSTELLINGEN BIJBIJ
HETHET UITVOERENUITVOEREN VANVAN EENEEN
LINEAIRELINEAIRE REGRESSIEREGRESSIE--ANALYSEANALYSE
- Ten eerste wordt wat betreft het meetniveau verondersteld dat zowel deafhankelijke als de onafhankelijke variabele gemeten zijn op interval- of ratio-meetniveau.
- Een tweede veronderstelling is dat er een lineair verband bestaat tussen deonafhankelijke en afhankelijke variabele
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 23
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 24/36
Zo wordt er verondersteld dat voor elke waarde van de onafhankelijke variabele deafhankelijke variabele een normale verdeling kent
Heteroscedasticiteit = een regressieassumptie voor de lineaire regressie: hetbetekent dat de variatie van de afhankelijke variabele voor elke waarde van deonafhankelijke variabele gelijk dient te zijn
Outliers/uitbijters = extreme waarden die de regressierechte beïnvloeden
DDEE RAPPORTAGERAPPORTAGE VANVAN DEDE
BELANGRIJKSTEBELANGRIJKSTE PARAMETERSPARAMETERS
VANVAN DEDE REGRESSIERECHTEREGRESSIERECHTE ININ EENEEN
RAPPORTRAPPORT
Lees p 118
EENN WATWAT ALSALS DEDE MEETNIVEAUSMEETNIVEAUS VANVAN 22
VARIABELENVARIABELEN VERSCHILLENDVERSCHILLEND ZIJNZIJN??
Is een onafhankelijke variabele “opleidingsniveau” gemeten op ordinaal niveau eneen afhankelijke variabele “slachtoffer of niet” op een nominaal niveau, dan kiestmen strikt genomen op een analysetechniek op nominaal niveau.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 24
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 25/36
DDEELEEL 5: D5: DEE STANDAARDNORMALESTANDAARDNORMALE VERDELINGVERDELING ENEN DIENSDIENS EIGENSCHAPPENEIGENSCHAPPEN
IINLEIDINGNLEIDING
Gauss-curve/normale verdeling = de verdeling bendadert een ‘perfecte klokvorm’.Deze (theoretische) verdeling is uitermate belangrijk omdat er een aantaleigenschappen aan verbonden zijn, die we nodig hebben wanneer we later gaanpogen om uitspraken obv steekproeven gaan veralgemenen naar de populatie.
DDEE NORMALENORMALE ENEN STANDAARDSTANDAARD--NORMALENORMALE VERDELINGVERDELING
Buigpunten = zijn punten waar de vorm van de kromme overgaat van bol naar hol
Zie vb p 123-124
VVANAN NORMALENORMALE VERDELINGVERDELING
NAARNAAR STANDAARDNORMALESTANDAARDNORMALEVERDELINGVERDELING
Standaardisering = om te vermijden dat men telkens de oppervlakte onder decurve moet berekenen obv de formule, hebben statictici gezocht naar dit. Hierdoordiende men de oppervlakte eenmalig te berekenen en vast te leggen in een tabel.
Z-verdeling =a) het gemiddelde van de standaardnormale verdeling wordt op 0 gesteld door vaniedere waarde het gemiddelde van de oorspronkelijke reeks af te trekkenb) de standaardafwijki,g wordt op 1 gesteld door de absolute waarde van het bij (a)berekende verschil te delen door de standaardafwijking van de oorspronkelijkereeks
Z-Z-SCORESSCORES ENEN HETHET GEBRUIK GEBRUIK
VANVAN DEDE TABEL TABEL VANVAN DEDE
STANDAARDNORMALESTANDAARDNORMALE
VERDELINGVERDELING
Een Z-score wordt als volgt berekend:
Berekenen
zie vb p 128-130
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 25
σ
µ −
= x
z
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 26/36
DDEELEEL 6: E6: EENEN INLEIDINGINLEIDING ININ KANSREKENENKANSREKENEN
WWAAROMAAROM KANSREKENENKANSREKENEN VOORVOOR
CRIMINOLOGENCRIMINOLOGEN??
Toevalsmechanisme = elk element heeft een zelfde kans om getrokken te wordenin de steekproef
K K ANSDEFINITIESANSDEFINITIES
Kansexperimenten = experimenten waarvan wordt geëist dat ze een onbeperktaantal keren kunnen worden herhaald onder gelijkblijvende omstandigheden
Kans = steeds tussen 0 en 1Notatie PKans om 6 te gooien met één dobbelsteen P(6)
Kansdefinitie van Laplace = het aantal uitkomsten waarin je geïnteresseerd bentgedeeld door het aantal mogelijke uitkomsten van een kansexperiment
A uitkomst kansexperiment waarin jegeïnteresseerd bent
N(A) aantal uitkomsten waarin je geïnteresseerd bentN aantal uitkomstenBerekenen
Relatieve frequentie = te bepalen door het kansexperiment te herhalen envervolgend te kijken hoe vaak de uitkomst die je interesseert zich voordoet tov het
totaal aantal herhaalde kansexperimenten
n(A) aantal uitkomsten waarin je geïnteresseerd bent bijherhaling van experiment
n aantal herhalingen van het experimentBerekenen
De experimentele wet = naarmate het aantal herhalingen van een toevalsprocestoeneemt, zullen de kansen van de elementen van S(steekproef) zich meer enmeer stabiliseren.
Criminologen zien steekproefgegevens als een uitkomst van een kansproces!
Subjectieve kans = wanneer je mensen over straat hoort praten over hun eigenimpressies; de eigen inschatting en is gebaseerd op de perceptie van het individu
K K ANSREGELSANSREGELS
Algemene somregel
Zie vb p 134 Berekenen
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 26
Formule Laplace: N(A)/N
P(A)=n(A)/n
P(AofB) = P(A) + P(B) – P(AenB)
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 27/36
De speciale somregel
A en B hebben niets met elkaar gemeen!!
De algemene productregelVoorwaardelijke kans = de kans op een bepaalde uitkomst als je al gedeeltelijkeinfo hebt over de uitkomst van een kansexperimentDe kans op gebeurtenis A, onder conditie van gebeurtenis B.
Dit is de kans op B gegeven A. als we deze regeltoepassen en we willen weten wat de kans is op het
gooien van een getal niet hoger dan 3 (kans op B), gegeven het feit dat het eeneven getal moet zijn (kans op A) dan bekomen we:
P(AenB) = de probabiliteit dat een getal even is Enhoogstens 3 is : 1/6 (enkel 2 is kleiner of gelijk aandrie en even)P(A) = de probabiliteit dat een getal even is : 3/6De voorwaardelijke kans = 1/6 gedeeld door3/6 of 1/6
* 6/3 = 6/18
De speciale productregel
PPERMUTATIESERMUTATIES ENEN
COMBINATIESCOMBINATIES
Permutaties = het aantal manieren waarop je een aantal verschillende objectentov elkaar kan plaatsenBerekenen
Volgorde is van belang
Wordt weergegeven als n! (faculteit)
K K ANSVARIABELENANSVARIABELEN ENEN DEDE
BINOMIALEBINOMIALE VERDELINGVERDELING
Kansvariabele = geeft aan in welk getal een kansexperiment resulteert. De notatievan een kansvariabele is bijvoorbeeld k of x. het streepje verwijst naar het feit datwe te maken hebben met een kansexperiment en dat niet bij voorbaat vast staatwat de uitkomst zal zijn
Verdelingsfunctie = het overzicht van de uitkomsten van een kansvariabele met dehierbij behorende gecumuleerde kansen
Verwachte waarde = de som ban de uitkomsten vermenigvuldigd met de kans opiedere uitkomst
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 27
P(AofB) = P(A) + P(B)
P(B A) = P (AenB) / P (A)│
P(A) = 1-P (complement van A)
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 28/36
BBINOMIALEINOMIALE VERDELINGVERDELING
Lees p 140-143 vbn
BBINOMIALEINOMIALE DERDELINGDERDELING GAATGAAT
OVEROVER ININ EENEEN NORMALENORMALE VERDELINGVERDELING
zie p 144-148 oef n
WWAAROMAAROM ISIS DEDE BINOMIALEBINOMIALE VERDELINGVERDELING
ZOZO BELANGRIJK BELANGRIJK ININ KWANTITATIEFKWANTITATIEF
CRIMINOLOGISCHCRIMINOLOGISCH ONDERZOEK ONDERZOEK ??
Vele kenmerken waarin de criminoloog geïnteresseerd is, volgen een binomialeverdeling.
Het al dan niet plaatsvinden van criminele gebeurtenissen, zoals slachtofferschap,is zo een vb. Deze kenmerken zijn categorische variabelen, dichotomieën.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 28
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 29/36
DDEELEEL 7: I7: INFERENTIËLENFERENTIËLE STATISTIEK STATISTIEK ININ DEDE PRAKTIJK PRAKTIJK
WWAAROMAAROM GEBRUIKENGEBRUIKEN WEWE
INFERENTIËLEINFERENTIËLE STATISTIEK STATISTIEK ??
We gebruiken steekproeven die een zo goed mogelijke afspiegeling zijn van depopulatie en die, in theorie, een excellente basis vormen om conclusies voor deganse populatie te trekken. Een steekproef is steeds een subgroep van depopulatie die moet bestudeerd worden.
Inferentiële statistiek = kunnen we uitspraken dien over een breder geheel aaneenheden dan diegenen die we bevraagd hebben. Dit doen we via het gebruik vanbetrouwbaarheidsintervallen en significatietoetsen.
DDEE REPRESENTATIVITEITREPRESENTATIVITEIT VANVAN
STEEKPROEVENSTEEKPROEVEN
Het doel van inductieve statistiek = het veralgemenen van de gegevens verzameldvoor een steekproef naar de populatie waaruit ze getrokken werden
Meetfout = door onprecieze metingen bepaalde onjuiste waarnemingen bekomen.Waarnemingen gedaan op een bepaald ogenblik in de tijd, kunnen later andereresultaten opleveren
Statistische inferentie houdt zich met deze onzekerheden bezig door 2 functies tevervullen:
- schatting gebruik van steekproefkenmerken om ze naar de populatie teveralgemenen
-hypothesen testen of toetsen kan men met voldoende zekerheid eenbepaalde onderzoekshypothese aannemen of moet men ze op basis van degegevens verwerpen?
SS TEEKPROEVEN TEEKPROEVEN ENEN
POPULATIEPOPULATIE
Afbakenbare populatiesOpgeslagen in computers of in een kaartenbakkensysteem leveren ons lijsten
Hypothetische populaties
Bestuderen van invloed van roken op longkanker, cijfers slachtofferschap… geenduidelijke populatieHypothetische populaties omdat we ze niet op lijsten terugvinden of kunnenidentificeren
SS TEEKPROEVEN TEEKPROEVEN ENEN HETHET
PRINCIPEPRINCIPE VANVAN TOEVAL TOEVAL
Goede afspiegeling = om die te verkrijgen moeten we een steekproef lukraaksamenstellen (random sample)
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 29
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 30/36
Steekproeffout = wordt bepaald en onder controle gehouden door voldoendeaandacht te besteden aan het steekproefkader, -ontwerp en de implementatieervan.
Steekproefkader = geeft weer wie (administratief) deel uitmaakt van de teonderzoeken doelpopulatie, en bijgevolg kans heeft of moet hebben om in desteekproef opgenomen te worden
DDEE THEORIE THEORIE VANVAN
TOEVALSSTEEKPROEVEN TOEVALSSTEEKPROEVEN
Aselecte steekproeven = steekproeven waarin elke elementaire eenheid uit deempirische populatie een berekenbare kans heeft om in de steekproef opgenomente worden.
Steekproefgrootheden = statistieken afkomstig uit steekproeven zoals gemiddelde,standaardafwijking, rico
Populatieparameters = verwijzen naar het gemiddelde, standaardafwijking, rico..inde populatie
Inferentiële statistiek = hier doen we uitspraken over de populatie obv wat wevinden in een aselecte steekproef uit die populatie. We grbeuiken dussteekproefkenmerken om iets te zeggen over de populatiekenmerken.
∏, µ en σ zijn de parameters van de populatie
2 hoofdactiviteiten binnen inferentiële statistiek:- schattenPuntschatting = de schatting van een kenmerk in de populatie obvsteekproefgegevens. Vb de schatting van het gemiddeld aantal delicten waarvaniemand slachtoffer wordt
Intervalschatting = de marges waarbinnen we met een zekere graag vanonzekerheid een puntschatting inschatten
- toetsenKansrekenen vormt de basis van de inferentiële statistiek
Werkelijke waarde = naarmate het aantal toevalssteekproeven van dezelfdeomvang (in ons vb n=100) groter wordt, de concentratie van de uitkomsten rondde werkelijke waarde toeneemt.Het is de waarde in de populatie die we kennen via de studentenadministratie
K K ENMERKENENMERKEN VANVAN
STEEKPROEVENVERDELINGSTEEKPROEVENVERDELING
Een (theoretische) steekproevenverdeling is altijd een theoretische kansverdelingdie de functionele relatie toont tussen de mogelijke waarden van een bepaalde
statistiek, gebaseerd op een steekproef van n eenheden, en de kans (dichtheid)
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 30
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 31/36
verbonden met elke waarde, voor alle mogelijke steekproeven van identiekeomvang n die uit een specifieke populatie getrokken worden.
Lees p 155
GGEBRUIK EBRUIK VANVAN DEDE NORMALENORMALE
VERDELINGVERDELING ININ DEDE INFERENTIËLEINFERENTIËLE
STATISTIEK STATISTIEK
Als we een reeks grote steekproeven trekken uit de populatie, dan weten we datde steekproefgemiddelden normaal verdeeld zijn. Deze eigenschap vansteekproefgemiddeldenverdeling is heel belangrijk in de inferentiële statistiek.Deze verdeling is symmetrisch en ééntoppig, gekenmerkt door de ‘klokvorm’ en
wordt volledig bepaald door de parameters µ (populatiegemiddelde) en σ(standaardafwijking)
Z-scores het verschil van een warde en het gemiddelde en dit delen door destandaardafwijking
DEDE CENTRALECENTRALE
LIMIETSTELLINGLIMIETSTELLING
68-95-99 regel zie p 157
Centrale limietstelling = adhv voorbeeld uitgelegd p 157
We kunnen steeds bepalen welke de kans id op een welbepaaldesteekproefuitkomst indien we het populatiegemiddelde en de populatievariantiekennen.
Betrouwbaarheidsinterval/-gordel = binnen welk interval rond desteekproefuitkomst het populatiegemiddelde valt
PPUNTSCHATTINGUNTSCHATTING ENEN INTERVALSCHATTINGINTERVALSCHATTING
vb oef p 159-160
Schatter = een grootheid die berekend wordt adhv een bepaalde functie obv deinformatie van de steekproef en wordt uitgedrukt in een formule. Een schatter ishet resultaat van een schatting
Zuivere schatter/onvertekende schatter = een statistische grootheid waarvan deverwachtingswaarde samenvalt met de te schatten populatieparameter.
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 31
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 32/36
Grote steekproeven leiden tot een kleinere variatie in de prevalentieschattingen.We krijgen dus een zekerder resultaat als de steekproefgrootte toeneemt.
Betrouwbaarheidsinterval = wordt berekend uit de steekproefdata volgens eenmethode die een bepaalde kans heeft een interval op te leveren waarin depopulatiewaarde ligt
HHETET BEREKENENBEREKENEN VANVAN EENEEN
BETROUWBAARHEIDSINTERVALBETROUWBAARHEIDSINTERVAL
RONDROND EENEEN PARAMETERPARAMETER
Zie p 162-164 Berekenen
SS TATISTISCHE TATISTISCHE HYPOTHESEHYPOTHESE-- TOETSING TOETSING
Statistische hypothesetoetsing = hiermee kan men testen hoe aannemelijk eenbepaalde uitspraak over de populatie, op grond van de steekproef in kwestie,werkelijk is
Significantietoets = een procedure om gegevens zoals uitkomsten van eensteekproef te vergelijken met een vooropgestelde hypothese, die we nulhypothesegaan noemenDe uitkomst van zo’n toets wordt uitgedrukt in termen van een kans die aangeefthoe goed data en hypothese met elkaar kunnen overeenkomen
Overschrijdingskans (p) = de significantietoets meet de kans op het krijgen vaneen uitkomst die even extreem is of nog extremer dan de waargenomen uitkomst
Parallel kan men stellen dat de nulhypothese veronderstelt dat een bepaaldeuitkomst of een steekproefgrootheid uit onze steekproef, eigenlijk nul is. Dealternatieve hypothese is dat de beklaagde wel schuldig is, de alternatievehypothese is dat de steekproefgrootte verschilt van 0.
Type I fout = dat men een correcte nulhypothese verwerpt
Type II fout = dat men een foute nulhypothese aanvaardt
P-waarde = kan worden gezien als een uitdrukking van de waarschijnlijkheid of het
‘waarheidsgehalte’ van een nulhypothese
EEENZIJDIGENZIJDIG OFOF TWEEZIJDIG TWEEZIJDIG
TOETSEN TOETSEN VANVAN EENEEN
NULHYPOTHESENULHYPOTHESE??
Tweezijdige toets = houdt in dat we stellen via de alternatieve hypothese dat depopulatieparameter significant verschilt van 0, zonder een uitspraak te doen overde richting. Eigenlijk spreken we beter van toetsen met tweezijdig alternatief
Eenzijdig getoetst = als de formulering is dat de populatieparameter positief verschilt van 0
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 32
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 33/36
Rechtseenzijdig = als de waarde van de populatieparameter een positieve waardeheeft
Linkseenzijdig = als de waarde van de populatieparameter een negatieve waardeheeft
AANDERENDERE BELANGRIJKEBELANGRIJKE
VERDELINGENVERDELINGEN
T-verdeling/ Student’s t = een verdeling die uiterlijk heel erg lijkt op de normaleverdeling. De frequentieverdeling heeft dezelfde symmetrische klokvorm als dievan de normale verdeling.Wordt gebruikt in de inf.stat waarbij we obv info uit één steekproef veralgemeningen willen bekomen naar de populatie toe.
F-verdeling = is een quotiënt van twee chi-kwadraat verdeelde grootheden. Deze
wordt oa gebruikt bij het quotiënt van twee steekproef varianties uit twee normaalverdeelde populaties. De F-verdeling is net als X² asymmetrisch.Wordt gebruikt in situaties waar men wil weten of een determinatiecoëfficiënt diegevonden wordt in een steekproef statistisch significant verschilt van 0.
Bernoullie-verdeling = Bernoullie experiment is een experiment met slecxhts tweemogelijke uitkomsten: succes en mislukking
DDEE VARIANTIEVARIANTIE--ANALYSEANALYSE ALSALS TOETS TOETS
VOORVOOR VERSCHILLENVERSCHILLEN TUSSEN TUSSEN GROEPENGROEPEN
INZAKEINZAKE METRISCHEMETRISCHE KENMERKENKENMERKEN
Variatie-analyse = is een toets voor de relatie tussen een nominale en eenmetrische variabele
Onder de aanname dat de standaardafwijkingen in de populatie gelijk zijn, kun jeobv de steekproeven de variantie op twee manieren inschatten:
- het gewogen gemiddelde van de variantie binnen iedere groep gemeenten:de binnengroepsvariantie
- de variantie van de gemiddelden van de drie groepen gemeenten rondomhet algemeen gemiddelde: de tussengroepsvariantie
Variantie-analyse beide schatters van de variantie in de populatie worden
vergeleken door ze op elkaar te delenHoe groter F, hoe kleiner de kans dat dit door toeval komt.Als de p-waarde kleiner is dan 0.05, is de kans dat de waarde aan het toeval tewijten is, kleiner dan 5%Berekenen
ZZELFELF UITREKENENUITREKENEN VANVAN EENEEN
VARIANTIEVARIANTIE--ANALYSEANALYSE
zie F berekenen p 174-176 Berekenen
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 33
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 34/36
Eta-kwadraat = deze is de verhouding tussen de tussengroepsvariantie en detotale variantie in Y
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 34
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 35/36
DDEELEEL 8: D8: DEE GRENZENGRENZEN VANVAN DEDE BIVARIATEBIVARIATE STATISTIEK STATISTIEK
Niets zelf berekenen
IINLEIDINGNLEIDING
Waarom is de multivariate analyse van statistische gegevens zo belangrijk in desociale wetenschappen in het algemeen en de criminologie in het bijzonder?Hiervoor zijn verschillende redenen
de sociale werkelijkheid is multivariaat . Er zijn nu eenmaal meerderedeterminanten verbonden aan criminaliteitsgerelateerde fenomenen of uitkomstvariabelen
ten tweede is het zo dat het in de criminologie moeilijk is om fenomenengeïsoleerd te bestuderen
Zowel de causale als de niet causale analyse van criminaliteitsfenomenen maaktdaarom gebruik van het niet experimentele onderzoeksdesign als alternatief. Dit ishet principe van de statistische controleElke variabele die gecorreleerd is met de onafhankelijke variabele en die medebepalend kan zijn voor de score op de afhankelijke variabele, is een storendevariabele
ten derde is het zo dat achter een bivariaat verband meer kan schuilgaandan op het eerste zicht lijkt.
DDEE MEERVOUWIGEMEERVOUWIGE LINEAIRELINEAIREREGRESSIEREGRESSIE--ANALYSEANALYSE
De meervoudige regressie-analyse = wordt gebruikt wanneer men geïnteresseerdis in het verklaren van de spreiding in een variabele van het metrisch niveau obvmeerdere onafhankelijke variabelen die eveneens van het metrische niveau zijn
DDEE PROEFPROEF OPOP DEDE SOMSOM: 2: 2 BIVARIATEBIVARIATE
VS 1VS 1 MEERVOUWIGEMEERVOUWIGE REGRESSIEREGRESSIE
Multicollineariteit = de samenhang tussen onafhankelijke variabelen
DDEE PARTIËLEPARTIËLE CORRELATIECOËFFICIËNTCORRELATIECOËFFICIËNT
ENEN DEDE DETECTIEDETECTIE VANVAN SCHIJNVERBANDENSCHIJNVERBANDEN
Partiële correlatie = de correlatie tussen 2 variabelen, onder statistische controlevan één of meerdere storende variabelen waarvoor je wenst te controleren. Ditwordt gedaan wanneer men een schijnverband wil detecteren
SS TATISTISCHE TATISTISCHE INTERACTIEINTERACTIE
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 35
5/17/2018 2010-2011 Statistiek - slidepdf.com
http://slidepdf.com/reader/full/2010-2011-statistiek 36/36
Simpsons paradox = toont aan dat achter een bivariate analyse meer kanschuilgaan dan men op het eerste zicht zou vermoeden: Simpson presenteerdepercentageverschillen voor de categorieën van één onafhankelijke variabele
Wanneer we interactie willen opsporen tussen één variabele gemeten op metrischniveau en één op niet-metrisch niveau bij de studie van de invloed van tweekenmerken op een metrische afhankelijke variabele, kunnen we deregressiecoëfficiënt in subgroepen naar de categorische variabele bestuderen
Statistiek in de criminologische wetenschappenCindy Stevens – Eerste Bachelor Criminologie 36