Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Dostop do raziskovalnih podatkov v ADP in njihova analiza
Irena Vipavc Brvar
ADP, Univerza v Ljubljani, 15. december 2015
ADP delavnica za raziskovalce in študente, Ljubljana
AD
PVsebina predavanja
• Splošno o arhivu in mikro podatkih
• Sekundarna analiza
• Metapodaki
• Dostop do metapodatkov in podatkov preko ADP
• Analiza podatkov v Nesstarju
• Mednarodne podatkovne baze
• Sodelovanje s statističnimi uradi
• Podatki uradnih statistik
Vse
bin
a
AD
P
Arhiv družboslovnih podatkov
• je osrednji slovenski družboslovni arhiv podatkov,
• pokriva vsa pomembnejša družboslovna področja,
Naloge:
• shranjuje podatke iz preteklih raziskav za ponovno uporabo (zagotavlja, da so podatki ohranjeni pred tehnološko zastarelostjo in fizičnim uničenjem),
• preveri, potrdi in pripravi podatke in pripadajočo dokumentacijo raziskave,
• uporabnikom omogoča enostaven dostop do podatkov v številnih formatih in
• nudi storitve s področja metodologije in statističnih obdelav.
Splo
šno o
arh
ivu
Research data alliance meeting2014
Research data alliance meeting2014
Research data alliance meeting 2014
AD
P
Arhiv družboslovnih podatkov
• je osrednji slovenski družboslovni arhiv podatkov,
• pokriva vsa pomembnejša družboslovna področja,
Naloge:
• shranjuje podatke iz preteklih raziskav za ponovno uporabo (zagotavlja, da so podatki ohranjeni pred tehnološko zastarelostjo in fizičnim uničenjem),
• preveri, potrdi in pripravi podatke in pripadajočo dokumentacijo raziskave,
• uporabnikom omogoča enostaven dostop do podatkov v številnih formatih in
• nudi storitve s področja metodologije in statističnih obdelav.
Splo
šno o
arh
ivu
Research data alliance meeting2014
AD
P
Arhiv družboslovnih podatkov
• je osrednji slovenski družboslovni arhiv podatkov,
• pokriva vsa pomembnejša družboslovna področja,
Naloge:
• shranjuje podatke iz preteklih raziskav za ponovno uporabo (zagotavlja, da so podatki ohranjeni pred tehnološko zastarelostjo in fizičnim uničenjem),
• preveri, potrdi in pripravi podatke in pripadajočo dokumentacijo raziskave,
• uporabnikom omogoča enostaven dostop do podatkov v številnih formatih in
• nudi storitve s področja metodologije in statističnih obdelav.
Splo
šno o
arh
ivu
Research data alliance meeting2014
Research data alliance meeting2014
Research data alliance meeting2014
Research data alliance meeting2014
AD
PSekundarna analiza
Uporabimo že zbrane podatke za testiranje hipotez in jih nezbiramo sami. Vključuje izkoriščanje podatkov, ki jih jezbral nekdo drugi ali podatkov, ki so bili primarno zbraniza nek drug namen (npr. administrativni zapisi).
Ključni elementi s katerimi se srečujemo so:
- dostop do podatkov in njihova uporabnost
- ohranjevanje zaupnosti in zasebnosti, ki jih je respondentom jamčil primarni raziskovalec
- lastninske pravice in lastništvo nad podatki
Sekundarn
a a
naliza
Informacije niso dostopne ali ne obstajajo Primarna analiza
Informacije obstajajo in so dostopne Sekundarna analiza
Sekundarn
a a
naliza
Razlogi za sekundarno analizo
(vir: Hayman v Štebe, 1999)
medčasovnaprimerjava
že testirani vprašalniki, vprašanja
različni nameni uporabe….
Kombinacija več virov podatkov
- Slabost –nepoznavanje podrobnosti zbranih podatkov –vprašanje kakovosti
Prihranek denarja
Prihranek časa
Konceptualno-vsebinski razlogi
Metodološki razlogi Ekonomski razlogi
Podatk
i Kaj so podatki?
”podatki” - računalniško berljive podatkovne datoteke
.. prepisi intervjujev, avdio in video zapisi
Mikro in makro podatkiM
ikro
in m
akro
podatk
i
M
I
K
R
O
M
A
K
R
O
ADP
SURS
Seznam spremenljivk
Podatki
Kaj potrebujemo za razumevanje in ustrezno interpretacijo
RAZISKAVA
Podatki v ustreznem formatu
Vprašalnik Šifrant
Ustrezna dokumentacija o izvedbi raziskovanja
Teoretska podlaga raziskovanja –oblikovanje indikatorjev
….
VprašalnikVpra
šaln
ik
MetapodatkiM
eta
podatk
i
Specifikacija, ki se uporablja na področju družboslovja in
humanistike je DDI.
Metapodatke lahko definiramo kot "vse informacije potrebne za
obveščanje in procesiranje statističnih struktur".
(Grossmann v Vipavc in Klep, 2003).
Avtor Producent Finančna podpora Serija Vsebinska področja Povzetek Čas zbiranja podatkov Časovno pokritje
Geografsko pokritje Enota za analizo Populacija Kdo je opravil zbiranje
podatkov Tip vzorca Uteževanje
Citiranje Sorodne raziskave Vprašalniki in
povezano gradivo
Kaj so metapodatki v ADP?M
eta
podatk
i
Kako do podatkov na ADP?Kako
do p
odatko
v?
SPLETNA STRAN www.adp.fdv.uni-lj.si
NESSTARhttp://nesstar2.adp.fdv.uni-lj.si/
Kaj najdeš na spletni strani?Opis raziskaveOpis podatkovPovezana gradiva in objave
Kaj najdeš na Nesstarju?+ ….Omogoča analizo
preko spletahttp://www.adp.fdv.uni-lj.si/media/gradiva/Vodic_po_Nesstarju.pdf
http://www.nesstar.com/help/4.0/webview/getting-started/getting-to-know-nesstar-webview.html
_
Opi
s
razis
ka
ve Nessta
rPreprosta analiza podatkov z Nesstarjem
Primer Politbarometer
Registra
cija za
dosto
p d
o g
radiva
_
1
2
3 Za analizo podatkov na Nesstarju potrebujemo uporabniško ime in geslo.
registracijaRegistra
cija za
dosto
p d
o g
radiva
_
!
Geslo je veljavno
do konca tekočega
študijskega leta
Pri uporabniškem
imenu namesto "@"
vpišete "AT“
ADP ni primarni distributor za vse raziskave
Snamemo lahko samo dokumentacijo
Ne moremo izvajati spletnih analiz
Ni dodatnih možnosti
Opi
s
razis
ka
ve Nessta
rPreprosta analiza podatkov z Nesstarjem
Prikažem lahko opisne statistike, grafikon in frekvenčno tabelo
KORAK 1Kliknem na listič TABELA
KORAK 2Spremenljivko bodisi dodamo v vrstico, stolpec, v podtabelo ali pa zanjo izračunamo opisne statistike(levi klik miške na spremenljivko v seznamu levo)
Opi
s
razis
ka
ve Nessta
rPreprosta analiza podatkov z Nesstarjem
Prikažem lahko opisne statistike, grafikon in frekvenčno tabelo
Frekvenčna tabela
Opisne statistike
Opi
s
razis
ka
ve Nessta
rPreprosta analiza podatkov z Nesstarjem
Primer Politbarometer
Vir: PBSI1110
Oblikovanje nove spremenljivke in drugi izračuni Pre
oblik
ova
nje
spre
menljiv
ke
KORAK 1 Izberem znak ∑ zgoraj desno
KORAK 2
KORAK 4Tako ustvarjeno spremenljivko najdem v seznamu spremenljivk v skupini „Uporabniško določene spremenljivke“
KORAK 3 – Izberem, spremenljivko in jo ustrezno preoblikujem
Iskanje
Raziskujem mišljenje o SAMOMORu skozi leta
Napredno iskanje
Iskanje
- Iščemo znotraj spremenljivke –besedijo, vprašanje…
- Izpisan želimo dobiti seznam spremenljivk
Iskanje neposredno na spletni strani ADP
V1.75 PROSIM VAS, DA MI ZA VSAKO OD NAŠTETIH STVARI POVESTE, ALI JO LAHKO PO VAŠEM MNENJU VEDNO OPRAVIČIMO ALI JE NIKOLI NE MOREMO OPRAVIČITI, ALI PA GRE ZA NEKAJ VMESNEGA. UPORABITE LESTVICO
SPODAJ. (En odgovor za vsako trditev)
Ali lahko upravičimo ali ne (Vir: SJM921)
1 2 3 4 5 6 7 8 9 10
n) Splav.
o) Ločitev.
u) Ubiti nekoga v samoobrambi.
j) Spolni odnosi pred polnoletnostjo.
q) Evtanazija (končati življenje neozdravljivo bolnega.)
i) Poročen moški ali poročena ženska imata avanturo.
r) Samomor.
l) Homoseksualnost.
p) Spopasti se s policijo.
a) Zahtevati od države ugodnosti, ki vam ne pripadajo.
m) Prostitucija.
b) Izogibanje plačila vozne karte v javnem prometu.
g) Obdržati najdeni denar.
s) Zatajiti lastniku, da si po nesreči poškodoval njegovo vozilo.
h) Lagati zaradi osebne koristi.
c) Goljufati pri davkih, če se pokaže priložnost.
t) Groziti delavcem, ki nočejo sodelovati v stavki.
x) Vožnja pod vplivom alkohola.
v) Politični umori.
w) Odmetavanje odpadkov na nem mestu.
k) Sprejemanje podkupnine med opravljanjem službene dolžnosti.
d) Kupiti nekaj, za kar veste, da je bilo ukradeno.
f) Jemati marihuano ali hašiš.
e) Vzeti in odpeljati avto, ki ni tvoj. (Vožnja za zabavo).
1 vedno lahko opravičimo
10 nikoli ne moremo opravičiti
Povprečna vrednost
PROSIM VAS, DA MI ZA VSAKO OD NAŠTETIH STVARI POVESTE, ALI JO LAHKO PO VAŠEM MNENJU VEDNO OPRAVIČIMO ALI JE NIKOLI NE MOREMO OPRAVIČITI, ALI PA GRE ZA NEKAJ VMESNEGA. UPORABITE LESTVICO
SPODAJ. (En odgovor za vsako trditev)
Ali lahko upravičimo ali ne (Vir: SJM112)
Povprečna vrednost
1 vedno lahko opravičimo
10 nikoli ne moremo opravičiti
1 2 3 4 5 6 7 8 9 10
V206 spolni odnosi pred poroko
V205 Ločitev
V204 Splav
V203 homoseksualnost
S17 evtanazija
S18 Prostitucija
S19 smrtna kazen
V207 samomor
V198 zahtevati od države ugodnosti, ki ti ne pripadajo
V199 izogibati se plačilu karte za javni promet
V209 da starši tepejo svoje otroke
V201 goljufati pri davkih, če se pokaže priložnost
V208 da mož udari svojo ženo
V210 nasilje do drugih ljudi
V200 Krasti
V202 sprejemati podkupnine na službenem položaju
PROSIM VAS, DA MI ZA VSAKO OD NAŠTETIH STVARI POVESTE, ALI JO LAHKO PO VAŠEM MNENJU VEDNO OPRAVIČIMO ALI JE NIKOLI NE MOREMO OPRAVIČITI, ALI PA GRE ZA NEKAJ VMESNEGA. UPORABITE LESTVICO
SPODAJ. (En odgovor za vsako trditev)
Ali lahko upravičimo samomor ali ne (Vir: SJM)
Povprečna vrednost
1 vedno lahko opravičimo
10 nikoli ne moremo opravičiti
1 2 3 4 5 6 7 8 9 10
SJM921
SJM952
SJM993
SJM053
SJM081
SJM112
Prenos datoteke na lokalno pomnilno enoto
KORAK 1
KORAK 4 Analiza v PSPP
KORAK 3 – izberem mesto hrambe. Pozor: Možno je, da bo datoteka v stisnjeni obliki – kot je format *.zip in podobno. Kliknite na datoteko in jo izvozite.
KORAK 2
Mednarodni podatkiM
ednaro
dne p
odatko
vne b
aze
Primer mednarodnih podatkov
Primer mednarodnih podatkov
Primer Atlas of European Values (EVS 1990)
suicide can be justified (0=never 100=always)
Primer Atlas of European Values (EVS 1999)
suicide can be justified (0=never 100=always)
Primer Atlas of European Values (EVS 2008)
suicide can be justified (0=never 100=always)
http://dx.doi.org/10.1787/888932703259
Preverimo tudi uradne podatke (npr. OECD)
Skrb za starše
Primer GESIS: children responsibilities to their parents
Vir: EVS08
Primer Atlas of European Values
Pe
rce
nta
ge o
f p
eo
ple
th
at a
gre
e w
ith
th
e s
tate
me
nt
that
ad
ult
ch
ildre
n h
ave
the
du
ty t
o p
rovi
de
lon
g-te
rm c
are
fo
r th
eir
p
are
nts
eve
n a
t th
e e
xpe
nse
of
the
ir o
wn
we
ll-b
ein
g
• Priprava nezaščitenih mikropodatkov (distribucija SURS):
Anketa o delovni sili 2001-2014
Registrski popis 2011
Anketa o porabi v gospodinjstvih 2011
Inovacijska dejavnost v predelovalni industriji in izbranih storitvenihdejavnostih 2002-2012
• Priprava zaščitenih Public Use Files mikropodatkov (distribucija ADP):
Anketa o delovni sili 2010
Registrski popis 2011
• Priprava metapodatkov
• Organizacija delavnic za promocijo rabe mikropodatkov v študijske namene (za pedagoge in študente)
• Promocija dostopa do mikropodatkov v znanstvene namene
Sodelovanje ADP - SURS
• Anketa o porabi v gospodinjstvih 1998-2000
• Anketa o porabi časa 2001
• Anketa o delovni sili 1997-2000, 2010
• Popis 2002 in Registrski popis 2011
• Anketa o žrtvah kriminala 2001
Distribucija mikropodatkov s strani ADP
Distribucija metapodatkov s strani ADP
• Na voljo registriranim raziskovalcem oz. tudi študentom (v povezavi z registriranimi raziskovalci, mladi raziskovalci)
• Dostop omogočen na tri načine:
v varni sobi
preko oddaljenega dostopa
na DVD-jih (prenosnih medijih)
• Dostop mora odobriti Odbor za varstvo podatkov (SURS)
• Na voljo so različni mikropodatki (LPSR)
Dostop do nezaščitenih mikropodatkov uradne statistike
• Agregirani podatki v obliki tabel so na voljo na spletni strani Statističnega urada Republike Slovenije
• Enostaven dostop do statističnih informacij o različnih statističnih področij (iz različnih virov)
• Možnosti spletnih analiz in vizualnega prikaza rezultatov
Dostop do agregiranih podatkov na SI-STAT
Npr. kazenski postopki za umore, povzročitve smrti, detomore v 2013 in 2014 po spolu
Podatki s področja varnostnih ved – SI-STAT
• Eurostat harmonizira in združi mikropodatke posameznih držav oz. njihovih nacionalnih statističnih uradov
• Eurostat distribuira podatke za znanstveno rabo
• Na voljo so raziskovalcem, ki so del registriranih raziskovalnih organizacij (npr. raziskovalci Univerze v Ljubljani)
• Na voljo so podatki LFS, CIS, SES, EU-SILC, AES, CVTS (Continuing Vocational Training Survey), CSIS (Community Statistics on information Society), ERFT (European Road Freight Transport Survey), MMD (Micro-Moments Dataset)
Dostop do mednarodnih podatkov – mikropodatki Eurostat
• Obstajata dva načina dostopa:
na CD-jih/DVD-jih –zaščitene verzije
v varni sobi v Luxembourgu – nezaščitene verzije
• So javno dostopni v obliki tabel (so agregirani)
• Uporabniki lahko ustvarilo svoje tabele z upravljanjem prikaza po državah, statistikah, spremenljivkah itd.
Dostop do mednarodnih podatkov – agregirani, Eurostat
Population Projections
Vir: Eurostat
• Informacijski sistem, ki zagotavlja pregled evropskih mikropodatkov uradne statistike za raziskovalne namene
• Pripravljeni so strukturirani metapodatki za mikropodatke uradne statistike
CIMES - Centralising and Integrating Metadata fromEuropean Statistics
• Metapodatki so prikazani na treh nivojih: serija, raziskava, podatkovna datoteka
• 31 evropskih držav, 248 serij, 1570 raziskav, 1821 podatkovnih datotek
• Spletna platforma za prikaz strukturiranih metapodatkov uradne statistike (tudi za Eurostatove mikropodatke)
• Adult Education Survey, EU Labour Force Survey, EU Statistics on Income and Living Conditions, Community Innovation Survey, Structure of Earnings Survey
MISSY- Microdata Information System for Official Statistics
• 5 nivojev metapodatkov: serija, raziskava, nacionalna raziskava, podatkovna datoteka, spremenljivke
• Distribucija sintaks/ programskih kod za uvoz in osnovno obdelavo EU mikropodatkov
Wen
dy
Ch
rist
iae
ns,
Pie
t B
rack
e (2
01
3)
Wo
rk–f
amily
co
nfl
ict,
h
eal
th s
erv
ices
an
d m
edic
atio
n u
se a
mo
ng
du
al-i
nco
me
co
up
les
in E
uro
pe
Opisne statistike lahko predstavim tako.
Ali pa tako.
Prim
erKako NE prikazujemo podatkov
Vir: Sodna
statistika 2007
Mantra: Why share data
Kontakt
Univerza v Ljubljani
Fakulteta za družbene vede
Arhiv družboslovnih podatkov
Kardeljeva ploščad 5
1000 Ljubljana
www.adp.fdv.uni-lj.si
Arhiv.Druzboslovnih.Podatkov
@ArhivPodatkov