27
Praktikum: Elementární zpracování dat z kvantitativního výzkumu Úvod do prostředí statistického programu SPSS (PSPP) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 25/3/2015 26/2/2013 UK FHS Historická sociologie, Řízení a supervize (LS 2012+)

Praktikum: elementární zpracování dat z kvantitativního výzkumu

  • Upload
    gerry

  • View
    45

  • Download
    0

Embed Size (px)

DESCRIPTION

FHS UK, KŘS. Praktikum: elementární zpracování dat z kvantitativního výzkumu. Úvod do SPSS (PSPP) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 9/3/2011. Vše je podrobně popsáno v souboru Návod na statistický software PSPP, část 1. – úvod. http://kmvp.wz.cz/ PSPP_navod_1_uvod.pdf - PowerPoint PPT Presentation

Citation preview

Page 1: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

Praktikum: Elementární zpracování dat z kvantitativního výzkumu

Úvod do prostředí statistického programu

SPSS (PSPP)

Jiří Šafrjiri.safr(AT)seznam.cz

Poslední aktualizace 25/3/2015 26/2/2013

UK FHSHistorická sociologie, Řízení a supervize

(LS 2012+)

Page 2: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

2

Princip zpracování kvantitativních dat• Jak zpracovat získané odpovědi v

dotaznících (nebo jinak generovaná data)?• Nejprve je třeba vytvořit datovou matici.

Takto pořízená data je třeba nejprve „vyčistit“ (označit uživatelsky definované chybějící hodnoty),případně dále upravit (např. rekódovat, vytvořit nové syntetické znaky, popsat hodnoty/názvy-labelovat) data-management.

Teprve potom můžeme přistoupit k samotné analýze dat.

K tomu všemu nám může napomoci specializovaný statistický software, například SPSS.

Page 3: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

Vše je podrobně popsáno v souboru

Návod na statistický software PSPP, část 1. – úvod

http://metodykv.wz.cz/PSPP_navod_1_uvod.pdf

Page 4: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

4

STATISTICAL PACKAGE FORTHE SOCIAL SCIENCES (SPSS)

• general-purpose interactive statistical software package available in major platforms such as Windows, Unix, and Macintosh.

A brief from history:• developed in 1968 as software system that allowed for the transformation of

raw data into information using statistical applications. SPSS, Inc. incorporated in 1975.

• first mainframe statistical package to appear on a personal computer (in the mid-1980s) and, in 1992, was the first organization to release a statistical package for use with the Microsoft Windows OS. Today different products:

• SPSS Base provides survey researchers with a powerful and user-friendly data management and statistical analysis package. Satistics: descriptive and bivariate as well as predictive analytics such as factor and regression analyses.

• + add-on modules: advanced multivariate analysis of survey data: generalized linear models, hierarchical linear models, survival analysis, and categorical regression.

• Also stand-alone products: help with all phases of the survey process (sample selection and data collection, data management and cleaning, and data dissemination).

Page 5: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

5

GNU PSPP Free Software Foundation

• tool for statistical analysis of sampled data. It reads the data, analyzes the data according to commands provided, and writes the results to a listing file, to the standard output or to a window of the graphical display.

• It is a free replacement for the proprietary program SPSS, and appears very similar to it with a few exceptions.

• The language accepted by PSPP is similar to those accepted by SPSS statistical products.

• http://www.gnu.org/software/pspp/• Installation from http://pspp.awardspace.com/ (ofted upgraded so

update your instalation regularly)• Current version: Master version = 0.8.4 (as of 2015-02-10)

– MSWindows version: MSWindows XP and newer– Package Size: 32 Mb– Size on disk: 72 Mb

• Manual at http://pspp.benpfaff.org/~blp/pspp-master/latest/source/user-manual/pspp.html

Page 6: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

6

Tři typy oken v SPSS / PSPP

• Data editor (záložky Variable View a Data View) → správa datového souboru → soubory s koncovkou *.sav

• Output → výstupy analýz→ soubory s koncovkou *.spv (od verze 15)

• Syntax → zadávání pomocí příkazového řádku→ soubory s koncovkou *.sps

Page 7: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

7

Data: Data Editor

V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky)

→ v okně Data Editor záložka Data View

Page 8: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

8

Správa proměnných (labely, chybějící hodnoty - missingy, formát, …)

→ záložka Variable View v okně Data Editor

Page 9: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

9

Output: výstupy (analýz, úpravy dat)

Page 10: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

10

Úprava dat (agregování, filtrování, rekódování, …)

→ příkazy v sekcích hlavního menu Data a Transform (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

Page 11: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

11

Analýzy

→ příkazy v sekci hlavního menu Analyze

Popisné statistiky: Descriptive statistics → Frequencies / Descriptives / Explore (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

Page 12: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

12

Syntax: přímé zadání pomocí příkazového řádku

Výhodou je, že sekvenci příkazů můžeme uložit (soubor s koncovkou *.sps) a kdykoliv se k ní vrátit, případně měnit vstupní proměnné. V případě úpravy dat poskytuje kontrolu operací a umožňuje úpravy sdílet.

Syntax lze u každé operace (analýzy či úpravy dat) vygenerovat při zadávání z menu pomocí tlačítka Paste

Page 13: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

13

Vkládání dat v Data editoruVariable ViewZde si nejprve připravíme datovou matici: jména proměnných (Name), jejich typ/formát (Type) a případně labely

Data ViewZde pak ukládáme data – po řádcích (1 řádek = 1 respondent/ dotazník)

Page 14: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

14

Tři základní informace o proměnných:• jméno proměnné VARIABLE NAME

max. 8 znaků bez diakritiky, mezer; musí začínat písmenem (např. pohlavi) → bezpodmínečně v datech musí být

pro uživatele může být dále užitečná nadstavba:• popiska proměnné VARIABLE LABEL

Delší popis názvu znaku, lze s diakritikou, např. (zkrácené) znění otázky v dotazníku, který se bude objevovat ve výstupech (např. Pohlaví respondenta)

• popisky kategorií (hodnot) proměnné VALUE LABELSPopis kategorií znaku, které se budou objevovat ve výstupech (např. 1= muž, 2 = žena)

Page 15: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

15

Ve Variable View je toho ale více

Nejdůležitější jsou: • Type: druh záznamu dat (v zásadě buď jako číslo = Numeric nebo jako

slova = String). Preferujeme Numeric• Decimals: počet desetinných míst, co se bude zobrazovat ve výstupech

(samotný záznam dat ale zachovává více desetinných míst)• Measure: typ proměnné (dříve to nevadilo, novější verze vyžadují pro

určitý typ analýz) • Missings: uživatelsky definované hodnoty (o tom více jinde)• v novějších verzích (SPSS 22) ještě přibyla role proměnné v analýze

(závislá, nezávislá, třídící atd.)Dobrá zpráva: toto vše lze nastavovat příkazovým řádkem v syntaxu.

Page 16: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

16

Jak začít v SPSS/PSPP? Proč ne rovnou pomocí syntaxu …

• Lze jednoduše pomocí grafického menu založit datovou matici (seznam a vlastnosti proměnných) a do ní postupně vkládat data (případy) či rovnou nějaký již existující datový soubor otevřít. Viz předchozí snímky. Také ale lze data vložit pomocí příkazového řádku, tj. v syntaxu. Zkuste např. následující příklad:

• Using your favourite editor, write a file (name it myfile.sps) containing the following:

*Data input in SPSS/PSPP example.*Attention: SPSS is sensitive to decimal place delimiter (here we have ',' comma but it

can be decimal point. It's dependent on local OS setting. subtitle "Countries by population, 2015".*Source: http://en.wikipedia.org/wiki/List_of_countries_and_dependencies_by_population.DATA LIST LIST /Country (a25) Popul (f12) Pop_pct (f8.2). BEGIN DATA.China 1368400000 18,9 India 1267400000 17,5 USA 320469000 4,43 Indonesia 255461700 3,53 Brazil 203932000 2,82END DATA. LIST.DESCRIPTIVES /Popul Pop_pct /STATISTICS ALL. FREQ Country.DESC /Popul Pop_pct /STATISTICS MIN MAX MEAN STDDEV SUM.

Page 17: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

Další úpravy dat a výstupůstručný přehled

Rekódování, konstrukce nových znaků;třídění výstupů, vážení, seřazování

hodnot, agregování dat, spojování více datových souborů …

Page 18: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

18

Transformace dat → Transform

• Výpočet/vytváření nových (syntetických) znaků → COMPUTE (nebo pro „načítání“ COUNT)

• Rekódování → RECODE (do stejné nebo nové proměnné)

• Visual Binding – nástroj pro snadné rekódování (pro spojité-kardinální znaky např. dle percentilů)

Page 19: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

19

Úpravy dat a výstupů → Data

• Uspořádání případů → SORT CASES• Rozdělení na podsoubory → SPLIT FILE• Výběr případů (filtrování) → SELECT CASES• Vážení → WEIGHT CASES• Agregace (např. průměry pro skupiny)

→ AGGREGATE• Spojování souborů dat / přidávání proměnných

→ MERGE FILES

Page 20: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

20

Transformace dat → Transform Úpravy dat → Data

Page 21: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

Zadání analýz a jejich výstupy

Analýzy (tabulky),grafy

Page 22: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

22

Analýzy → Analyze• Descriptive statistics• Tables• Compare means• Correlate• Data Reduction • Nonparametric Tests• Missing Value Analysis• Multiple Response

Page 23: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

23

Grafy → Graphs

Page 24: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

Nastavení outputu SPSS

Praktická úprava výstupů se zobrazováním hodnot a názvů proměnných (oproti továrnímu nastavení,

kde jsou pouze labely)

Page 25: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

25

Nastavení labelů při zobrazování tabulek v outputu

SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'.NEW FILE.

Page 26: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

26

Nastavení labelů při zobrazování tabulek v outputu

• Bez názvu proměnné a hodnot kategorií(původní tovární nastavení)→ vhodné pro finální prezentaci v textu

• S názvem proměnné a hodnotami kategorií(naše nastavení) → vhodnější pro analýzy

Page 27: Praktikum:  elementární zpracování dat  z kvantitativního výzkumu

27

Zobrazování labelů/hodnot v outputu lze spustit pomocí skriptu v Syntaxu*NASTAVENI Labelů v OUTPUTU SPSS (funguje od verze 16).

*vypnutí hodnot kategorii v tabulkách a grafech, tj. jen labels bez jmen proměných.

SET TNumbers=Labels ONumbers=Labels CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Labels CCD='-,,,' TVars=Labels CCA='-,,,'.

*zapnuti hodnot kategorii v tabulkách a grafech, tj. hodnoty+labels a jména proměnných.

SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'.

*Zobrazování jména proměnných (místo VAR labelů) v seznamu při vstupu do analýz.

SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'.