42
EPG Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: [email protected] www.psicometria.unich.it

EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: [email protected] E ORARI LEZIONI Sabato

  • Upload
    vutruc

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

EPG

Metodologia della ricerca e Tecniche

Multivariate dei dati

Dottssa Antonella Macchia

E-mail amacchiaunichit

wwwpsicometriaunichit

GIORNI E ORARI LEZIONI

Sabato 01-03-2014 h 0800-1200

Sabato

08-03-2014 h 0800-1200

Sabato

15-03-2014 h 0800-1200

Sabato

22-032014 h 0800-1200

RICEVIMENTO Su prenotazione tramite e-mail

presso il Laboratorio di Psicometria (ex Farmacia)

Programma del corso

Introduzione al software SPSS

Trattamento preliminare dei dati

La regressione lineare

Lrsquoanalisi fattoriale

Lrsquoanalisi della varianza

Testo consigliato

Barbaranelli C ldquoAnalisi dei dati con SPSS

II Le analisi multivariaterdquo

LED edizioni universitarie 2006

Un software che contiene procedure per

ESPLORARE

GESTIRE

TRATTARE

ANALIZZARE

hellip i dati

Ersquo UN PACCHETTO STATISTICO

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 2: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

GIORNI E ORARI LEZIONI

Sabato 01-03-2014 h 0800-1200

Sabato

08-03-2014 h 0800-1200

Sabato

15-03-2014 h 0800-1200

Sabato

22-032014 h 0800-1200

RICEVIMENTO Su prenotazione tramite e-mail

presso il Laboratorio di Psicometria (ex Farmacia)

Programma del corso

Introduzione al software SPSS

Trattamento preliminare dei dati

La regressione lineare

Lrsquoanalisi fattoriale

Lrsquoanalisi della varianza

Testo consigliato

Barbaranelli C ldquoAnalisi dei dati con SPSS

II Le analisi multivariaterdquo

LED edizioni universitarie 2006

Un software che contiene procedure per

ESPLORARE

GESTIRE

TRATTARE

ANALIZZARE

hellip i dati

Ersquo UN PACCHETTO STATISTICO

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 3: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Programma del corso

Introduzione al software SPSS

Trattamento preliminare dei dati

La regressione lineare

Lrsquoanalisi fattoriale

Lrsquoanalisi della varianza

Testo consigliato

Barbaranelli C ldquoAnalisi dei dati con SPSS

II Le analisi multivariaterdquo

LED edizioni universitarie 2006

Un software che contiene procedure per

ESPLORARE

GESTIRE

TRATTARE

ANALIZZARE

hellip i dati

Ersquo UN PACCHETTO STATISTICO

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 4: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Testo consigliato

Barbaranelli C ldquoAnalisi dei dati con SPSS

II Le analisi multivariaterdquo

LED edizioni universitarie 2006

Un software che contiene procedure per

ESPLORARE

GESTIRE

TRATTARE

ANALIZZARE

hellip i dati

Ersquo UN PACCHETTO STATISTICO

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 5: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Un software che contiene procedure per

ESPLORARE

GESTIRE

TRATTARE

ANALIZZARE

hellip i dati

Ersquo UN PACCHETTO STATISTICO

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 6: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

SPSS egrave un software statistico che consente

bull Lrsquoinserimento e importazione dei dati

bull Fare analisi statistiche e di illustrare i risultati anche tramite

rappresentazione grafica

(Statistical Package for Social Science)

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 7: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

PER SCARICARE LA DEMO

httpwww14softwareibmcomdownloaddataweben_UStrialprogramsW11074

2E06714B29html

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 8: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

schermata iniziale

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 9: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

LrsquoINTERFACCIA DI SPSS I MENU A TENDINA

FILE Apre e salva i dati

EDIT Seleziona copia e taglia parte dei dati

TRANSFORM Comandi per definire le variabili per selezionare i dati o le variabili

per ordinare le variabili e per effettuare calcoli

ANALYZE Consente lrsquoanalisi dei dati

GRAPHS Consente di costruire dei grafici

UTILIES Definisce alcune funzioni per lrsquoesecuzione di alcune procedure statistiche

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 10: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

SPSS egrave composto da

finestre aventi ciascuna

differenti funzioni

Editor dei Dati

Output ndash Viewer

Syntax

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 11: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Barra dei menugrave

bull Il foglio elettronico di SPSS contenente il corpo dati (dataset)

da analizzare

bull Offre 2 modalitagrave di visualizzazione dei dati

-Data View -Variable View

Editor dei dati

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 12: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Nome della variabile (max 8 caratteri)

Numero di caratteri usati per visualizzare la variabile

Serve per descrivere le categorie numeriche delle variabili

Tipo di variabile (es numericastringa)

Specifica meglio il significato della variabile (max 256 caratteri)

ldquovalori mancantirdquo Strategie per la scelta dei missing value bull sostituzione con valori della stessa

grandezza della v come la media bull numeri fuori dalla scala della

variabile (9 0 il 99 o 999)

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 13: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Come costruire le variabilihellipin Variable View

NB Nel file di dati vengono inseriti i valori relativi alle codifiche

socio-anagrafiche dei partecipanti (es genere etagrave

provenienza stato civile livello socio-economico)

Ciograve permette di rilevare differenze o uguaglianze sulle variabili

metriche in dipendenza dellrsquoappartenenza a gruppi differenti

determinati a priori

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 14: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Il file pronto in Data View

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 15: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

1CODIFICA e INSERIMENTO DATI

2PULIZIA DEI DATI controllo eventuali errori di inserimento dei dati la presenza di dati mancanti o di outlier mediante lrsquoanalisi

delle frequenze

Utilizzo di SPSS

3TRASFORMAZIONE si ottengono nuove variabili effettuando delle operazioni o trasformazioni sulle

variabili pre-esistenti

4 STATISTICHE DECRITTIVE media varianza deviazione standard Consentono di verificare se i dati si distribuiscono normalmente

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 16: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Principali operazioni statistiche con SPSS

1048708Inserimento dei dati e creazione di un file

1048708Apertura di un file dati

1048708Screening dati

1048708Trasformazioni dati

1048708Calcolo statistiche descrittive

1048708Analisi statistiche

bull CORRELAZIONE

bull ATTENDIBILITArsquo

bull ANALISI DELLA VARIANZA

bull ANALISI FATTORIALE

bull REGRESSIONE

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 17: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

1 CODIFICA DEI DATI

Scale di misura

1 Nominale i valori dei dati rappresentano categorie senza alcun ordine

intrinseco (sesso categoria lavorativa)

2 Ordinale i valori dei dati rappresentano categorie con qualche ordine

intrinseco (bassomedioalto)

3 Ad intervalli i valori dei dati permettono di stabilire una relazione distanza

tra piugrave oggetti misurati a partire da uno zero arbitrario e stabilendo un

unrsquounitagrave di

misura costante

4 A rapporti i valori dei dati permettono di effettuare operazioni aritmetiche

e avendo quale origine della scala uno zero assoluto

Regole

- Le variabili devono essere rappresentate in formato numerico

- I casi devono essere contraddistinti da un numero drsquoordine

I codici devono

- essere mutualmente escludentesi

- avere una coerenza interna

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 18: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

2 Inserimento dei dati

bull Colonne=Variabili

bull Righe=Soggetti o casi

bull Cella=intersezione tra caso e variabile che

contiene il valore del soggetto nella variabile

corrispondente

3 Trasformazione dei dati ricodifica

2 Screening dei dati Scopi

Controllo delle distribuzioni di frequenza delle variabili

Modalitagrave

Analisi delle frequenze

Analyze ndashDescriptives Statistics-Frequencies-Statistics-Chart

Presenza di eventuali errori-Edit-Find

Presenza numerositagrave di valori mancanti-Missing MissingDati validi

Presenza di outlieroutlier

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 19: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Verificare se la distribuzione egrave normale

La normalitagrave della distribuzione egrave il fondamento di molte analisi

La distribuzione normale univariata assume la classica forma a

campana

Unimodale

bull Simmetrica rispetto alla media

bull Presenta due punti di flesso

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 20: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

1Codifica dati

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 21: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

2 Inserimento dati

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 22: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

La codifica degli item del test egrave avvenuta considerando la scala da 1 laquomairaquo a 4 laquo quasi sempreraquo

Tuttavia ci possono essere nello strumento alcuni item inversi (che vanno cioegrave nella direzione opposta della valenza semantica positiva)

Per riportare gli item tutti alla stessa valenza egrave necessario RICODIFICARLI

3 Trasformazione dei dati

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 23: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Si apriragrave questa finestra Si selezionano le variabili e tramite la freccia si posizionano nel campo variabili

Digitando su OLD AND NEW VALUE sostituisco ai vecchi i nuovi valori da attribuire alla variabile

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 24: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Applico la stessa procedura per altre eventuali variabili di altri test che necessitano di

ricodifica

Successivamente calcolo il punteggio totale Prendiamo come esempio il Beck Anxiety

Inventory (BAI)

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 25: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Apro una finestra Syntax

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 26: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

TOTALE DEL

PUNTEGGIO

PER

CIASCUN

SG

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 27: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

NB Posso salvare il file di sintassi come qualsiasi altro file (e utilizzarlo nuovamente)

tramite

FILE-SAVE AS

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 28: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Calcolo della media

I calcoli si possono effettuare considerando anche i comandi del data editor

Da qui mi posso calcolare oltre alla somma (calcolata prima con il

linguaggio di sintassi) anche la media e altri calcoli attraverso

TRANSFORM-COMPUTE

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 29: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Per calcolare il punteggio MEDIO al test immetto nel campo ldquovariabile di destinazionerdquo il nome da assegnare e operare la scelta della funzione ldquoMEANrdquo

Trascino i nomi delle variabili come argomenti della funzione multi-argomento che opera sulle variabili

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 30: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Nella nuova colonna sono riportati i valori medi dei punteggi di ciascun sg per il BAI

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 31: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Per osservare le distribuzioni di frequenza delle variabili e calcolare i principali

indici statistici campionari di ciascuna variabile si opera attraverso il menugrave

analizza tramite il comando ldquofrequenzerdquo

4 Screening dai dati

Si selezionano le variabili

per le quali interessa

calcolare gli indici statistici

principali congiuntamente

alla distribuzione di

frequenze

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 32: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Selezioniamo le statistiche

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 33: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Output

Vengono riportate le statistiche per ciascuna variabile

le frequenze per la variabile genere indicano che non ci sono valori mancanti (la percentuale e la percentuale valida coincidono)

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 34: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Descrizione dei dati raccolti Ersquo utile per ottenere

statistiche univariate riassuntive delle variabili

Selezionare le variabili

Scegliere le statistiche

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 35: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Output

La distribuzione egrave normale se Skewness (Asimmetria) e Kutosis (Curtosi) sono compresi tra -1 e 1

Asimmetria e curtosi sono due statistiche che servono per valutare se una variabile egrave distribuita normalmente sono statistiche di confronto tra la distribuzione normale e quella ottenuta empiricamente

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale

Page 36: EPG Metodologia della ricerca e Tecniche … Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Antonella Macchia E-mail: a.macchia@unich.it E ORARI LEZIONI Sabato

Asimmetria misura come le osservazioni si distribuiscono rispetto alla media della distribuzione

Valori + maggior concentrazione dei casi in valori inferiori alla media Valori - maggior concentrazione dei casi in valori superiori alla media

Curtosi egrave invece misura di quanto le osservazioni si trovino raggruppate nei valori estremi laquole

laquocoderaquo della distribuzione

Valori + maggior concentrazione dei casi intorno al valore medio Valori - maggior concentrazione dei casi nelle code rispetto ad una distribuzione normale