Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
Sociologia generale e Statistica sociale (13)
Corso di Lingue, Letterature e Culture Straniere
Anno accademico 2019-2020
Prof. Michele Marzulli
La rilevazione
• La rilevazione del fenomeno di interesse X su U è il processo di «costruzione» dei dati.
• In genere consiste nel recarsi fisicamente presso le unità statistiche per osservare o misurare, e quindi registrare, le diverse manifestazioni x di X (per es. mediante questionario).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale2
I fenomeni statistici
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale3
statistico
Tipi di fenomeni statistici (e VAR)
• Prima distinzione: fenomeni quantitativi e qualitativi
– Cioè: numeri oppure categorie
• Fenomeni qualitativi
• X: genere, Y: squadra di calcio, Z: t.studio
• Fenomeni quantitativi
• A: numero di accessi a un sito web; B: temp. max.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale4
Tipi di fenomeni statistici (e VAR)
• Seconda distinzione: è possibile individuare un ordine?
– Cioè: la posizione dell’uno rispetto all’altro.
• Tra i fenomeni quantitativi c’è sempre un ordine (numerico).
• Tra i fenomeni qualitativi dipende
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale5
Ordinali
• Tra i fenomeni qualitativi ci sono fenomeni ordinalioppure categoriali.
1. Ordinali: fenomeni qualitativi che però hanno attributi che si possono ordinare secondo un criterio o convenzione.
– X: t.studio: c’è un ordine tra diploma elementare e laurea (cioè diploma < laurea < dottorato).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale6
Categoriali
• Tra i fenomeni qualitativi ci sono fenomeni ordinalioppure categoriali.
2. Categoriali: fenomeni qualitativi che non si possono ordinare secondo un criterio o convenzione.
– Y: regione di residenza.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale7
Discreti
• Tra i fenomeni quantitativi ci sono fenomeni discretioppure continui.
3. Discreti: fenomeni quantitativi che si possono contare, enumerare.
– Z: numero di esami sostenuti; A: numero di furti di auto denunciati; B: accessi al sito internet del Dip. di LingueBG.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale8
Continui
• Tra i fenomeni quantitativi ci sono fenomeni discretioppure continui.
4. Continui: fenomeni quantitativi che si possono misurare, per i quali esiste una scala di misura.
– C: peso corporeo alle 8 di mattina (kg.); T: temp. maxgiornaliera in nov. a BG (°C, °F).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale9
In sintesi: dati e proprietà
• Numerici o quantitativi
– Risultato di una misura: continui (distanza, reddito, durata, peso)
– Risultato di un conteggio: discreti (numero di figli, numero di esami, numero di giorni di malattia)
• Categorici o qualitativi
– Ordinali (titolo di studio, scala Mercalli per l'intensità di un terremoto)
– Categoriali (o nominali) (genere, religione)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale10
Esempio (cfr. I. Negri)
• Su un campione di n = 20 donne sono state rilevate le seguenti variabili:
1. tipo di dieta (X)
2. giudizio sull'ultimo film visto (Y)
3. numero di convivenze (Z)
4. spesa per massaggi nell'ultimo mese (W).
• Di che variabili si tratta?
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale11
Esempio (cfr. I. Negri)
X (modalità di risposta):
– N = Non importa / mangia di tutto
– C = Carne sempre
– V = Vegana o vegetariana
– S = Solo salumi
• Non è un numero, è qualitativa, non c’è un ordine, è nominale /categoriale.
Y (modalità di risposta):
– x1 = A = abominevole
– x2 = O = osservabile
– x3 = S = super
– x4 = L = da 30 e lode
• Non è un numero, è qualitativa, c’è un ordine.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale12
Esempio (cfr. I. Negri)
3. La variabile numero di convivenze (Z) è una variabile numerica discreta.
4. La variabile spesa per massaggi (W) è una variabile numerica continua (misurata con una specifica unità di misura).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale13
La rilevazione
• Il processo di costruzione dei dati (meglio di «creazione») è la rilevazione.
• Gli strumenti della rilevazione sono il questionario e le scale di modalità/di rilevazione.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale14
La rilevazione: le modalità (1)
• La scala delle modalità o scala di rilevazione con cui si rileva X è l'insieme di tutte le possibili manifestazioni x di X (su U).
• La scelta e la formulazione della scala delle modalità opportuna per la rilevazione di ogni fenomeno di interesse è parte integrante del processo di costruzione dei dati.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale15
La rilevazione: le modalità
• Devono essere rispettati due principi:
1. esaustività: la scala delle modalità deve prevedere tutte le possibili manifestazioni di X su U, al fine di poter classificare ogni osservazione circa una unità statistica (es: la risposta “Altro” in un questionario)
2. mutua esclusività: la scala deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizioni, in modo da poter classificare ogni osservazione circa una unità statistica senza ambiguità.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale16
Classificazione delle scale di modalità
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale17
M/F; sì/no
t.studio
N° accessi web (0, 1, 2, 3, …)
0° C / 0° F
Classificazione delle scale di modalità (1)
• Scale qualitative, in cui le modalità sono attributi o categorie, qualità (es: genere, titolo di studio, ecc.):
1. sconnesse, se gli attributi o le categorie non ammettono un ordinamento oggettivo ma solo un ordinamentocasuale o personale (es: il genere, che è dicotomica),
2. ordinali, se gli attributi o le categorie possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato (es: il titolo di studio).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale18
Classificazione delle scale di modalità (2)
• Scale quantitative, in cui le modalità sono numeri (es: età, altezza…). Le scale quantitative sono sempre ordinali, ma si distinguono per avere:
3. origine assoluta (scale rapporto), se l'origine della scala è il numero 0 e indica l'assenza del fenomeno (n. accessi).
4. origine convenzionale (scale non rapporto), se l'origine della scala (generalmente ancora lo 0) ha significato solamente convenzionale (es: la temperatura).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale19
Livello di analisi (1)
• Dalla tipologia di scala dipende il livello di analisistatistica:
1. una scala qualitativa sconnessa (come il genere) ammette solo relazioni di uguaglianza (=) o differenza (≠), o presenza/assenza;
2. una scala qualitativa ordinale (t.studio) ammette anche le relazioni ≥ e ≤ (cioè l’ordine).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale20
Livello di analisi (2)
• Dalla tipologia di scala dipende il livello di analisistatistica:
3. una scala quantitativa rapporto (assoluta) ammette tutte le relazioni (=, ≠, ≥ e ≤) ma anche le 4 operazioni elementari (+, -, × , ÷)
4. una quantitativa non rapporto (convenzionale) ammette solo le relazioni ordinali (≥ e ≤) e le operazioni di somma (+) e sottrazione (‒).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale21
In sintesi
• La natura qualitativa o quantitativa del fenomeno di interesse ha a che fare con la tipologia di scala delle modalità adottabile per la sua rilevazione (anche se non la vincola necessariamente).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale22
Esempio / esercizio (1)
• Per ogni fenomeno sociale indicato, individuare (1) la popolazione di riferimento; (2) il tipo di dato; (3) la scala di modalità più opportuna; (4) le operazioni effettuabili tra le modalità della scala.
– X: regione di residenza e genere dei laureati italiani in Lingue nell’anno 2017.
Risposte: 1= i laureati in Lingue in Italia nel 2017; 2= qualitativo categoriale; 3= Lombardia, Piemonte… M/F;
4= presenza/assenza, (=) e (≠).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale23
Esempio / esercizio (2)
• Per ogni fenomeno sociale indicato, individuare (1) la popolazione di riferimento; (2) il tipo di dato; (3) la scala di modalità più opportuna; (4) le operazioni effettuabili tra le modalità della scala.
– Y: immigrati maschi in Italia nel 2015.
R: 1=immigrati M, Italia 2015; 2=quantitativo discreto; 3=
0… ∞; 4 (= ≠ + - > <)
– A: voto finale in matematica dei bambini che hanno finito la 5’ elementare a Bergamo.
Qualitativo Ordinale
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale24
Notazione
• Indichiamo con k il numero di diverse modalità previste dalla scala utilizzata per la rilevazione di X su U.
• Usiamo l'indice i per distinguere le diverse modalità x del fenomeno X:
– la rilevazione di X su U avviene con la scala di modalità x1, x2,…, xk o xi , i = 1, …, k (x con i per i che va da 1 a k).
• Per es.: genere k = 2; x1 =“maschio”, x2 =“femmina”.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale25
Notazione, esempio (1)
X ni Freq. %
N 6 30
C 7 35
V 4 20
S 3 15
Tot. 20 100
• Quante unità statistiche presentano modalità x del fenomeno X (tipo di dieta)?
• In valori assoluti basta contare la frequenza (ni).
• Per convenzione, la i indica la modalità generica (i-esima). Qui i = 1.
• Le modalità (k) della risposta sono: N, C, V, S.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale26
Notazione, esempio (2)
X ni Freq. %
N 6 30
C 7 35
V 4 20
S 3 15
Tot. 20 100
• Quindi ni dove i= 1,…, 4.
• k=4
• Le risposte possono essere assegnate alle diverse modalità in questo modo:– risposta V (vegana), 4
frequenze, cioè per n3=4.
• Le altre risposte possono essere indicate ugualmente così: n1 + n2 + … + nk = n (cioè 20)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale27
Appendice 1
• Come si costruiscono le variabili
• Come si costruiscono gli indici (introduzione)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale28
Unità di analisi
• L’oggetto di studio può essere l’individuo (studio ladisoccupazione come caratteristica propria di alcuniindividui, i giovani per es.).
• Può anche essere: le auto vendute, i Comuni italiani,le scuole primarie del Comune di Bergamo…
• Sono tutte UdA, cioè il tipo di oggetto di cui sioccupa la ricerca sociale.
• L’UdA è singolare e astratta.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale29
I casi
• Per passare dall’astrazione (il generico oggetto diricerca, le UdA) al concreto, devo invece prendere inconsiderazione i singoli CASI.
• I casi sono gli esemplari su cui svolgo la ricerca(Mario, Giovanna, il Comune di Verdello, la Scuolaprimaria di Via Garibaldi…).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale30
Oggetto, unità e caso
• Oggetto unità caso
• Dal livello massimo di astrazione al concreto
• La disoccupazione giovanile i giovani tra i 16 e i 34anni, senza occupazione stabile Mario.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale31
Il campionamento
• Campionamento: la selezione di una porzione dipopolazione (cioè una parte di U) per individuare icasi (le future righe della matrice dei dati, u).
• Solo con una delimitazione spazio-temporale (igiovani di Bergamo, nel 2019) e con ilcampionamento i risultati della ricerca (sui casisingoli) sono generalizzabili, cioè riferibiliall’universo.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale32
Tipi di unità di analisi
1. L’individuo, è l’unità elementare, non ulteriormentescomponibile di molte ricerche sociali (e la base perUdA di tipo aggregato).
2. L’aggregato:
A. Più individui famiglia
B. Unità territoriali una città, un quartiere, unaregione…
C. Enti istituzioni, organizzazioni…
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale33
Tipi di unità di analisi
3. Eventi sociali (le elezioni, uno sciopero, un eventomusicale, il Giubileo…).
4. Un prodotto culturale (spesso oggetto di analisiqualitativa, non statistica)
– I programmi televisivi, la pubblicità (il contenuto),i messaggi sui social network («sentiment»)…
– In genere: «analisi del contenuto».
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale34
Concetti e indicatori
• Un concetto è rappresentato come una proprietà diuna UdA.
• Devo tradurla in una variabile, i cui valori sonoempiricamente rilevabili.
• Sulla matrice potrò così inserire lo stato che ognicaso assume su quella proprietà (per es. 1 o 2 comepresenza o assenza).
• Questa traduzione è la operativizzazione.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale35
Concetti e indicatori
• Nella ricerca sociale i concetti sono però spesso:
1. Generali / generici
2. Estesi (semanticamente)
3. Astratti
• Quindi: è impossibile la rilevazione DIRETTA diquesti concetti (anomia, libertà, partecipazione…).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale36
Concetti e indicatori
• Se il concetto non ha stati empiricamente rilevabili, sideve trovare un altro concetto che ha stati rilevabiliempiricamente.
• Cioè un INDICATORE.
• Il concetto (C) è rappresentato tramite l’indicatore(I).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale37
Concetti e indicatori
• I è un concetto più specifico di C, e può essere intesocome rappresentazione semantica di C.
– C: status socioeconomico.
– I: reddito, titolo di studio, posizioneoccupazionale.
• Poiché C è complesso, si usano spesso diversi I (nonsolo un I).
• Per es.: Isee = Ise/N = Isr + (20% ∙ Isp)/N
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale38
Concetti e indicatori (es.)
• Isee = Ise/N = Isr + (20% ∙ Isp)/N
• L’ISEE (Indicatore della Situazione EconomicaEquivalente) si trova con una formula complessa:
1. L’indicatore di situazione economica (ise) / N(N=scala di equivalenza che possiamo tradurrecon nucleo famigliare).
2. L’Ise a sua volta è definibile come: Reddito (isr) +una parte (20% dei patrimoni) / N.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale39
Concetti e indicatori
• Esempio: Come misurare il grado di secolarizzazione in un Comune (Marradi, 1984)?
1. Tasso di matrimoni civili, rispetto a quelli religiosi.
2. Tasso di divorzio.
3. Tasso di aborti.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale40
Indici
• Se il concetto è molto complesso, servono moltiindicatori.
• Per es.: libertà politica:
• Libertà di stampa, libere elezioni, pluralismo partitico…
• Inoltre: democrazia è C che posso misurare sempre con Libertà di stampa (I).
• Per avere una sintesi: ricombinazione di più indicatori di un concetto: INDICE.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale41
Indici
42
Concetto (compl.)
Rapporto di indicazione
Indicatore 1
Indicatore 3
Indicatore 2
Definizione operativa
VAR 1
VAR 3
VAR 2
Ricombinazione
IND
ICE
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale
GDI: gender development index
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale43
Concetti e indicatori
• Gender Development Index (GDI)
• http://hdr.undp.org/en/content/gender-development-index-gdi
• Gender Inequality Index
• http://hdr.undp.org/en/composite/GII
• http://hdr.undp.org/en/countries/profiles/ITA
• ITALY
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale44
La definizione operativa
• Se il primo passaggio è quello di passare dallePROPRIETÀ agli INDICATORI…
• Il secondo è quello dagli INDICATORI alle VARIABILI,cioè la DEFINIZIONE OPERATIVA.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale45
Il titolo di studio (esempio)
• L’UdA è l’individuo, la proprietà è il titolo di studio, èpossibile individuare diversi STATI su questaproprietà (gli stati sono tradotti in modalità).
– Popolazione anziana: «senza titolo», licenza elementare,licenza media, diploma superiore, laurea.
– Popolazione giovane: s. t., licenza elementare, media,titolo di scuola II di 2°… dottorato.
• Cioè: non c’è corrispondenza biunivoca tra un concetto e lavariabile (dipende dal contesto e dalla teoria di riferimento).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale46
Definizione di variabile (Marradi)
• La variabile è una proprietà di cui è stata data unadefinizione operativa, trasformando le situazionireali (stati) in una sequenza ordinata di informazioni.Queste informazioni sono tradotte in cifre nellaricerca sociale.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale47
Variabile
• La variabile è un concetto operativizzato (laproprietà di un oggetto a cui è stata data unadefinizione operativa).
• Gli stati delle proprietà diventano CATEGORIE (a cuiverrà assegnato un valore (numero) nella colonnadella relativa proprietà/variabile della matrice deidati).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale48
Esempio: la «scolarità»
• Il concetto generale (status sociale) ha diverse proprietà, tracui il livello di scolarità (INDICATORE) di un individuo (UdA).
• Gli STATI sulla proprietà sono il grado di istruzione (alto,medio, basso).
• Traduzione empirica (definizione operativa):
– la proprietà diventa una VARIABILE («titolo di studio»);
– gli stati sulla proprietà divengono MODALITÀ (da «senzatitolo»…. a post-laurea).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale49
Variabili: a quali condizioni
• Non tutte le proprietà sono trasformabili in variabili(e quindi possono essere studiate).
• Condizioni per la trasformazione:
1. La proprietà deve variare (assumere diversi stati,almeno 2, da caso a caso); altrimenti è una cost.
• Se faccio una ricerca sulle donne, la proprietà generenon è una variabile.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale50
Variabili: a quali condizioni
2. La proprietà deve essere definibile operativamente,devo cioè sapere come gli stati siano rilevabili.
– Proprietà più semplici 1 proprietà = 1 var. (una colonnanella matrice dei dati).
– Proprietà complesse (atteggiamenti)
1 proprietà = molte var./ molte colonne matrice (1VAR. = molte modalità).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale51
Appendice 2
• Come si distinguono le variabili
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale52
Tipi di fenomeni statistici (e VAR)
• Prima distinzione: fenomeni quantitativi e qualitativi
– Cioè: numeri oppure categorie
1. Tra le VAR QUANT.: discrete (conteggio) e continue(misurazione).
2. Tra le VAR QUAL.: ordinali (posso essere messe in un qualche ordine) e categoriali o nominali (non c’è alcun ordine).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale53
Tipi di variabile
• Per distinguerle, in primo luogo capire se sono numeri.
• (attenzione: si possono usare i numeri come etichette: genere 1=M, 2=F).
• Poi capire se sono frutto di conteggio o di misura.
– Conteggio: numero di esami sostenuti, n. auto vendute… (VAR quant. discreta, non puoi aver fatto 3,7 esami).
– Misura: reddito in €, temperature in °Cent. … (VAR quant. continua, la t. può essere 22,4 gradi).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale54
La variabili
• Cioè conta la PROPRIETÀ da cui la VAR deriva.
• Proprietà DISCRETA: n. finito di stati, senza relazionequantitativa fra loro (numero di figli).
• Proprietà CONTINUA: n. infinito di stati, lungo uncontinuum, in relazione quantitativa fra loro (età).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale55
Come si classificano le variabili
• Se associo un numero (valore alfanumerico «3») allamodalità «licenza media» della VAR t.studio… non haun significato matematico, è solo unaetichetta/convenzione. Possiamo usare qualsiasialtro simbolo (una lettera dell’alfabeto).
• Ma se la VAR è «numero di figli», il valore 3 ha unsignificato numerico preciso (2 < 3 < 4).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale56
VAR categoriali
• C’è una differenza tra il valore assunto dalla VAR genere e daquella t.studio.
• Genere NON ha alcun ORDINE (posso assegnareindifferentemente 1 a uomo o a donna) nominale /categ.
• T.studio invece ha un ORDINE concettuale. Cioè la proprietà èuna categoria ordinata. È una serie ordinata: posso dire cheLaurea viene dopo di diploma.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale57
Proprietà continue
• Se la proprietà è la misura della distanza da casa ascuola:
• è continua (assume un numero infinito di stati,collocabili lungo un continuum… cioè i metri percorsi);
• È misurabile (c’è una unità di misura).
• In questo caso, l’operativizzazione restituisce unaVAR metrica trattabile con operazioni matematiche.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale58
Misurazione
• È una operazione generata da strumenti dimisurazione in cui l’unità di misura è convenzionale(metro, chilo, litro).
• Nelle scienze sociali possono essere misurate leproprietà di una persona:
– Anzianità di lavoro, ampiezza dei parchi di un Comune,lunghezza delle reti di comunicazione…
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale59
Misurazione
• Nelle scienze sociali ci sono proprietà psichiche chenon possono essere misurate:
– I valori, gli atteggiamenti, le opinioni.
• Allora si usano le scale (scaling), le producono VARQUASI-CARDINALI, cioè proprietà non misurabili matrattate come se… (scale di atteggiamento).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale60