3_Statistica - Appunti

DATI: val info potenziale; an, presentazione, diffusione. Conoscenza: confronto tra info (come e xch dei fen). Stat: tecniche per la conoscenza quant di fen coll (proc decisionali); fen con molte oss; conteggi, classif, misurazioni, sintesi. Descr: ril, sintetizza ed interpreta dati espressione di un fen in un insieme di entit; indici. Inf: dal camp al tot della pop con le prob. Ricerca: cosa studiare e su chi. Ogg dell'an: fen; casi o ripetizioni; naturali o provocati; oss dir o ind; car id dette caratteri (X); modalit (x) in corrispondenza delle unit del coll. X qual: attributi (agg o locuzioni); sconnessi (genere, naz, colore) o ord (qualif, tit); se sono sconnessi, si pu verificare solo = o ; se sono ord si pu stabilire una gerarchia. X quant: # (conteggi o mis); discreti (# di) o continui (peso, statura); delle ril in termini ass, rel o %. Dato stat: ricavato dall'oss del X su ogni unit del coll. Unit: unit elementare sulla quale si studia il fen; pu nn coincidere con il sing individuo (unit amm, stabilimenti, superfici, eventi, sogg...). Coll: insieme di unit omogenee rispetto ad una o + car di interesse; delle unit stat; la pop dalle unit che la compongono (gli studi stat si concentrano su fen coll e nn individuali). Sottopop: gruppo di unit di una pop omogeneo rispetto ad un X. Rappr: org delle manif del X nel coll. Distr: modo in cui 1 o + X si manif in una pop appr a seconda del # di X. Ord delle x: intensit, gerarchia, logica; senso crescente. Unitarie: elenco delle x oss unit; semplici (univariate, sing X) o multiple (bi-multivariate); serie storiche o temporali. Distr di : q.t espresse in termini di rel o tassi di tra t e t+1x1x2x3...xN

-x2:x1x3:x2...xN:xN-1

Distr di fr: elenco di tutte le x oss nel coll + # oss; si omettono i X nn ril. Fr ass: # di unit stat che presentano una x; la delle FR = al tot della pop. Fr rel: # di unit che presentano una x in rel alla numerosit del coll; la delle Fr = 1; confronti tra coll; si xde la dim del coll ma si pu indicare il peso di una x nella descr del coll rispetto al X esaminato, depurando la FR dalla numerosit del camp. Fr %: comprensione e fruibilit dei dati; il # di unit che presentano una specifica x prop a quello oss. Tab: quadro gen della manif del fen. Diagrammi: potere info sup; visione d'insieme; confronto tra fen per scoprire rel; leggibilit dei dati e delle elaborazioni (lettura di sintesi). La scelta della rappr graf influenza la comprensione. Titolo: tipo e x del X e del coll + unit di misura. Torta: 2 o 3 dim; distr fr% di fen qual sconnessi o ord ciclici; ogni fetta prop alla manif del X nel coll; nn utili per i confronti + poche x. Radar: X qual ord ciclici; + coll su un unico graf. Nastri e barre: distr semplici per X quant; distr fr per X qual; nei nastri il X sulle ascisse, nelle barre sulle ord. Aree: X quant continui nel tempo; 1 o + coll. Distr in classi: X continui; x org in intervalli di val le fr associate agli intervalli rappr il # di unit sulle quali si oss i val appartenenti alla classe. Criticit: # di classi, ampiezza, x da includere. Ampiezza: estr sup estr inf. Classe chiusa a dx: | comprende solo l'estr sup. Classe chiusa a sx: | comprende solo l'estr inf. Densit di fr: fr/ampiezza; entrambi influenzano l'intensit delle classi. Istogramma: classi sull'asse or, fr sull'asse vert; l'area prop all'intensit; le barre nn sono distanziate per dare l'idea di continuit nella rappr del X. Fr cumulate: fr con cui si presentano nel coll x (ord) < o = ad una soglia; si leggono i dati della distr rispetto ad una x fissata; delle fr precedenti; qual la fr con cui un fen o una x si presentano fino alla soglia. Poligono delle fr: raffigurazione graf delle fr cumulate; estr sup delle classi sulle asc e fr cum sulle ord. Distr multiple: oss e mis di + var su ogni unit, anche di natura mista; una distr di fr X. Diagramma di disp: scatterplot; rappr graf di var doppie quant. Distr doppie di fr: si contano le unit che presentano contemporaneamente una x di una var ed una dell'altra. Fr congiunte: interne alla tab; intersezione di riga e colonna. Fr mg: di righe e colonne; distr di una sing var; fanno xdere info sul coll; i pedici indicano righe e colonne; la 1. Fr rel: fr cong/tot del camp. Rapporti di composizione: % di unit che hanno 1 o + x della var in riga tra quelle che ne hanno 1 o + della var in colonna (e viceversa). Indici sintetici: tendenze centrali; sintetizzano in un dato il X; si sostituiscono le x con un val che le rappr, redistribuendo il fen; centro ideale della distr (val intorno al quale gravitano i dati). Internalit: il val degli indici compreso tra gli estr della distr ma nn coincide sempre con una x oss. Scelta: tipo del X, rappr stat, motivazioni della sintesi. Medie: stessa unit di mis del X; idea immediata della manif del fen; confronto di un fen su coll o in tempi/luoghi o fen . Medie analitiche: op algebriche; le var doppie quant si considerano separatamente. x: redistribuzione equa; val che, sostituito ad ogni x, lascia = la . x pond: insieme di val oss con P pesi nn negativi; importanza delle x secondo un criterio dalla fr. x geom: il X mediante prop; calc solo se tutti i val sono positivi. Robustezza: nn si possono usare su dati qual; i val anomali influenzano l'indice. Medie di posizione: no op algebriche. Moda: x + fr della distr; uni o bimodali; con le distr in classi nn si individua una sing unit. Me: considera la posizione; centro della distr, bipartisce il coll; si ord le unit in senso crescente e si individua il rango centrale; con distr in classi si ottiene un val approssimato assumendo che nella classe Me le unit siano distr uniformemente. N dispari: (n+1):2. N pari: 2 unit centrali con posizione n/2 e (n/2)+1; se il X quant, la Me la semi dei val delle unit centrali, se qual la med compresa tra i val corrispondenti alle 2 x. Percentili (quantili): val che suddividono la distr in 100 parti di = numerosit. P-mo percentile: frazione p/100 del coll; xi che suddivide il coll in 2 gruppi t.c. il primo ha numerosit N(p/100) e le sue unit hanno una x al + = xi ed il secondo ha numerosit N(1 p/100) e le sue unit hanno una x almeno pari a xi; lascia alla sua sx il p% della distr ed alla sua dx il (100 p%) dei val. Indici di variabilit: attitudine di un X quant ad assumere x ; disp dei dati; bont della sintesi; indici a seconda degli aspetti di interesse: diff tra i val che occupano det posizioni, scostamenti da un val medio, diff tra tutte le oss; ricchezza delle info; elemento di discriminazione se l'ob classif le unit stat in gruppi omogenei rispetto ad una o + car. Scostamenti dalle medie: la diff tra ogni x ed il centro della distr lo scarto; usato per costruire un indice che valuta il liv di disp del fen nel coll. Scostamenti semplici: diff in | | delle x da x o Me. Scostamenti quadratici: il quadrato degli scarti elimina la propr di nulla degli scarti rispetto alla x ed assegna un peso > ai val + distanti dal centro; sfrutta la propr delle misure di centralit che min la degli scarti al quadrato. 2: nulla solo se tutti i val della distr sono =; nn ha max, + si allontana da 0 + il fen var; l'unit di misura elevata al quadrato; se le var delle distr doppie sono quant si calc la 2 separatamente. Devianza: num della 2; degli scarti al quadrato; usata per tutti i X quant. : deviazione standard; risolve il problema del cambio dell'unit di misura; della 2; quanto, in x, i val si discostano dal val rappresentativo della distr. 2 e sono indici ass di var.t; nn possono essere usati per confrontare coll con ord di grandezza o unit di misura . Indici relativi: costruiti rapportando l'indice di var.t ass ad una x o al val max assunto; rapporto tra 2 q.t espresse nella stessa unit di misura (# puro). CV: confronta la var.t di 2 distr; rapporto tra lo e la x in | |; espresso in %.Macroec: sistema ec e rel tra grandezze aggregate (liv di pdz e tasso di crescita, liv dell'occupazione e u, liv gen dei p e tasso di inflazione). Stock: istante. Flusso: intervallo. di stock: accumulo di grandezze di flusso. Stat ec: flussi che si svolgono nel e fra sistemi ec. Terr ec: confini fisici, giacimenti in acque internaz sfruttati da residenti, sedi estere di ambasciate, consolati e basi militari, zone franche doganali, spazio aereo naz, acque territoriali, navi, aerei e piattaforme galleggianti appartenenti a residenti. Residente: chi ha il centro degli interessi ec all'interno del terr. Nazionale: ci che coinvolge i residenti. Interno: ci che avviene nella naz intesa in senso giuridico-amm. Flusso circolare del Y: diagramma che rappr le rel e gli scambi fra op; flussi reali e monetari. Op residenti: PA, imprese con sede nel paese, filiali e succursali di imprese estere ubicate nel terr, xsone fisiche con dimora abituale nel paese, frontalieri, cittadini italiani che lavorano presso ambasciate italiane all'estero. Famiglia: bisogni soddisfatti da beni e svz acquistati dalle imprese dietro compensi monetari; fp per le imprese (L, terra e K) in cambio di una remunerazione (w/onorario, rendita, ); risorse finanziare da e verso la PA. Impresa: pdz di beni e svz venduti a famiglie, PA e rdm in cambio di trasferimenti monetari; trasferimenti di risorse da e verso la PA. Stato: enti istit che producono svz collettivi nn destinati alla vendita (senza p di mkt) ed effettuano trasferimenti di Y. Banche: interagiscono con gli altri op; acquisiscono S e forniscono prestiti e finanziamenti generando i a credito ed a debito. Rdm: sogg ec che nn risiedono nel terr ma hanno rapporti ec con i residenti; flussi reali, monetari/finanziari; trasferimenti (rimesse degli immigrati o trasf di organismi sovranaz). Beni e svz: soddisfano i bisogni di famiglie ed imprese. Riproducibilit: rifatti dall'att produttiva; beni finanziari nn riproducibili. Durata: uso immediato o durevoli (svz/finanziari). Destinazione: C o pdz. Contabilit naz: flussi ec-finanziari tra op; mis in termini quant il risultato dell'att ec di un paese in un dato xiodo; schema concettuale di rappr del funzionamento del sistema ec. Ist di rilevazione: fmi, ocse, eurostat, bce, istat, bi. Struttura: successione di conti ec che derivano dai flussi tra gli op; def dei principali aggregati; formazione, distr ed impiego del Y naz, accumulo del S, formazione degli I, posizione del paese nei confronti del rdm. Sec 95: mod di cont naz europeo recepito dall'istat; individua gli op ec, def le rel ed i flussi ec, id gli aggregati e le rel che li legano. Pdz aggregata: grandezza di rif della cont naz. Ammortamento: mis la perdita di val subita in un anno dai K fissi; una parte dei K pdt in un anno rappr il reintegro della capacit produttiva. Pil: 3 metodi che mis la stessa grandezza; in un'ec chiusa, il val della pdz = alla dei c di pdz che rappresenta il Y naz speso per acquistare beni e svz. Output: pdz; val dei beni finali pdt; incremento di val della pdz in ogni fase del proc produttivo. Y: delle remunerazioni dei fp (w, , rendite, i). Spesa: impiego del Y. Pil reale: delle q.t di beni finali valutati a p costanti; mis della pdz e delle sue nel tempo escludendo l'effetto dei p. Legge di okun: rel tra U e crescita del pil. Tasso di inflazione: tasso di p; costr ponendo al den un val rif all'anno base. Deflattore del pil: p medio dei beni finali pdt in un'ec. Indice dei p al c: c monetario del paniere di un consumatore tipo. Composizione del pil: y disp: al netto di imp e tasse; considera anche i Y guadagnati ma nn percepiti scontando i Y percepiti ma nn guadagnati; Y delle fam al netto dell'intervento pubb. C: beni e svz acquistati dai consumatori. S: Y disp nn consumato. I fissi: immobiliari o nn; grandezze di flusso; incremento dello stock di K desiderato. I in scorte: nn programmati; pdz vendite. G: beni e svz acquistati dallo stato o da enti pubb; nn include trasferimenti e i sul debito pubb; nn incrementa la pdz ma ha solo effetti redistributivi. Saldo comm: E M; avanzo e disavanzo comm nella bilancia dei pagamenti. S = I: Y = C + S = C + I I = S; ex ante, l'= si verif solo per i val per cui la pdz programmata = alla D desiderata; se S > I, D < pdz; la pdz invenduta genera un aumento di scorte e I; verifica ex post dell'=. INDICE (che mostra, che fa conoscere): dato elaborato; rapporto tra 2 q.t; misura di un fen direttamente oss. INDICATORE (colui, ci che indica): strumento di mis di fen nn oss dir; valuta il liv di un fen complex tramite loss diretta di altri fen oss con un contenuto semantico comune al concetto che si vuole misurare; dati che permettono di stimare a che punto siamo e dove stiamo andando in relazione a det val ed ob e di valutare progr specifici det l'impatto. Stat sociali: f conoscitive (condizioni di vita), previsisive (pop) e valutative (ineguaglianze). Criticit: car di un buon indicatore; difficili da dimostrare per la complex dei fen. Car degli indicatori: validi (mis il concetto ogg di studio), affidabili (mis il concetto in maniera stabile), sensibili al cambiamento di ci che si mis, orientati al fen, capaci di promuovere decisioni, semplici (comprensibili a tutti). Solo le prime 2 propr possono essere verif con strumenti stat; il resto affidato al buon senso e alla difficolt del concetto che si vuole mis. Origine dell'info: ogg (dati stat relativi ad eventi dir ril, esistenza reale e concreta, suscettibili di controlli dir di veridicit ed attendibilit) o sogg (opinioni, atteggiamenti, sentimenti, desideri o giudizi). Scopi: descrittivi (esplicitano lo stato dei fen senza presupporre un quadro teorico di rif), esplicativi (interpretano la realt con schemi di rif che consentono di stabilire legami tra indicatori e fen studiato) e predittivi (indicazione della tendenza evolutiva dei fen). Rapporti stat: fen legati da nessi logici; comparazioni nel tempo, nello spazio o in situazioni . Significato: quanta parte del num spetta ad ogni unit del den. Efficacia: nesso tra num e den; complementarit, normale-accidentale, temporaneo-permanente, parte-tutto; antecedente-conseguente, stock-flusso, causa-effetto. Costruzione: il significato del rapp dipende da quello dei 2 termini e dalla rel che li lega; i rapp relativi allo stesso fen possono essere a seconda della scelta dei termini. Forza l: xsone occupate o in cerca di occupazione. Occupati: xsone di 15 anni e + che, nella settimana di rif, hanno svolto almeno un'ora di L in qualsiasi att che preveda un corrispettivo monetario o in natura, hanno svolto almeno un'ora di L nn retribuito nella ditta di un fam nella quale collaborano abitualmente, sono assenti dal L per ferie o malattia ma l'assenza nn sup i 3 mesi o continuano a percepire almeno il 50% della retribuzione. Persone in cerca di occupazione: xsone tra 15 e 74 anni nn occupate che nei 30gg che precedono l'intervista hanno effettuato almeno un'az attiva di ricerca di L e sono disposti a lavorare o ad avviare un'attivit autonoma entro le 2 settimane successive o inizieranno un L entro 3 mesi dall'intervista. Tasso di attivit: fl : pop in et lavorativa. Tasso di U: xsone in cerca di occupazione : fl. U di lunga durata: xsone in cerca di occupazione da almeno 12 mesi : fl. Tasso di occupazione: occupati : pop et lavorativa. Avviamento al L: andamento semestrale del # di contratti sottoscritti registrati nel database delle comunicazioni obbligatorie sui rapp di L; # di opportunit generate dal mkt in favore dell'OL disponibile. Avviati al L: # di xsone avviate al L su base semestrale; val inf al # degli avviamenti se un lavoratore sottoscrive + contratti nel periodo. Avviamenti/Cessazioni: capacit del mkt di sostituire i contratti cessati con i nuovi; se > 1 il mkt ha generato un # di contratti > di quelli conclusi; evoluzione della composizione dello stock di occupati. L irregolare: svolto continuativamente da chi si dichiara occupato a tempo pieno ma nn risulta presso le imprese, si dichiara U pur lavorando, svolge + att nn dichiarandolo, nn visibili al fisco in quanto nn residenti e/o nn regolari. Tasso di irregolarit: unit di L irr : unit di L tot. ass: a-b; grandezze omogenee; divergenza tra fen o in tempi . rel: Ra = (b-a) : a; Rb = (b-a) : b; Ra,b = (b-a) : (0,5(a+b)); mostra come il fen si mod nel tempo o nello spazio eliminando l'apporto della ril iniziale. Analisi shift-share: tecnica descrittiva ottenuta a partire da hp stringenti; spazio temporali di ind ec in un'area di studio in rel ai cambiamenti riscontrati in un sistema ec; separa i fattori di sv loc da quelli naz x comprendere l'ec dei territori (vantaggi in det settori, andamento strutturale o casuale, gerarchia tra l'eff dovuto al mix settoriale e quello loc). Effetto tendenziale: componente base o nazionale. Mix settoriale: componente strutturale. Effetto differenziale: componente loc. Scomposizione: esplicita i fattori nn loc per isolare i fattori residui; mis della capacit di crescita autonoma dell'area. Criticit: scelta dei xiodi per il confronto, def dei settori nei xiodi considerati, omogeneit della raccolta dati, stabilit della def delle aree studio. complessiva: incremento base + strutturale + loc. netta: complessiva base. B: cambio che si verificherebbe nel settore dell'area studio se ad un tasso simile a quello complessivo; effetto tendenziale del settore; Bi,j (area, settore) che deriva dal trend globale dell'area di rif; si calc applicando ai liv dell'anno base nei settori la rel complessiva dell'area di rif Bi,j = Ei,j g (livello dell'indicatore nell'area i per il settore j x tasso di dell'ec di rif). S: cambiamento che si verificherebbe nel settore dellarea studio se ad un tasso simile a quello del settore nellarea di rif; effetto strutturale nella di un settore; Si,j depurata dal trend glob dell'area di rif; calc applicando ai liv dell'anno base dei settori la rel del settore nell'area di rif al netto della complessiva Si,j = Ei,j (Sr,j g). L: diff tra la nel settore dellarea studio e la dello stesso nellarea di rif; eff loc nella di un det settore; stima Li,j depurata dal trend di settore nell'area di rif; si calc applicando ai liv dell'anno base nei settori la rel del settore nell'area studio al netto della rel del settore nell'area di rif Li,j = Ei,j (Si,j Sr,j) dove il termine in () una proxy che considera la diff tra il tasso di di un det settore nell'area studio e quello nell'area di rif. Analisi: segni dei 3 effetti per comprendere quali settori hanno un vantaggio competitivo. Settori di interesse: L > S. Numeri indici: confronto tra le intensit di un X in tempi o luoghi ; rel di un fen; # puri. Indici semplici: considerano un solo fen (combinazione di componenti elementari in situazioni ); rapporto % fra 2 grandezze ec omogenee; approccio stat. Serie storica: It,t+1=(Ht+1:Ht)100. Den: base o origine del # indice. Indici composti: + fen (combinazione di componenti nn elementari rispetto ad una situazione di rif); fen complex scomposto nei suoi componenti; si calc un indice per ogni elemento; ind delle rel di fen eterogenei resi confrontabili dal rif a p o q.t; si ottengono come sintesi di # indici semplici; approccio ec. Indice globale: sintesi delle mis dei sing rapporti; traduce in un val leggibile il confronto storico o territoriale. Costruzione: scelta degli elementi (# e tipo), def delle x da ril, scelta della base (anno in cui il fen ha avuto un'evoluzione normale), delle formule di sintesi, del tipo di pesi. Tecniche: sintesi degli ind elementari (calc degli ind elementari di ciascuna serie con la stessa base + sintesi mediante media), rapp tra aggregati di val (si assegna un peso per differenziare l'importanza delle serie; pesi positivi ed addizionabili). Indice di laspeyres: usa come sistema di pesi p e q dell'anno base; esprime la di un paniere di beni; tendenziosit positiva. Indici di paasche: p e q dell'anno corrente; tendenziosit negativa. Strumenti: media arit e geom. Osservazione empirica: modello concettuale che def il fen (benessere soc); concetti astratti (costrutti) che caratterizzano il fen (status soc); ind che def i costrutti (istruz, condizione prof); elementi oss e misurabili (var) per ogni concetto (anni di scolarit, tit di studio). Matrice dei dati: unit oss nelle righe e var o ind nelle colonne; sintesi per ciascuna unit (ind aggregato). Approccio ordinale: a partire da una batteria di s indicatori elementari si tende alla costruzione di un'unica graduatoria finale delle unit interessate; si considera solo la posizione delle unit rispetto al liv della var e nn rispetto alla sua intensit quindi si possono usare sia var qual ordinabili che var quantitative. Ai val oss di ogni var sono sostituiti degli ordinamenti (uno colonna) espressi sotto forma di ranghi; il rango di un elemento xij un # di ord conferito sulla base della posizione che occupa in rel agli altri elementi della j-esima colonna. La direzione degli ind elementari deve essere la stessa per tutti; se un ind ha direzione negativa si considera il suo complemento rispetto all'unit di rif. Dopo aver calcolato i ranghi di ogni var si considera per ogni oss la rel Si=gij. Per migliorare la leggibilit dei dati possibile esprimere la sintesi in termini medi. Ottenuta la sintesi, per o per x, possibile esprimere l'ind composto in termini di rango e leggere la graduatoria complessiva. Permette di ottenere rapidamente un ind sintetico di facile interpretazione ma nn si possono ricavare info sulla distanza che separa ogni termine dall'altro n la distanza x che intercorre tra essi. Approccio cardinale: misura metrica delle diff tra le unit. Le unit sono ord e si quantificano le diff che intercorrono in termini di distanza; in entrambi i casi l'origine arbitraria, f della batteria di ind elementari scelti e dei val delle unit considerate. possibile usarlo solo con var quant. necessario trasformare gli ind elementari in modo che si muovano tutti nella stessa direzione e trasformarli in modo che si possano comparare attraverso #indici, in %, relativizzando o standardizzando. La trasformazione dei dati in #indici consente di eliminare il problema delle unit di misura degli ind elementari considerati; per invertire il segno degli ind elementari con direzione opposta si pu usare il reciproco dei #indici considerando la situazione min invece della max nel proc di normalizzazione. Dopo aver normalizzato tutti i valori (rispetto alla x o al valore max Iij=xij:xm oppure Iij=xii:xmax), si calcola la x dei #indici. La trasformazione in dati relativizzati consente di eliminare i problemi derivanti da una grandezza degli ind elementari e di tenere sotto controllo la var.t (cij=(xij-minx.j):(maxx.j-minx.j)). Il den indica il campo di ; i dati sono prima centrati e poi rapportati al campo di ; la presenza di val anomali rischia di alterare la leggibilit per cui si possono usare valori min e max teorici. Una volta def i coeff se ne calcola la x. Per eliminare il problema dell'unit di misura e controllare la var.t si pu normalizzare i dati oss usando x e deviazione standard: zij=(xij-xm):.j). I dati sono centrati rispetto alla x e rapportati alla deviazione standard; in seguito si calcola la media degli z-score. il metodo + usato, anche se nn garantisce comparabilit logica tra gli ind. Ponderazione ind elementari: peso per tener conto della importanza che gli ind semplici hanno nel def la misura complex data dall'ind composito. Il sistema di ponderazione pu essere def rispetto a criteri e pu essere visto come un affinamento ed una correzione del mod concettuale def originariamente. necessario considerare la struttura teorica e la struttura log/concettuale su cui basato l'ind composito; il significato ed il contributo dell'ind elementare nell'aggregazione; la qualit dei dati e l'adeguatezza stat degli ind elementari. preferibile def ind composti da un # ragionevole di ind elementari per aumentarne la parsimonia e la trasparenza in relazione alla def dei pesi. Indipendentemente dall'approccio usato, i pesi rappresentano val di giudizio: nel presentare i risultati dell'ind composito importante esporre le ragioni che hanno condotto alla scelta dei pesi, la metodologia adottata ed i risultati che si sarebbero ottenuti adottando altre metodologie. Approccio multivariato: la stat uni e bidimensionale consente di rappresentare i dati rel ad una o 2 var con tecniche semplici e di immediata comprensione. La stat multidimensionale o multivariata consente il trattamento simultaneo di un #elevato di var ed oss, visualizzando associazioni complex. Analisi in componenti principali: l'ob generico di eliminare la ridondanza che pu esservi nel considerare una serie di var tra loro corr, sostituendo ad esse un # di var latenti fra loro incorr, in grado di fornire una quota suff dell'info complessiva contenuta nelle var originarie. Le n unit sono punti di uno spazio a p dimensioni, impossibili da rappresentare per p > 3. L'angolo formato tra 2 var pu essere interpretato in termini di corr; se il cos dell'ang 0 le 2 var sono incorr e quindi ortogonali tra loro; se il cos dell'ang 1 le var sono corr tra loro. Le distanze o prossimit tra le unit possono essere interpretate in termini di analogie di comportamento rispetto al fen ogg di studio. Indici dei p: approntati in rel alla fase di scambio, alle transazioni collegate ed alla natura merceologica dei beni ((pt*q0):(p0*q0)) o ((pt*qt):(p0*qt)). Indici delle q.t: fase di scambio, destinazione ec dei beni ((p0*qt):(p0*q0)) o ((pt*qt):(pt*q0)). Indici dei valori: op sui beni ed op nn riguardanti merci. Valore: f empirica; V = P Q. Indici a base fissa: intensit o fr di un fen con rif ad un periodo fissato; statica comparata; evoluzioni di medio o lungo periodo. Indici a base mobile: intensit o fr rif al periodo precedente; dinamica; breve termine ed oscillazioni congiunturali. Evoluzione temporale: valutata attraverso rel, tasso di e # indici. Ricerca scientifica: proc creativo di scoperta; itinerario e procedure prestabilite e consolidate; individuazione dei fatti rilevanti, formulazione di hp, approntamento di tecniche empiriche. Paradigma: criteri log-concettuali che guidano l'att di ricerca. Approccio quant: positivismo; spiegazione del fen; razionalismo e metodo analitico; rapp causali tra le var che spiegano i risultati; esamina un > # di casi e garantisce una > gen dei risultati; ogg (ricercatore = oss esterno). Tab: chiare e sintetiche; schemi che possono nn corrispondere alle cat reali. Approccio qual: interpretativismo; comprensione del fen; metodo sintetico e naturalismo; tipi ideali, cat concettuali che nn esistono nella realt ma liberano i casi reali dai dettagli per estrarne le car essenziali ad un livello sup di astrazione; - ogg (interazione tra ricercatore ed ogg di studio; influenza del background). Narrazioni: superano i lim delle tab. Interdisciplinarit: arricchimento della conoscenza. Q ONTOLOGICA (la realt esiste?): che cosa, natura e forma della realt; si chiede se i fen sono cose in s o rappr di cose. Q EPistemologica (la realt conoscibile?): rapporto tra il chi ed il cosa; rel tra studioso e realt studiata. Q Metodologica (in che modo si conosce la realt?): come; strumentazione tecnica del proc cognitivo. Metodo: procedure, regole e principi che consentono di conoscere, spiegare ed ord la realt; scelta delle tecniche + adatte per affrontare un probl cognitivo, capacit di modificare tecniche esistenti per adattarle ai probl specifici e di immaginarne nuove. Tecnica: strumento della ricerca, comprende procedure, regole e principi che consentono di conoscere, spiegare ed ordinare la realt; risultato delle riflessioni sul metodo; quando una nuova procedura viene ideata, codif e diffusa diventa una tecnica a disposizione della comunit. Indagini stat: lettura quant dei fen coll; raccolgono dati su uno o + fen attinenti ad una pop di rif per produrre info o stat (descr riassuntive di carattere quant del coll di interesse). Approcci: esplorativo (nn si conosce il fen o nn si vogliono usare i dati disponibili) o confermativo (falsifica la realt per smentire o confermare le info disponibili). Metodo di an: uni, bi o multivariato. Fasi: Progettazione: tutti gli aspetti, da quelli riguardanti il fen a quelli operativi. Doc di progettazione: pianificazione degli aspetti concettuali ed op dell'ind; contiene ob, concetti adottati, confronti praticabili tra i dati dell'ind e quelli di altre fonti, classif (standard usati e riconducibilit ad altri standard), xiodicit dell'an, liste e archivi per identificare la pop, campionamento in base alle liste, strumenti di raccolta dei dati; nn pu essere modificato; possibile rilevare gli err per considerarli in fase di riprogettazione. Def del probl: ob globale + parziali (contestualizzazione del fen); info disponibili e da ricercare (dove e come cercarle); tempo e spazio dell'ind piano op preliminare; schema prel di rel (info da produrre) e piano di campionamento prel; preparazione del quest ed addestramento degli intervistatori; ind pilota, rev del piano op e def del piano di campionamento e del quest definitivi, sel del camp e dei X (cosa studiamo e su chi). Raccolta dati: ril; raccolta dati grezzi utili per raggiungere gli ob; classif in base a complex del fen, coll di rif, natura dei dati racc; cod (rev qual e quant), interpretazione (significativit e rilevanza), def delle tab, elaborazione dei risultati; la scelta del metodo di acquisizione dipende dagli scopi, dall'ampiezza del coll, dal budget, dal costo della raccolta, dal di precisione; la via pi diretta l'osservazione, domandare la via obbligata per esplorare motivazioni, aspettative, credenze, sentimenti, percezioni ed atteggiamenti. Analisi secondaria: carenze di risorse, tempi stretti o probl nella raccolta; si usano dati gi raccolti da altri, eventualmente studiandoli da punti di vista diversi; bisogna fare attenzione al processo di pdz delle info realizzato da terzi; necessario acquisire i metadati. Framing: permette di org e strutturare i dati grezzi; cod in modo da procedere ad una migliore registrazione attraverso l'assegnazione di un cod numerico ad ogni x osservata e ad ogni R rilevata. Editing: permette di trasferire i dati su supporti idonei all'an e di procedere alla verifica log-formale (coerenza interna ed esterna) ed alla correzione di err; le procedure automatiche di ril consentono una contemporaneit tra le fasi di raccolta, editing e validazione. Elaborazione dei dati: metodologia stat adeguata (coerente con la natura del fen e gli ob dell'ind). Microdati: dati elementari ril. Macrodati: dati derivati aggregati ottenuti classif e sintetizzando i micro; facile interpretazione, evidenziano le car di interesse. Metadati: dove, quando, come e da chi sono stati ottenuti i dati; qual o quant; aspetti del processo di pdz dei dati; rendono i dati correttamente fruibili da chiunque, anche a distanza di tempo. Validazione dei risultati: coerenza con il probl. An dei dati: dipende dalla natura e dalla complex del fen e dal liv di dettaglio che si vuole raggiungere; il tipo di studio deve essere chiaro fin dalla predisposizione del disegno di ricerca. Interpretazione: dopo l'ind il ricercatore torna alla teoria iniziale tramite un proc di induzione, confrontando i risultati ottenuti con la def iniziale del probl per arrivare ad una conferma o ad una riformulazione; per usare correttamente i risultati, dopo aver circoscritto l'ambito operativo ed aver delineato i vincoli entro cui l'ind assume validit, bisogna considerare le hp su cui si fonda la metodologia, l'ambito spazio-temporale in cui la ricerca condotta e la validit futura dei risultati. Catena del valore: dato, info, conoscenza. Report di ricerca: presentazione dei risultati; proc di interpretazione delle an stat condotte nelle fasi precedenti. Piano di comunicazione: rel finale. Ogni fase caratterizzata da un controllo della qual e si collega a quelle precedenti e successive; proc circolare che xmette di tornare al punto di partenza per riprogettare l'an se il bisogno info nn soddisfatto. Decisioni operative: sovrintendono all'org pratica; stabilite prima dell'inizio dell'ind; componente statica o dinamica, confronto dei risultati con info relative ad altre realt; disegno esplorativo o sperimentale, descr o inf, trasversale o longitudinale, prospettico o retrospettivo. Errori: var (distr in maniera casuale e con x nulla in ogni ripetizione dell'ind), campionari, extra campionari (op necessarie all'ind), di copertura (liste nn complete o nn rappresentative di tutta la pop; focalizzate su alcuni ceti o fasce d'et; ridef la pop o integra il camp). Distorsioni: risultato di fattori sistematici, costanti in tutte le ripetizioni, con segno specifico rispetto al val reale; dipendono dalla correttezza della f di sintesi dei dati. Autoselezione del camp: le car socio-dem di chi partecipa sono diverse da quelle di chi si sottrae; l'err tanto + evidente quanto + tali car sono correlate all'ogg dell'an; riponderazione. Qualit dei dati: accuratezza dell'ind (progettazione, tecniche, mis del fen; legata al passaggio dei dati su un supporto adeguato all'elaborazione; gli err di rilevazione e trattamento al crescere della numerosit del camp), precisione (dimensione del camp; assoluta nelle ind censuarie), attendibilit (accuratezza + precisione; significativit, idoneit e rispondenza delle info alle necessit degli utilizzatori finali; alcune var sono + attendibili se rilevate su camp). Rilevazioni: tot: conoscenza esatta del fen. Parziali: stima. Dirette: strumenti ad hoc per l'ind. Indirette: dati raccolti per scopi da quelli dell'ind (esame di documenti o sopralluoghi). I due metodi possono coesistere se si mantengono i criteri di rappresentativit ed omogeneit rispetto al probl. Autocompilate: quest postale: il rispondente riceve il quest lo compila e lo riconsegna; bassi c di realizzazione, org e si pu utilizzare un > # di strumenti di supporto. costosa, necessita di un'org capillare sul territorio, richiede tempi lunghi per la raccolta dei dati ed sogg a > rischi di condizionamento. Tecniche assistite da computer: le Computer Assisted Survey Information Collection permettono di eseguire alcuni controlli di qualit direttamente all'immissione dei dati, di gestire in maniera semplice quest articolati e di predisporre formulazioni alternative delle D. Accorciano i tempi di completamento ma serve fornire l'hw agli intervistatori ed addestrarli in maniera mirata. Quest: strumento usato per raccogliere le info sul fen; i dati raccolti sono confrontabili; specchio degli ob della ricerca, consente la comunicazione fra ricercatore, rilevatore e rispondente. un'intervista strutturata composta da un insieme di D standardizzare cui imposta una struttura log, def in modo che l'intervistato sia in di fornire R rilevanti e consistenti. Progettazione: patrimonio di conoscenze tecniche, sforzo costante di an e ver empirica. Struttura, org delle D e formulazione di D e R dipendono dagli scopi dell'ind e dalla tecnica di somministrazione. Bisogna capire se la D utile, se misura il concetto di interesse e se i rispondenti sono in di fornire le R necessarie. Il questionario buono se suscita la R dell'intervistato, uno strumento naturale rispetto al tema trattato (invarianza allo stimolo), una misura valida del concetto di interesse e fornisce info accurate; rileva fatti (possesso di car, situazioni, avvenimenti), conoscenze (info su un arg), opinioni, atteggiamenti e motivazioni (info che spiegano il comportamento). La difficolt di reperire info aumenta passando dai fatti alle motivazioni. Organizzazione: sezioni che identificano specifici gruppi di rispondenti o arg; la sequenza delle D pu aiutare a fornire le info desiderate ma l'ordine pu nn essere neutro, in quanto si possono verificare condizionamenti nn voluti. Successione a imbuto: si passa dalle D generali a quelle particolari per dare il tempo di focalizzare l'attenzione sul probl; aiuta la memoria e la raccolta di opinioni nn meditate. Successione a imbuto rovesciato: opinioni meditate su un det arg. Successione ottimale: i quesiti che implicano uno sforzo di memoria vanno collocati a met quest per evitare che all'inizio il rispondente nn sia disponibile e alla fine sia troppo stanco; i quesiti su temi delicati vanno collocati alla fine per sfruttare la > confidenza e disponibilit e per nn rischiare che un rifiuto a rispondere possa compromettere l'acquisizione delle info collocate nella parte finale. Formalizzazione della struttura: a monte del modello di rilevazione necessario predisporre un modello concettuale, costituito dall'insieme di strutture di rappresentazione atte a cogliere gli aspetti del fen. Modello entit/relazione: prima si puntualizza l'entit, l'insieme degli ogg del particolare settore che si vuole esplorare, e poi si stabiliscono le rel, intese come collegamenti log che intercorrono tra le entit. Una volta definiti gli attributi che caratterizzano le entit e i legami gerarchici che sussistono tra le stesse si traccia uno schema concettuale traducibile in una rappresentazione ad albero delle varie sez in cui suddiviso il quest. In questo modo, possibile evidenziare eventuali sottoinsiemi sui quali approfondire l'an e passare da un'entit all'altra. Tipologie di domande: R libera: nn prevedono alcuna modalit di R e lasciano al sog libert di esprimersi nella forma che preferisce; rischio di influenzare le R, difficolt nel cod e sintetizzare le info; utili per questioni delicate o nn ben conosciute. Permettono di acquisire > info ma facilitano la dispersione dei dati ed il verificarsi di err di misura; hanno lo stesso significato per tutti, permettono una cod a posteriori (sulla base delle info raccolte), elevato livello di arbitrariet, forte criticit nelle R, difficolt elevate con i grandi #. R codificata: alternative fisse definite dal ricercatore, nn sovrapposte, tra le quali l'intervistato chiamato a scegliere; stimolano an e riflessione, facilitano il ricordo e permettono una cod immediata delle info; escludono alternative nn previste dal ricercatore; limitano dispersioni ed err, riducono le info acquisite; stesso quadro di riferimento, utilizzabili anche con grandi # ma influenzano le R in chi nn ha opinioni e le alternative offerte nn hanno lo stesso significato per tutti. D a scala: richiedono di esprimere una preferenza o assegnare un punteggio scegliendo tra un certo # di x ord. D gerarchizzate: ordinamento o classificazione di una serie di x secondo una scala di preferenza o di importanza. D a r esclusiva: unica x di R. D a r multipla: + x. d filtro: guidano attraverso sez diverse del quest, strutture diversificate e complesse. d di controllo: usate per verificare la veridicit di alcune R. batterie di d: D formulate allo stesso modo e presentate in un unico blocco che permettono di considerare insieme diversi aspetti facendo risparmiare spazio nel quest e tempo nell'intervista, facilitano la comprensione del meccanismo di R migliorandone la validit; consentono la costruzione di indici sintetici che riassumono le diverse D della batteria in unico punteggio. alternative ordinate: si pu distinguere tra R semanticamente autonome (ogni R ha un suo significato compiuto, nn necessario conoscere il significato di tutte le alternative, garantito solo l'ord delle x ma nn nota la distanza tra loro, l'intervistato sceglie una categoria per il suo contenuto, a prescindere dalla posizione nei confronti delle altre) e R a parziale autonomia semantica (il significato di ogni cat solo parzialmente autonomo e nn si pu affermare che le diverse x di R sono fra loro equidistanti, bisogna decidere se offrire o - un'opz centrale o l'opz nn so e quante cat di R definire). Preparazione e formulazione dei quesiti: i risultati della ricerca possono essere influenzati dalla successione delle D, dalle x di R, dal ritmo con cui viene condotta l'intervista o dalla personalit dell'intervistatore. Ogni D sollecita nell'intervistato una R stimolo ed necessario che i quesiti siano formulati in modo da produrre uno stimolo uguale in sogg simili in modo da avere omogeneit nei risultati e confrontabilit delle R. question phrasing: si evita costruendo quesiti brevi e nn appesantiti da inutili precisazioni. Question wording: si evita usando un vocabolario che consenta la comunicazione; termini semplici, nn ambigui e comprensibili dai rispondenti. Identificazione delle parole corrette: bisogna comprendere gli ob ed i contenuti della ricerca e seguire alcune regole per la formulazione dei quest: usare termini comuni e con significato preciso; evitare D doppie, sigle o acronimi, doppie negazioni, parole offensive o straniere, frasi ipotetiche, D con troppe alternative o categoriche (avverbi come mai o sempre); lim l'uso delle R di tipo nn so e tenere presente che le posizioni neutrali possono accomunare atteggiamenti differenti. Fare attenzione alle D condizionanti (su arg come onest, giustizia, dovere, morale... all'intervistato pu essere suggerita indirettamente l'esistenza di una R socialmente accettabile) e alle D sui temi sensibili (gli intervistati tendono ad eludere i quesiti riguardanti temi come la sessualit, il Y o il patrimonio personale). Diagramma di flusso: rappresentazione graf espressa attraverso una serie di fig piane di varia forma, collegate fra loro da archi. Le fig indicano diversi tipi di azioni o decisioni (gli ovali sono usati per inizio e fine del quest, i rombi per le D filtro, i rettangoli per le D o le sez) mentre gli archi indicano i flussi di info. Il flow chart usato per org le aree omogenee del quest indicando le sez che si succedono, collocare le D nella giusta successione e distinguere le D filtro. Testare il quest: adeguatezza come strumento di misura del fen. Verificare se risponde alle esigenze conoscitive, facilmente comprensibile da parte degli intervistati ed facile da gest per l'intervistatore. Il controllo pu avvenire tramite revisione di esperti, pretest sul campo della versione provvisoria del quest, test di alternative del quest su camp di sogg o ind pilota su tutti gli aspetti costitutivi dell'ind, compreso il quest. Fonti di err nei dati: i principali tipi di err o distorsioni nelle R sono: motivazionali (il rispondente nn suff motivato ad assumere il ruolo di informatore e tende a dare R incomplete o nn accurate), sociali (il rispondente fornisce R al fine di dare anche inconsapevolmente una certa immagine di s), di memoria, di comunicazione (il rispondente nn comprende la D o la tematica dell'ogg di ind, il rilevatore nn comprende la R o spiega male la D) e strutturali (il quest troppo lungo/breve, le cat di R sono inadeguate, l'ordine delle D nn corretto...). Attendibilit delle r: va valutata anche in f di possibili fattori di distorsione. desiderabilit sociale delle R: pu condurre a self-deception (autoinganno) o impression management (gest dell'impressione); la valutazione socialmente condivisa che in una certa cultura viene data ad un atteggiamento o comportamento individuale; in questi casi, c' il rischio di raccogliere R fortemente distorte. Acquiescenza: tendenza a rispondere sempre con lo stesso punteggio o con la stessa x dando un giudizio per lo pi positivo al fine di compiacere l'intervistatore o ottenere approvazione. mancanza di opinioni: (nn attitudes) pu spingere gli intervistati a rispondere a caso (opinioni volatili) o a rifugiarsi in R neutrali, soprattutto quando il quest crea una pressione a rispondere. Per evitare condizionamenti nel rispondente su temi delicati che inducono desiderabilit sociale nelle R possibile ricorrere a D indirette (cosa pensa di chi fa uso di droghe?), all'autocompilazione o a D casualizzate. Categorie di incompletezza: se nessuna var ogg di interesse misurata si ha una unit nonresponse; se l'unit selezionata risponde solo ad alcune D o se la R giudicata incorretta o cancellata in fase di editing si ha una item nonresponse. La nn R parziale si ha quando un'unit rispondente fornisce un'info incompleta; alle non R parziali possono essere associati anche i valori nn ammissibili e le incongruenze logiche tra R a D diverse, che si manifestano sotto forma di contraddizioni rispetto a rel sostanziali (implicite nella realt esaminata) o rel formali (costruite insieme al quest) tra i val assunti dalle var relative. Riduzione del di precisione delle stime ottenute, causata da una < ampiezza del camp rispetto a quella prevista inizialmente. Ind campionarie: Marx (condizioni di vita dei lettori della Rvue Socialiste); Weber (problemi sociali); Neyman (rappresentativit ed accuratezza delle indagini campionarie). Universo stat: per comprendere correttamente il fen, deve essere def nei contenuti, nello spazio e nel tempo. Pop: insieme di unit stat ogg di ril con car comuni. Def una pop significa individuare le car interessanti per la ricerca, delimitando il campo di azione ed eliminando le car non utili. Pop teorica: target, insieme di tutti i casi che costituiscono la pop ogg di ind. pop campionaria: pop accessibile; insieme di tutti i casi appartenenti alla pop teorica effettivamente raggiungibili. Ind censuarie: considerano tutta la pop; costose e difficili da eseguire. Impossibilit di esaminare ogni unit della pop: risorse (ec, personale e tempo) limitate, difficolt di conoscere e raggiungere l'intera pop da studiare. La ril campionaria consente di studiare le caratteristiche di una porzione della pop garantendo vantaggi in termini di tempo e c: un camp opportunamente scelto permette di produrre risultati accurati garantendo un risparmio di risorse che possono essere impiegate per migliorare la qualit dell'analisi ed andare in profondit nella ricerca delle info. L'ind campionaria fornisce una stima (val approssimato sogg ad err). Camp: insieme di n unit stat selezionate tra le N della pop per rappresentarla rispetto ai caratteri ogg di studio. casuale: probabilistico; estratto da una pop in cui tutte le unit hanno prob non nulla di essere estratte. rappresentativo: presenta, senza distorsioni, tutte le car della pop da studiare ed estratto in modo casuale; nn dipende dalla grandezza del camp anche se in genere un camp grande associato ad un < errore delle stime. eterogeneo: include car e qualit diverse. accurato: min gli err di copertura ed il tasso di mancate risposte basso. ampio: include un # elevato di casi; l'ampiezza inversamente proporzionale agli err di rilevazione. Validit del campione: affinch i risultati di un'ind campionaria siano gen bisogna verificare se le conclusioni sono corrette per gli individui che compongono il camp e se il camp rappresenta bene la pop da cui stato estratto. interna: misura quanto i risultati di uno studio sono corretti per il camp di individui studiati (condizione necessaria ma non suff perch lo studio sia utile); esterna: di generalizzabilit delle conclusioni tratte da uno studio campionario; di verit dell'assunto secondo cui gli individui studiati con il camp sono uguali a quelli dell'intera pop che nn rientrano nella ril campionaria. Campionamento: procedimento attraverso il quale si estrae da un insieme di unit un # finito di casi che siano rappresentativi di tutta la pop e scelti con criteri tali da consentire la gen all'intera pop dei risultati ottenuti studiando il campione. Disegno di campionamento: insieme delle decisioni prese per formare un camp; deve tener conto delle regole per identificare le unit da inserire nel camp, della struttura del camp e della numerosit campionaria. Le unit selezionate si sottopongono ad oss per ottenere info sulle car della pop e per analizzare le rel che possono aiutare ad interpretare atteggiamenti o comportamenti dell'insieme ogg di studio. sel delle unit: determinante per rispettare il criterio della casualit; la sel pu avvenire con reimmissione (o bernoulliana; un'unit pu essere estratta + volte, con una prob di estrazione sempre costante), senza reimmissione (ogni unit scelta una sola volta e la prob di estrazione delle unit varia ad ogni fase di estrazione; una particolare selezione senza reimmissione quella in blocco) o sistematica (si mettono in sequenza le unit e se ne seleziona una ogni k, con passo di campionamento costante, a partire da una scelta casualmente. Il passo di campionamento si determina sulla base del rapporto k=N/n; la posizione dell'unit r da cui partire 1rk e si includono nel camp le n unit che si trovano nelle posizioni r; r+k;r+2k;...r+(n-1)k. La prob di includere un'unit nel camp cost e pari al val reciproco del passo di campionamento). Struttura del camp: le unit di una pop sono elencate in una o + liste dalle quali si effettua l'estrazione casuale; si parla di camp semplice quando una pop deriva da un'unica lista, si parla di camp complesso quando vi sono + liste strutturate secondo strati, gerarchie o altro. Numerosit del camp: dipende dai tempi e dai c dell'ind e dalla precisione delle stime che si vuole ottenere; + grande il camp + le stime sono precise e diminuisce l'err. Selezione casuale delle unit: una sequenza di # casuali una sequenza di # che sembrano impredicibili ma nn sono correlati tra loro e si distribuiscono uniformemente (ovvero con la stessa prob). Per la procedura di selezione si possono usare tavole dei # casuali o algoritmi di generazione di # pseudo-casuali. Per generare # pseudo-casuali si stabilisce un valore iniziale (seme) e si generano gli altri valori a partire da questo. Se ad ogni unit della pop si associa un # e si procede all'estrazione casuale dei # si compone un campione casuale. Campionamento casuale semplice: schema di rif della stat: i camp sel con tale disegno possono essere confrontati con quelli ottenuti da altri disegni complessi per valutarne la bont. Si possono usare tutti i tipi di estrazione, anche se i + usati sono quelli senza ripetizione e quello sistematico. Spesso il punto di partenza per la costruzione di camp che seguono schemi complessi. Nella realt, uno schema di campionamento raramente applicato perch risulta pesante sia relativamente ai c di ril dei dati che all'org della ril stessa e nn utilizza info a priori sulla pop o sulle car distributive delle var. stratificazione: ripartire il coll in sottopop, dette strati, il + possibile omogenee rispetto alla var ogg di studio, utilizzando una var ad essa correlata (ad es, per stimare il Y si pu considerare la prof). Si estrae un camp da ogni strato mediante uno schema di campionamento casuale semplice, si calcola la m di ogni strato e si stima la m attraverso la m ponderata delle m campionarie, con peso pari alla numerosit di ogni strato. Permette di evidenziare insiemi di unit significative per la ricerca, di separare sottopop con car speciali e di utilizzare info note, mantenendo la casualit dell'estrazione. Campionamento strat: individuare sottopop omogenee rispetto alla var da ril comporta stime + eff di quelle che si possono ottenere con un camp casuale semplice di pari numerosit. Se la pop P suddivisa in H strati, ogni strato Ph una sottopop e quindi Uh=1H Ph=P. Il camp Ch estratto dallo strato H idoneo a rappresentarlo e Uh=1H Ch=C rappresenta l'intera pop P. Le car per la strat devono essere note prima della sel ed ogni unit stat deve appartenere ad un solo strato. Campionamento strat prop: riproduce nel camp la stessa composizione prop degli strati individuati nella pop; la numerosit dei singoli strati si ottiene moltiplicando la dimensione campionaria n per la fr rel (il peso) del singolo strato. Campionamento strat nn prop: si usa quando si decide si sovrarappresentare alcuni strati (quelli - numerosi) e di sottorappresentarne altri. Il camp non riproduce la composizione della pop e nelle an andr effettuata una riponderazione. Camp strat ottimale: l'ampiezza degli strati del camp prop alla variabilit S dello strato: la frazione di campionamento sar pi elevata negli strati in cui la variabilit >. Quando la numerosit campionaria di uno strato supera quella della pop si includono tutte le unit dello strato e si assegnano le unit residue agli altri strati. Considerazioni: nn esistono criteri assoluti o oggettivi per la scelta del # di strati o delle var di strat ma solo indicazioni di max. Le var di strat devono essere correlate con la var ogg di studio e tra loro ind; l'eff delle stime aumenta con il # di strati, anche se dopo un certo # di suddivisioni il beneficio modesto. Quando il campionamento su base territoriale auspicabile avere un # elevato di strati per controllare la dispersione delle unit e rendere + agevole il L sul campo. Campionamento a grappoli: nei cluster, la pop suddivisa in modo naturale o artificiale in insiemi di unit legati da vincoli di contiguit spaziale o di altra natura (le famiglie per un'indagine sugli individui o le classi per un'indagine sugli alunni). Le unit elementari nn sono scelte direttamente ma sono estratti alcuni grappoli e tutte le unit del grappolo entrano a far parte del campione. Viene scelto quando manca la disponibilit della lista delle unit elementari o per opportunit di tipo organizzativo/territoriale; in genere + facile individuare i gruppi rispetto ai singoli. Campionamento su + strati: possibile ricorrere a tale metodologia di sel quando il coll di rif strutturato gerarchicamente, ossia quando la pop di unit finali contenuta in un insieme di unit di livello sup. Si usa quando nn disponibile una lista complessiva delle unit della pop (le anagrafi dei comuni italiani nn sono centralizzate in un'unica banca dati). Si ricorre a questo tipo di campionamento per necessit in quanto le stime con esso ottenute sono di solito - eff (a causa della > variabilit campionaria) di quelle calcolate applicando un camp casuale semplice. Nei diversi stadi possibile ricorrere a schemi di campionamento differenti. Disegno complesso: disegno campionario usato nelle indagini multiscopo dell'Istat differenziato per comuni autorappresentativi, nei quali le unit statistiche vengono selezionate a grappolo, e comuni nn autorappresentativi, nei quali la selezione avviene su due stadi (comuni e famiglie). I comuni vengono stratificati in base a 105 domini di stima, ottenuti dalle regioni e dalle 6 tipologie di comune per ampiezza demografica; ogni comune estrae in modo casuale le famiglie da intervistare. Campionamento nn probabilistico: la prob di essere incluso nel campione nn nota; la conoscenza dell'universo nn necessaria; la differenza con il campionamento probabilistico rappresentata dalla sel nn casuale dei camp in quanto il campionamento nn probabilistico nn fornisce a ciascuna unit della pop la stessa occasione di essere parte del camp. Il campionamento nn probabilistico nn consente l'inf e quindi i risultati sono estendibili solo al campione. Un campione selezionato con questi criteri ha il vantaggio della rapidit ma fornisce dati poco affidabili e pu essere facilmente viziato da errori sistematici (campionamento a casaccio). per quota: ha la stessa logica del campionamento strat, ma le quote all'interno di ciascuno strato sono sel dai ricercatori con criteri nn probabilistici. Si ottiene definendo un dato # di sogg da campionare secondo certe var, o in base ad una quota fissa o mantenendo una certa prop tra pop e camp. Rispetto ad uno schema casuale presenta < c e tempi di ril; se la ril effettuata in maniera rigorosa comparabile ad un camp stat. Facilita le distorsioni rispetto alle abitudini degli individui componenti la pop, necessita di un rigoroso controllo sull'attivit degli intervistatori e richiede attenzione nn solo alle quote definite rispetto alle distr mg ma anche a quelle congiunte. a scelta ragionata: scelta delle aree di analisi o delle unit campionarie in f della peculiarit del fen da studiare e della sua presenza ritenuta dal ricercatore fortemente concentrata in tali aree o su tali unit. Viene usato in fen che potenzialmente possono manifestarsi su un'ampia pop ma che in pratica si concentrano su alcune aree per cui la scelta delle unit nn casuale. Spesso viene bilanciato, ossia si considerano una serie di var di controllo per le quali sono note le sintesi, ad es le m nella pop, e si cerca di individuare un camp nel quale le var di controllo hanno m uguale o molto approssimata a quella corrispondente nella pop. conveniente scegliere le unit del camp in sequenza, includendo quelle che permettono di raggiungere il bilanciamento richiesto. a valanga: usato se la pop cost da sogg che tendono ad occultare la loro identit o sono di difficile reperibilit. Consiste nel sel i casi utilizzando le reti relazionali (sociali, culturali, politiche) di un gruppo di persone inizialmente contattate. telefonico/sistema cati: si usa nelle inchieste telefoniche ed gestito dal sw cati che seleziona i sogg da intervistare direttamente dagli elenchi telefonici. di convenienza o disponibilit: si usa quando i sogg da intervistare sono irraggiungibili e ci si basa unicamente su gruppi volontari. Camp di esperti: cost da sogg particolarmente informati su certi arg (opinion leader o testimoni privilegiati).

Simboli:

X = carattere; x = modalit

N = popolazione

n = frequenza assoluta; f = frequenza relativa; F = frequenza relativa cumulata

= ampiezza della classe; x =media aritmetica; xg=media geometrica; Mo = moda; Me = mediana

Sxa = scostamento semplice medio; SMe = scostamento semplice mediano; 2 = varianza; = scarto quadratico medio; CV = coefficiente di variazione;

59

32

27

14Le x sono le manif del X; devono essere esaustive e non sovrapposte.

Le unit stat sono rappresentate sull'asse delle asc; le x oss su quella delle ord.

Sequenze di oss quant rilevate a scadenze regolari; successione ord di # reali che misura l'evoluzione temporale.

Se le classi nn sono equiampie nn si considerano le fr ma la densit di fr.

Una bassa var.t nei gruppi rispetto ad un'elevata var.t tra gruppi xmette di separare le unit e ottenere info migliori.

x degli scarti dalla x della distr al quadrato.

Pu essere letto come mediamente gli scostamenti dal val medio del X sono pari al ...% di quest'ultimo.

un # indice, ovvero un rapp che permette di confrontare le intensit di un fen in situazioni .

Conto del Y e della spesa, utilizzazione del reddito.

Conto delle risorse e degli impieghi (eguaglianza fra pdz, offerta e D globale).

Gli I sono una componente della D xch rappresentano un'immissione nel circuito del Y; il S una dispersione.

Gli indipendenti assenti sono considerati occupati se mantengono l'att.

Positiva se l'indice > 100.

Essenza delle cose nella loro caratteristica di essere cose che esistono.

Conoscenza scientifica e dei metodi per raggiungerla.

Rapporto tra metodo e tecnica.

Val caratteristici assunti dall'intera pop (distribuzione) o rel fra le var di interesse (parametri).

Qual il suo livello di istruzione?

Con riferimento ai seguenti aspetti del suo lavoro, quanto si ritiene soddisfatto? Per niente, poco, abbastanza...

Documents

3_Statistica - Appunti