16
UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA Curso de Introdução ao Stata – Aula 1 Professor Ernesto Friedrich de Lima Amaral Email: [email protected] Site do curso: www.ernestoamaral.com Antes do Stata Uma forma fácil de converter bancos de dados de um programa para outro é com o Stat Transfer. É possível converter bancos que estão em outros formatos para o Stata e vice-versa: – Por isso, é possível utilizar o Excel para organizar bancos de dados secundários, já que este é um programa mais acessível. O Excel permite manipular bancos que tenham no máximo 1.048.576 observações (linhas) por 16.384 variáveis (colunas). Após a organização dos dados, o Stat Transfer pode ser utilizado para transferir os dados para o Stata, permitindo fazer análises estatísticas mais sofisticadas. – No caso de dados primários (coletados com questionários próprios), é possível utilizar o Data Entry para realizar formulários de entrada dos dados. Após a digitalização dos questionários, é feita a transferência do banco para o Stata. – Neste curso, será utilizado um banco de dados proveniente do SPSS. Dados, questionários e documentação técnica Os bancos de dados, questionários e documentação técnica deste curso estão disponíveis no site do Consórcio de Informações Sociais (CIS) do Núcleo de Apoio à Pesquisa sobre Democratização e Desenvolvimento da Universidade de São Paulo (NADD-USP) e da Associação Nacional de Pós- Graduação e Pesquisa em Ciências Sociais (ANPOCS): http://www.nadd.prp.usp.br/cis/index.aspx 1

Stata10

Embed Size (px)

DESCRIPTION

Uma introdução ao stata.

Citation preview

UNIVERSIDADE FEDERAL DE MINAS GERAISFACULDADE DE FILOSOFIA E CINCIAS HUMANASDEPARTAMENTO DE CINCIA POLTICACurso de Introduo o Stt ! Au" #Pro$essorErnesto Friedrich de Lima AmaralEmail: [email protected] do curso: www.ernestoamaral.comAntes do SttUma forma fcil de converter bancos de dados de um programa para outrocom o Stat !ransfer." poss#vel converter bancos $ue est%o em outros formatos para o Stata e vice&versa:' (or isso)poss#vel utili*ar o E+cel para organi*ar bancos de dados secundrios) , $ue este umprograma mais acess#vel. -E+cel permite manipular bancos $ue tenhamno m+imo../01.234 observa56es 7linhas8 por .4.910 variveis 7colunas8. Ap:s a organi*a5%o dos dados) oStat !ransfer pode ser utili*ado para transferir os dados para o Stata) permitindo fa*er anlisesestat#sticas mais sofisticadas.' ;o caso de dados primrios 7coletados com $uestionrios pr:prios8)poss#velutili*ar o ncia do banco para o Stata.' ;este curso) ser utili*ado um banco de dados proveniente do S(SS.Ddos% &uest'on(r'os e do)u*ento t+)n')-s bancos de dados) $uestionrios e documenta5%o tcnica deste curso est%o dispon#veis no sitedo ?ons:rcio de @nforma56es Sociais 7?@S8 do ;Acleo de Apoio B (es$uisa sobre pode primeiramente mudar para o diret:rio c:OcursoufpeOdados:cd c:\curso\dados pode abrir o banco sem digitara e+tens%o:use pes,0021.Se algum outro banco , estiver aberto)preciso utili*ar a op5%o KclearK para limpar a mem:ria doStata:use c:\curso\dados\pes,0021..dta, clear(ara salvar um banco pela primeira ve*) utili*a&se:save c:\curso\dados\ar!uivo.dtaSe o ar$uivo , e+istir) e voc> $uiser gravar o banco por cima do anterior:save c:\curso\dados\ar!uivo.dta, replace-use,a) umbancosalvosomentecomocomandoKsaveK) tornandodif#cil perderosdadosoriginais. Gesmo se o comando KsaveK n%o for usado intencionalmente) o Stata recusar gravar obanco por cima do original) se a op5%o KreplaceK n%o for colocada.Utili*e o comando PsaveoldQ para salvar na vers%o anterior do Stata 7vers6es 1 e T8 para $ue n%oha,a problemas $uando for usar o Stat !ransfer ou a vers%o antiga do Stata:saveold c:\curso\dados\ar!uivo.dtaRe,ortndo ddos 2(s')osAntes de tudo)importante saber alguns sinais no Stata:UU igualVU diferenteW maiorWU maiorDigualX menorXU menorDigualY EZ -U(ara mostrar o sumrio do banco de dados) com nome) tipo e r:tulo das variveis:descri7eedescri7e v050, v0*0* v0+01)v0+11(ara mostrar o sumrio mais detalhado das variveis do banco:code7oo8 v050, v0*0* v0+01-utra forma de mostrar informa56es sobre as variveis do banco) com ilustra5%o de $uantidade denAmeros negativos) positivos e em branco 7KmissingsK8) alm de um pe$ueno grfico de ramos efolhas 7com distribui5%o da varivel entre os seus valores8)com o comando KinspectK:inspect v050, v0*0* v0+01(ara contar $uantas mulheres 7v/9/FU08 est%o entre .2 e 0T anos de idade 7v1//28:count if v050,99* : 3v800;91 : v800ncia 7Knofre$K8) colocar a porcentagem nacoluna 7KcolK8 eDou colocar a porcentagem na linha 7KrowK8:ta7 v*805 v0*0*, nofre! col(ara gerar tabelas simples para cada uma das variveis listadas:ta71 v*805 v0*0*(ara gerar tabelas com cru*amentos entre duas variveis para todas combina56es poss#veis entregrupos de anos de estudo 7v01918) cor ou ra5a 7v/0/08 e se+o 7v/9/F8:ta7, v*858 v0*0* v050,, nofre! col1(ara obter a mdia) desvio padr%o e fre$\>ncia de anos de estudo 7v01/98 para cada corDra5a7v/0/08:ta7 v0*0*, summari(e3v*8054Mn',u"o de ddos-comandoKtostringK transformaumavarivel numricaemnominal. @ssos:funcionaseavarivel n%o tiver r:tulo 7label8:tostring v010,, generate3strcontrole4Eerificando o $ue foi feito:7ro=se v010, strcontrole- comando KdestringK converte variveis nominais em numricas:destring strcontrole, generate3numcontrole4Eerificando o $ue foi feito:7ro=se v010, strcontrole numcontrole?om a op5%o KreplaceK os comandos KtostringK e KdestringK salvam a nova varivel sobre a varivel, e+istente. " poss#vel reali*ar essas transforma56es para todas variveis do banco em um Anicocomando:destring, replace" poss#vel alocar as seguintes variveis para o come5o do banco:' Se+o 7v/9/F8' ?or ou ra5a 7v/0/08' Anos de estudo 7v01/98' Crupos de anos de estudo 7v01918' Lendimento mensal no trabalho principal 7v03.18' Lendimento mensal de todos trabalhos 7v03.T8' Lendimento mensal de todas fontes 7v03F/8order v050, v0*0* v*805 v*858 v*218)v*2,0Gover uma varivel para uma posi5%o anterior B segunda varivel indicada no comando:move v0*0* v050,?olocar em ordem alfabtica as variveis listadas e mov>&las para o come5o do banco:aorder v050, v0*0* v*805 v*858 v*218)v*2,0(ara colocar em ordem alfabtica todas variveis do banco:aorder(ara e+cluir uma varivel ou con,unto de variveis do banco) utili*e a op5%o KdropK. Foi escolhido oano de refer>ncia 7v/./.8) pois ele n%o varia no banco de dados:drop v0101;ote $ue s: e+clu#mos a varivel da c:pia do banco $ue est na mem:ria LAG) e n%o a $ue estoriginalmente no disco.T(ara remover observa56es do banco) utili*e o comando KdropK com indica5%o da primeira e Altimaobserva56es a serem retiradas. (or e+emplo) vamos remover as observa56es de 2 a ./:drop in &10Essa remo5%o pode tambm ser feita de outras formas. (or e+emplo) vamos remover as pessoas$ue n%o possuem declara5%o no rendimento mensal no trabalho principal7v03.1UTTT.TTT.TTT.TTT8:drop if v*21899666666666666oudrop if v*218;9666666666666;oStata) oKmissingK omaior nAmero) aocontrriodoSAS. (or isso) ocomandoKdropifv03.1WUTTTTTTTTTTTTK e+clui os valores de v03.1 iguais a KmissingK.!ambmposs#velutili*ar o comando KNeepK para indicar $uais variveis se dese,a manter nobanco. " poss#vel ainda escolher por manter determinadas categorias de variveis no banco como comando KNeepK:8eep if v*218