*Limpando a memória clear *Indicando tamanho da memória set mem 100m *Não interromper tabelas longas set more off *Colocar vírgulas e pontos no padrão brasileiro set dp comma *Abrindo o arquivo de log log using "C:\curso\Aula25-26.log", replace text ************************************ *PNAD 2007 - MINAS GERAIS ************************************ use "C:\curso\pes2007MG.dta", clear ************************************ *RENDIMENTO ************************************ *Rendimento mensal em dinheiro que recebia normalmente, *no mês de referência, *no trabalho principal da semana de referência sum v9532, detail *OLHAR DICIONÁRIO DE DADOS!!! *Recodificando rendimento gen renpri=. replace renpri=v9532 if v9532!=999999999999 sum renpri, d hist renpri *Criando logaritmo de rendimento gen lnrenpri=ln(renpri) hist lnrenpri ************************************ *SEXO FEMININO ************************************ gen mulher=. replace mulher=0 if v0302==2 replace mulher=1 if v0302==4 tab mulher v0302, missing ************************************ *SEXO MASCULINO ************************************ *Categoria zero igual a 1 *e as demais iguais a zero gen homem=!mulher tab homem mulher, missing *Isso é o mesmo que... gen homem2=~mulher tab homem2 mulher, missing ************************************ *IDADE DO MORADOR ************************************ sum v8005, d *OLHAR DICIONÁRIO DE DADOS!!! *Recodificando idade do morador gen idpia=. replace idpia=v8005 if v8005>=15 & v8005<=64 sum idpia, d ************************************ *ANOS DE ESTUDO ************************************ sum v4803, d *OLHAR DICIONÁRIO DE DADOS!!! *Recodificando anos de estudo gen anest=. replace anest=v4803-1 if v4803!=17 tab v4803 anest, missing ************************************ *RAÇA NEGRA ************************************ gen negra=. replace negra=0 if v0404==2 replace negra=1 if v0404==4 | v0404==8 tab v0404 negra, missing ************************************ *RAÇA BRANCA ************************************ gen branca=~negra tab branca negra, missing ************************************ *RÓTULOS DAS VARIÁVEIS ************************************ label variable renpri "Rendimento no trabalho principal" label variable lnrenpri "Log do rendimento no trabalho principal" label variable mulher "Sexo feminino" label variable homem "Sexo masculino" label variable idpia "Idade na população em idade ativa" label variable anest "Anos de estudo" label variable negra "Raça negra" label variable branca "Raça branca" ************************************ *RÓTULOS DAS CATEGORIAS DAS VARIÁVEIS ************************************ label define simnao 0 "Não" 1 "Sim" label values mulher homem negra branca simnao tab1 mulher homem negra branca ************************************ *LIMPANDO O BANCO DE DADOS ************************************ *Tamanho do banco count *Apagando observações keep if renpri!=. & lnrenpri!=. & /// mulher!=. & homem!=. & /// idpia!=. & anest!=. & /// negra!=. & branca!=. *Tamanho do banco, após exclusão dos "missings" count ************************************ *PESO DA PESSOA ************************************ sum v4729, d ************************************ *ESTATÍSTICAS DESCRITIVAS ************************************ ************************************ *USO DE PESOS NAS TABELAS ************************************ *Tabulação sem peso tab mulher tab mulher, nolabel *Tabulação com peso populacional tab mulher [fweight=v4729] *Tabulação com peso populacional *Não aconselhável tab mulher [iweight=v4729] *Tabulação com peso amostral tab mulher [aweight=v4729] *Tentativa de tabulação com peso amostral *ERRO!!! tab mulher [pweight=v4729] ************************************ *VARIÁVEL DEPENDENTE (renpri & lnrenpri) ************************************ *Histograma hist renpri [fweight=v4729], frequency graph export "C:\curso\hist_renpri.wmf", replace hist lnrenpri [fweight=v4729], frequency graph export "C:\curso\hist_lnrenpri.wmf", replace *Estatísticas descritivas de variável contínua sum renpri [fweight=v4729], d tabstat renpri [fweight=v4729], s(mean sd) sum lnrenpri [fweight=v4729], d tabstat lnrenpri [fweight=v4729], s(mean sd) ************************************ *TABELAS DE FREQUÊNCIA DAS *VARIÁVEIS INDEPENDENTES ************************************ tab1 anest idpia mulher negra [fweight=v4729] ************************************ *MÉDIA DA VARIÁVEL DEPENDENTE *POR VALORES DAS VARIÁVEIS INDEPENDENTES ************************************ *Sexo tab mulher [fweight=v4729], sum(renpri) mean ttest renpri, by(mulher) *Idade tab idpia [fweight=v4729], sum(renpri) mean *Educação tab anest [fweight=v4729], sum(renpri) mean *Raça tab negra [fweight=v4729], sum(renpri) mean ************************************ *USO DE PESOS NAS REGRESSÕES ************************************ *Observações na regressão tab v0101 *População na regressão tab v0101 [fweight=v4729] *Regressão linear múltipla reg lnrenpri mulher idpia anest negra *Regressão linear mútlipla com peso populacional *ERRO!!! reg lnrenpri mulher idpia anest negra [fweight=v4729] *Regressão linear múltipla com peso amostral reg lnrenpri mulher idpia anest negra [pweight=v4729] ************************************ *MODELO SEM CONSTANTE ************************************ *Se B0 for diferente de zero na população, *a regressão através da origem gera *estimadores dos parâmetros de inclinação (Bk) viesados. *Se B0 for igual a zero na população, *a regressão com intercepto gera *maiores variâncias dos estimadores de inclinação. *Menores valores são: Homem(0); Idade(15); Anos de estudo(0); Branca(0) reg lnrenpri mulher idpia anest negra [pweight=v4729], nocons ************************************ *INSTALAR MÓDULO "OUTREG2" ************************************ do "C:\curso\modulos\outreg2.ado" ************************************ *REGRESSÃO DE MÍNIMOS QUADRADOS ORDINÁRIOS ************************************ reg lnrenpri mulher [pweight=v4729] outreg2 using "C:\curso\modelosMQO.doc", replace reg lnrenpri mulher idpia [pweight=v4729] outreg2 using "C:\curso\modelosMQO.doc", append reg lnrenpri mulher idpia anest [pweight=v4729] outreg2 using "C:\curso\modelosMQO.doc", append reg lnrenpri mulher idpia anest negra [pweight=v4729] outreg2 using "C:\curso\modelosMQO.doc", append ************************************ *TESTE F PARA VERIFICAR POSSÍVEL *EXCLUSÃO CONJUNTA DE VARIÁVEIS ************************************ reg lnrenpri mulher idpia anest negra [pweight=v4729] test idpia anest ************************************ *VARIANCE INFLATION FACTOR (VIF) ************************************ *É um fator que estima o aumento da variância, *devido à multicolinearidade na regressão de MQO. *Colinearidade aumenta a variância dos betas, ou seja, *diminui significância estatística (t-teste menor). *VIF > 5 indica multicolinearidade *VIF > 10 indica colinearidade que tende à perfeita *Modelo com multicolinearidade reg lnrenpri mulher idpia anest negra [pweight=v4729] estat vif *Sabemos que variância é o erro padrão ao quadrado, então *VIF de 1,00 de "idpia" significa que o erro padrão do *coeficiente desta variável é 1,00 vez maior (raiz de 1,00) *do que se esta variável não fosse correlacionada com *outras variáveis independentes. ******************* *GRÁFICOS DE RESÍDUOS ******************* reg lnrenpri mulher idpia anest negra [pweight=v4729] *Salvando renda predita predict lnrenpre gen renpre=exp(lnrenpre) *Salvando resíduo predict reslnren, res *Diagramas de dispersão scatter reslnren lnrenpri, yline(0) scatter reslnren renpri, yline(0) scatter reslnren lnrenpre, yline(0) scatter reslnren renpre, yline(0) scatter reslnren mulher, yline(0) scatter reslnren idpia, yline(0) scatter reslnren anest, yline(0) scatter reslnren negra, yline(0) ******************* *GRÁFICOS DE VALORES PREDITOS ******************* *Regressão reg lnrenpri mulher idpia anest negra [pweight=v4729] *Salvando backup das variáveis gen idpia2 = idpia *Manter constante a idade pelo valor médio sum idpia drop idpia egen idpia = mean(idpia2) tab idpia *Salvando renda predita para mulheres negras (média de idade) predict lnrenpremn if mulher==1 & negra==1 gen renpremn = exp(lnrenpremn) *Salvando renda predita para mulheres brancas (média de idade) predict lnrenpremb if mulher==1 & negra==0 gen renpremb = exp(lnrenpremb) *Salvando renda predita para homens negros (média de idade) predict lnrenprehn if mulher==0 & negra==1 gen renprehn = exp(lnrenprehn) *Salvando renda predita para homens brancos (média de idade) predict lnrenprehb if mulher==0 & negra==0 gen renprehb = exp(lnrenprehb) *Gráfico de renda predita por educação, sexo e raça (média de idade) *Log da renda twoway (line lnrenpremn anest) (line lnrenpremb anest) /// (line lnrenprehn anest) (line lnrenprehb anest) *Renda em reais twoway (scatter renpremn anest) (scatter renpremb anest) /// (scatter renprehn anest) (scatter renprehb anest) *Retornando os valores originais de idade drop idpia gen idpia = idpia2 ************************************ *SALVANDO O LOG ************************************ log close