clear set mem 100m log using "C:\curso\Aula12.log", replace text ************************************** *CAPÍTULO 8 - HETEROSCEDASTICIDADE ************************************** *Instalando o módulo do teste de White *http://ideas.repec.org/c/boc/bocode/s390601.html *Melhor instalar manualmente no diretório "updates" *do "C:\curso\modulos\whitetst.ado" ************************************** *TÓPICO 8.2 - INFERÊNCIA ROBUSTA EM RELAÇÃO À HETEROSCEDASTICIDADE ************************************** ************************************** *EXEMPLO 8.1 - EQUAÇÃO DO LOG DOS SALÁRIOS *COM ERROS-PADRÃO ROBUSTOS *EM RELAÇÃO À HETEROSCEDASTICIDADE ************************************** use C:\curso\Ex08-01.dta, clear *Solteiros (oposto de casados) gen single=(~married) *Homens (oposto de mulheres) gen male=(~female) *Homens casados gen marrmale=male*married *Mulheres casadas gen marrfem=female*married *Mulheres solteiras gen singfem=single*female *Variável dependente: *Logaritmo do salário-hora (lwage) *Variáveis independentes: *Homens casados (marrmale), *Mulheres casadas (marrfem), *Mulheres solteiras (singfem), *Homens solteiros (grupo de referência), *Anos de educação formal (educ), *Anos de experiência no mercado de trabalho (exper), *Anos de experiência ao quadrado (expersq), *Anos com o empregador atual (tenure), *Anos com o empregador atual ao quadrado (tenursq) *Regressão com erro padrão original reg lwage marrmale marrfem singfem educ exper expersq tenure tenursq *Regressão com erro padrão robusto reg lwage marrmale marrfem singfem educ exper expersq tenure tenursq, robust ************************************** *EXEMPLO 8.2 - ESTATÍSTICA F ROBUSTA *EM RELAÇÃO À HETEROSCEDASTICIDADE ************************************** use C:\curso\Ex08-02.dta, clear *Variável dependente: *Nota média no curso superior de atletas universitários (cumgpa) *Variáveis independentes: *Nota obtida no exame de ingresso em curso superior (sat), *Percentil da classificação no ensino médio (hsperc), *Total de horas do curso superior (tothrs), *Mulheres (female), *Negros (black), *Brancos (white), *Hispânicos (grupo de referência) *Regressão com erro padrão original reg cumgpa sat hsperc tothrs female black white if term==2 *Teste-F original test black white *Regressão com erro padrão robusto reg cumgpa sat hsperc tothrs female black white if term==2, robust *Teste-F robusto test black white ************************************** *EXEMPLO 8.3 - ESTATÍSTICA LM ROBUSTA *EM RELAÇÃO À HETEROSCEDASTICIDADE ************************************** use C:\curso\Ex08-03.dta, clear *Variável dependente: *Número de vezes que determinado homem foi preso em 1986 (narr86) *Variáveis independentes: *Proporção de prisões anteriores a 1986 que levaram à condenação (pcnv), *Duração média da sentença cumprida por condenação prévia (avgsen), *Meses passados na prisão em 1986 (ptime86), *Número de trimestres durante o qual determinado homem ficou empregado em 1986 (qemp86), *Rendinmento em 1986 (inc86), *Negros (black), *Hispânicos (hispan), *Brancos (grupo de referência) *Duração média da sentença cumprida por condenação prévia ao quadrado gen avgsensq=avgsen*avgsen *Regressão com erro padrão robusto reg narr86 pcnv avgsen avgsensq ptime86 qemp86 inc86 black hispan, robust *Ponto crítico do efeito da sentença (avgsen) *sobre número de prisões em 1986 (narr86) di abs(_b[avgsen]/(2*_b[avgsensq])) di abs(0.0178411/(2*-0.0005163)) ************************************** *Estatística LM usual para testar sentença média (avgsen, avgsensq) ************************************** *1) Modelo restrito sobre número de prisões (narr86) reg narr86 pcnv ptime86 qemp86 inc86 black hispan *2) Salvando resíduo predict ubar2, resid *3) Modelo irrestrito sobre resíduo (ubar2) reg ubar2 pcnv ptime86 qemp86 inc86 black hispan avgsen avgsensq *4) Calculando estatística LM *Multiplicação entre número de observações (N) e *R-quadrado (r2) scalar lm1 = e(N)*e(r2) scalar list lm1 *LM manual di 2725 * 0.0013 *5) Salvando p-valor do teste de Qui-Quadrado do resultado acima scalar pval1 = chi2tail(2,lm1) scalar list pval1 *p-valor manual gen pval1 = chi2tail(2,3.4626014) sum pval1 *6) Mostrar estatística LM usual e p-valor display _n "LM statistic : " %6.3f lm1 /* > */ _n "Under H0, distrib Chi2(2), p-value: " %5.3f pval1 ************************************** *Estatística LM robusta para testar sentença média (avgsen, avgsensq) ************************************** *1) Modelo restrito sem sentença média reg narr86 pcnv ptime86 qemp86 inc86 black hispan *2) Salvando resíduo predict ubar1, resid *3) Regressão sobre sentença média (avgsen) reg avgsen pcnv ptime86 qemp86 inc86 black hispan *4) Salvando resíduo predict r1, r *5) Regressão sobre sentença média ao quadrado (avgsensq) reg avgsensq pcnv ptime86 qemp86 inc86 black hispan *6) Salvando resíduo predict r2, r *7) Resíduo original multiplicado por resíduo da sentença média gen ur1 = ubar1*r1 *8) Resíduo original multiplicado por resíduo da sentença média ao quadrado gen ur2 = ubar1*r2 *9) Criando variável constante gen iota = 1 *10) Regressão da variável constante sobre as interações dos resíduos reg iota ur1 ur2, noconstant *11) Calculando estatística LM *Diferença entre número de observações (N) e *soma dos quadrados dos resíduos (RSS) scalar lm2 = e(N)-e(rss) scalar list lm2 *LM manual di 2725 - 2721.00291 *12) Salvando p-valor do teste de Qui-Quadrado do resultado acima scalar pval2 = chi2tail(2,lm2) scalar list pval2 *p-valor manual gen pval2 = chi2tail(2,3.99709) sum pval2 *13) Mostrar estatística LM robusta e p-valor display _n "Robust LM statistic : " %6.3f lm2 /* > */ _n "Under H0, distrib Chi2(2), p-value: " %5.3f pval2 ************************************** *TÓPICO 8.3 - TESTE DE EXISTÊNCIA DE *HETEROSCEDASTICIDADE ************************************** ************************************** *EXEMPLO 8.4 & 8.5 - HETEROSCEDASTICIDADE *NAS EQUAÇÕES DE PREÇOS DE IMÓVEIS *TESTE DE WHITE ************************************** use C:\curso\Ex08-04.dta, clear *Variável dependente: *Preço do imóvel (price) *Variáveis indpendentes: *Tamanho do terreno (lotsize) *Área do terreno em pés quadrados (sqrft) *Quantidade de dormitórios (bdrms) *Regressão com variáveis originais reg price lotsize sqrft bdrms *Teste de White para heteroscedasticidade (whitetst) *Hipótese nula (H0): há homoscedasticidade no modelo whitetst, fitted *p-valor < 0,05 *A probabilidade da hipótese nula ser verdadeira é muito pequena. *Obtemos forte evidência contra hipótese nula de homoscedasticidade. *Podemos rejeitar hipótese nula de homoscedasticidade. *Ou seja, temos forte evidência de heteroscedasticidade. *Vamos tentar obter modelo homoscedástico. *Regressão com log do preço do imóvel (lprice), *Log do tamanho do terreno (llotsize), *Log da área do terreno em pés quadrados (lsqrft), *Quantidade de dormitórios (bdrms) reg lprice llotsize lsqrft bdrms *Teste de White para heteroscedasticidade (whitetst) *Hipótese nula (H0): há homoscedasticidade no modelo whitetst, fitted *p-valor > 0,05 *A probabilidade da hipótese nula ser verdadeira é muito grande. *Obtemos forte evidência a favor da hipótese nula de homoscedasticidade. *Não podemos rejeitar hipótese nula de homoscedasticidade. *Ou seja, não temos forte evidência de heteroscedasticidade. ************************************** *TÓPICO 8.4 - ESTIMAÇÃO DE MÍNIMOS *QUADRADOS PONDERADOS (MQP) ************************************** ************************************** *HETEROSCEDASTICIDADE TEM FORMA CONHECIDA *HETEROSCEDASTICIDADE COMO CONSTANTE MULTIPLICATIVA ************************************** ************************************** *EXEMPLO 8.6 - EQUAÇÃO DE POUPANÇA FAMILIAR ************************************** use C:\curso\Ex08-06.dta, clear *Variável dependente: *Poupança (sav) *Variável independente: *Renda (inc) *Regressão da poupança (sav) sobre renda (inc) reg sav inc *Especificamos função de ponderação (1/h) *que é proporcional ao inverso da variância. *A idéia é colocar menos peso nas observações *com uma variância de erro mais alta. *Esse procedimento corrige estimativas dos betas (aweight) reg sav inc [aw = 1/inc] *Se considerarmos que a heteroscedasticidade *seria um problema para os erros-padrão, *deveríamos computar também os erros-padrão robustos (pweight) reg sav inc [pw = 1/inc] *Incluindo variáveis demográficas: *Tamanho da família (size), *Anos de escolaridade do chefe da família (educ), *Idade do chefe da família (age), *Variável binária indicando se o chefe da família é negro (black) *Nova regressão reg sav inc size educ age black *Corrigindo estimativas dos betas (aweight) - MQP reg sav inc size educ age black [aw = 1/inc] *Corrigindo estimativas dos betas e erros-padrão (pweight) - MQP reg sav inc size educ age black [pw = 1/inc] ************************************** *HETEROSCEDASTICIDADE NÃO TEM FORMA CONHECIDA *PROCEDIMENTO DE MÍNIMOS QUADRADOS GENERALIZADOS (MQG) FACTÍVEL, *PARA CORRIGIR HETEROSCEDASTICIDADE ************************************** ************************************** *EXEMPLO 8.7 - DEMANDA DE CIGARROS ************************************** use C:\curso\Ex08-07.dta, clear *Variável dependente: *Consumo diário de cigarros (cigs) *Variáveis Independentes: *Logaritmo da renda anual (lincome), *Logaritmo do preço por maço de cigarros em centavos de dólar (lcigpric), *Anos de escolaridade formal (educ), *Idade medida em anos (age), *Idade ao quadrado (agesq), *Variável binária indicando se pessoa reside em Estado com restrições de fumar em restaurantes (restaurn) *Regressão reg cigs lincome lcigpric educ age agesq restaurn *Os efeitos não são grandes na prática. *Se renda aumenta em 10%, "cigs" aumenta em: display _b[lincome]*10/100 *Hábito de fumar está relacionado com idade de modo quadrático. *Hábito aumenta com idade e depois diminui com a idade: display abs(_b[age]/(2*_b[agesq])) *Teste de White para heteroscedasticidade (whitetst) *Hipótese nula (H0): há homoscedasticidade no modelo whitetst, fitted *p-valor < 0,05 *A probabilidade da hipótese nula ser verdadeira é muito pequena. *Obtemos forte evidência contra hipótese nula de homoscedasticidade. *Podemos rejeitar hipótese nula de homoscedasticidade. *Ou seja, temos forte evidência de heteroscedasticidade. *Procedimento para estimar Mínimos Quadrados Ponderados (MQP) reg cigs lincome lcigpric educ age agesq restaurn *Salvando resíduo predict ub, residual *Elevando o resíduo ao quadrado e calculando o logaritmo gen lubar=log(ub*ub) *Estimando a regressão do log do resíduo ao quadrado como dependente reg lubar lincome lcigpric educ age agesq restaurn *Salvando o valor predito predict cigsh, xb *Calculando o exponencial do valor predito gen cigse = exp(cigsh) *Nova regressão utilizará o inverso da variável acima como peso *Corrigindo estimativas dos betas (aweight) reg cigs lincome lcigpric educ age agesq restaurn [aw=1/cigse] *Corrigindo estimativas dos betas e erros-padrão (pweight) - MQP reg cigs lincome lcigpric educ age agesq restaurn [pw=1/cigse] *Teste de White whitetst, fitted ************************************** *TÓPICO 8.5 - MODELO DE PROBABILIDADE LINEAR REVISITADO ************************************** ************************************** *EXEMPLO 8.8 - PARTICIPAÇÃO DE MULHERES CASADAS NA FORÇA DE TRABALHO ************************************** use C:\curso\Ex08-08.dta, clear *Variável dependente: *Variável binária indicando participação na força de trabalho *de uma mulher casada (inlf). *Ou seja, se mulher informou ter trabalhado com remuneração *fora de casa em algum período do ano, "inlf" é igual a 1 *Variáveis independentes: *Outras fontes de renda em milhares de dólares (nwifeinc), *Anos de estudo (educ), *Experiência anterior no mercado de trabalho (exper), *Experiência ao quadrado (expersq), *Idade (age), *Número de filhos menores de seis anos (kidslt6), *Número de filhos entre 6 e 18 anos (kidsge6) *Erros-padrão habituais reg inlf nwifeinc educ exper expersq age kidslt6 kidsge6 *Erros-padrão robustos reg inlf nwifeinc educ exper expersq age kidslt6 kidsge6, robust *As diferenças entre os erros-padrão habituais e robustos são muito pequenas. *Embora a heteroscedasticidade seja um problema na teoria, *ela não é na prática, pelo menos neste exemplo. ************************************** *ESTIMANDO O MODELO DE PROBABILIDADE LINEAR POR MÍNIMOS QUADRADOS PONDERADOS ************************************** ************************************** *EXEMPLO 8.9 - DETERMINANTES DA PROPRIEDADE DE COMPUTADORES PESSOAIS ************************************** use C:\curso\Ex08-09.dta, clear *Variável dependente: *Variável binária indicando se aluno possui computador (PC) *Variáveis independentes: *Nota média do ensino médio (hsGPA), *Nota do teste de avaliação de conhecimentos para ingresso em curso superior (ACT), *Variável binária indicando se pelo menos um dos pais tem curso superior (parcoll) *Criando indicador se pelo menos um dos pais tem curso superior (parcoll), *usando informações da mãe (mothcoll) e do pai (fathcoll) gen parcoll = (mothcoll | fathcoll) *Regressão estimada por MQO com erros-padrão robustos reg PC hsGPA ACT parcoll, robust *Regressão estimada por MQO com erros-padrão habituais reg PC hsGPA ACT parcoll *Salvando valor predito predict phat *Construindo as variâncias das probabilidades: y*(1-y) gen h=phat*(1-phat) *Utilizando inverso da variância como peso *Corrigindo as estimativas dos betas (aweight) - MQP reg PC hsGPA ACT parcoll [aw=1/h] *Corrigindo as estimativas dos betas e os erros-padrão (pweight) - MQP reg PC hsGPA ACT parcoll [pw=1/h] *Não existem diferenças importantes nas estimativas MQO e MQP. log close