*Limpando a memória clear *Indicando tamanho da memória set mem 100m *Abrindo o arquivo de log log using "C:\curso\Aula17.log", replace text *Instalando o módulo do Multiplicador de Lagrange *http://www.fss.uu.nl/soc/iscore/stata/testomit.ado *http://www.fss.uu.nl/soc/iscore/stata/testomit.hlp *http://www.stata.com/stb/stb53/dm75/ do "C:\curso\testomit.ado" do "C:\curso\enumopt.ado" *Instalando o módulo do teste de Qui-quadrado *http://www.stata.com/quest/quest/t/tablesq.ado do "C:\curso\tablesq.ado" *Instalando o módulo do F-test do "C:\curso\ftest.ado" ************************************ *PNAD 2007 - MINAS GERAIS ************************************ use "C:\curso\pes2007MG.dta", clear ************************************ *RENDIMENTO ************************************ gen renpri=. replace renpri=v9532 if v9532!=999999999999 *Criando logaritmo de rendimento gen lnrenpri=ln(renpri) ************************************ *SEXO ************************************ gen mulher=. replace mulher=0 if v0302==2 replace mulher=1 if v0302==4 ************************************ *IDADE DO MORADOR ************************************ gen idpia=. replace idpia=v8005 if v8005>=15 & v8005<=64 ************************************ *ANOS DE ESTUDO ************************************ gen anest=. replace anest=v4803-1 if v4803!=17 ************************************ *PESO DA PESSOA ************************************ sum v4729, d ************************************ *LIMPANDO O BANCO DE DADOS ************************************ keep if lnrenpri!=. & mulher!=. & idpia!=. & anest!=. tab mulher, missing tab idpia, missing tab anest, missing ************************************ *MULTIPLICADOR DE LAGRANGE - MANUAL ************************************ *Regrida y sobre o conjunto restrito *de variáveis independentes e salve os resíduos (u) reg lnrenpri mulher [pweight=v4729] predict renpred, xb gen res = lnrenpri - renpred *Regrida u sobre todas variáveis independentes *(regressão auxiliar) e obtenha R2 reg res mulher idpia anest [pweight=v4729] *R2 igual a 0,3242 *n igual a 15.682 *Calcule LM = nR2 (tamanho amostral vezes R-quadrado) di 15682*0.3242 *Obtenha o p-valor referente a LM, *em distribuição de qui-quadrado, *para testar se H0 deve ser rejeitada ou não tablesq X 1 5084.1044 ************************************ *MULTIPLICADOR DE LAGRANGE - AUTOMÁTICO ************************************ *Modelo restrito reg lnrenpri mulher [pweight=v4729] predict restrito, score *Multiplicador de Lagrange com "testomit" testomit (mean: idpia anest), score(restrito) *Resultado indica que probabilidade da *hipótese nula de "idpia" ser verdadeira *é muito baixa (menor que 0,05). *O mesmo ocorre para "anest". *O teste simultâneo indica que adicionando *as duas variáveis no modelo, *o ajuste seria mais satisfatório. *Modelo irrestrito reg lnrenpri mulher idpia anest [pweight=v4729] ************************************ *MUDANÇA DA UNIDADE DA VARIÁVEL DEPENDENTE ************************************ *Ao invés de analisar as mudanças em reais, *analisaremos as mudanças em múltiplos de 100 reais gen ren100 = renpri / 100 *Modelo com reais reg renpri mulher idpia anest [pweight=v4729] *Modelo com reais dividido por 100 reg ren100 mulher idpia anest [pweight=v4729] *Coeficientes, erros padrões, *intervalo de confiança e erro padrão do resíduo *são 100 vezes menores *R-quadrado é o mesmo ************************************ *MUDANÇA DA UNIDADE DA VARIÁVEL INDEPENDENTE ************************************ *Vamos analisar o impacto de 5 em 5 anos de idade gen id5 = idpia / 5 *Modelo com idpia reg renpri mulher idpia anest [pweight=v4729] *Modelo com id5 reg renpri mulher id5 anest [pweight=v4729] *Coeficiente e erro padrão de idade *são 5 vezes maiores *As demais estimativas são as mesmas ************************************ *COEFICIENTES PADRONIZADOS ************************************ *Modelo irrestrito reg lnrenpri mulher idpia anest [pweight=v4729] *Modelo irrestrito com betas padronizados reg lnrenpri mulher idpia anest [pweight=v4729], beta *Os coeficientes padronizados são também chamados *de coeficientes beta. *Se x1 aumentar em um desvio-padrão, *então o y predito será alterado em b1 desvios-padrão. *Os efeitos não estão sendo medidos em termos *das unidades originais de y ou de xj, *mas em unidades de desvios-padrão. *A dimensão das variáveis independentes *passa a ser irrelevante, colocando-as em igualdade. *Quando cada xj é padronizado, *a comparação das magnitudes dos coeficientes *(significância econômica) é mais convincente. *Ou seja, a variável com maior coeficiente *é a "mais importante". *No nosso exemplo, a significância econômica de *"mulher" e "idpia" têm magnitudes (absolutas) próximas. *A significância econômica de "anest" é a maior dentre elas. ************************************ *USO DE FORMAS FUNCIONAIS LOGARÍTMICAS ************************************ *Modelo irrestrito reg lnrenpri mulher idpia anest [pweight=v4729] *Quando x aumenta em 1, *y aumenta em 100*[exp(beta)-1], *mantendo outros fatores fixos. *Por exemplo, beta de "mulher": di 100*(exp(-0.5338501)-1) *Como impacto de "mulher" é alto, não podemos simplesmente utilizar 100*beta: di 100*-0.5338501 *No entanto, podemos utilizar 100*beta, *quando temos pequenas mudanças percentuais. *Este é o caso de "idpia": di 100*(exp(0.0222158)-1) di 100*0.0222158 ************************************ *MODELOS COM FUNÇÕES QUADRÁTICAS ************************************ *Criando quadrado de idade gen idquad = idpia * idpia *Nova regressão reg lnrenpri mulher anest idpia idquad [pweight=v4729] *Se "idpia" é negativo e "idquad" é positivo, *função tem formato U. *Se "idpia" é positivo e "idquad" é negativo, *função tem formato parabólico. *Vamos calcular nosso ponto crítico: *ponto crítico = x* = |ß1/(2ß2)| di abs(0.0888679/(2*-0.0008829)) *Nosso resultado indica que idade tem impacto positivo *sobre renda até a idade de 50 anos. *Após este ponto, idade tem impacto negativo sobre renda. *Isso está de acordo com mercado de trabalho brasileiro. *Mostrando função quadrática no gráfico *Salvando backup das variáveis gen anest2=anest gen mulher2=mulher *Substituindo anos de estudo por média da população sum anest drop anest gen anest=8.129894 *Colocando variável mulher constante em "1" drop mulher gen mulher=1 *Salvando valor predito: média de anos de estudo; mulher *Única variação é na idade predict renpred2, xb *Gráfico de dispersão entre valor predito e idade twoway (scatter renpred2 idpia) *Retornando os valores originais de anos de estudo drop anest gen anest=anest2 *Retornando os valores originais de mulher drop mulher gen mulher=mulher2 ************************************ *MODELOS COM TERMOS DE INTERAÇÃO ************************************ *Criando interação de idade com anos de estudo gen idest = idpia * anest *Nova regressão reg lnrenpri mulher idpia anest idest [pweight=v4729] *Efeito parcial de "anest" sobre renda é: *"anest" + "idest" * idade *Por exemplo, para a idade de 15 anos, *o efeito de anos de estudo é: di 0.0497953 + (0.0015784 * 15) ************************************ *MODELOS COM TERMOS DE INTERAÇÃO, UTILIZANDO MÉDIAS ************************************ *Interpretação de "anest" sozinho não é correta, *porque não temos idade igual a zero. *Então, vamos reparametrizar o modelo, *construindo novo termo interativo... *Novo termo para idade: sum idpia egen idmed = mean(idpia) tab idmed gen idpiamed = idpia - idmed *Novo termo para anos de estudo: sum anest egen anmed = mean(anest) tab anmed gen anestmed = anest - anmed *Novo termo interativo: gen idestmed = idpiamed * anestmed *Nova regressão reg lnrenpri mulher idpia anest idestmed [pweight=v4729] *Efeito parcial de "anest" sobre renda é: *"anest" + "idestmed" * (idade - idade média) *Ou seja, "idestmed" será nulo, *quando utilizarmos idade média *Por isso, o efeito parcial de "anest" sobre renda *indica que o aumento de 1 ano de estudo *aumenta em 10,6% a renda do indivíduo, *considerando uma pessoa de idade média (36 anos) ************************************ *COMPARAÇÃO DE MODELOS ANINHADOS ************************************ *F-test, R2 ajustado e Multiplicador de Lagrange *permitem testar ajustes de modelos aninhados *F-test e R2 ajustado só são possíveis *com modelos sem "pweight" *Modelo restrito reg lnrenpri mulher estimates store modelo1 *Modelo irrestrito reg lnrenpri mulher idpia anest estimates store modelo2 *F-TEST ftest modelo1 modelo2 *R2 AJUSTADO do modelo 1: 0,0501 *R2 AJUSTADO do modelo 2: 0,3647 *MULTIPLICADOR DE LAGRANGE reg lnrenpri mulher [pweight=v4729] predict lagrange, score testomit (mean: idpia anest), score(lagrange) ************************************ *COMPARAÇÃO DE MODELOS NÃO-ANINHADOS ************************************ *R2 ajustado permite testar ajustes *de modelos não-aninhados *Modelo com idade reg lnrenpri mulher idpia *Modelo com anos de estudo reg lnrenpri mulher anest *R2 ajustado de modelo com idade: 0,0848 *R2 ajustado de modelo com anos de estudo: 0,2672 ************************************ *COMPARAÇÃO DE MODELOS COM FORMAS FUNCIONAIS *DIFERENTES NA VARIÁVEL INDEPENDENTE ************************************ *Somente variável idade reg lnrenpri mulher idpia anest *Variável idade e idade ao quadrado reg lnrenpri mulher idpia idquad anest *R2 ajustado de modelo com idade: 0,3647 *R2 ajustado de modelo com idade ao quadrado: 0,3893 ************************************ *COMPARAÇÃO DE MODELOS COM FORMAS FUNCIONAIS *DIFERENTES NA VARIÁVEL DEPENDENTE ************************************ *Obtenha os valores estimados de log(yi) da regressão reg lnrenpri mulher idpia anest predict ypred1, xb *Para cada observação i, crie exp[log(yi)] gen ypredexp=exp(ypred1) *Faça a regressão de "renpri" sobre a variável "ypredexp", *sem um intercepto (regressão simples passando pela origem) reg renpri ypredexp, nocons *O único coeficiente que existe na regressão acima *é a estimativa de alfa zero. *Obtenha a previsão de renda gen yfinal = 1.460293 * ypredexp *Obter a correlação amostral entre y estimado (yfinal) *e o verdadeiro y na amostra (renpri) corr yfinal renpri *O quadrado dessa correlação amostral *pode ser comparado ao R2 do modelo *em que "renpri" é variável dependente *R2 do modelo com "lnrenpri": 0,2475 di 0.4975^2 *R2 do modelo com "renpri": 0,1883 reg renpri mulher idpia anest ************************************ *INTERVALO DE CONFIANÇA DE PREVISÕES *LEVA EM CONSIDERAÇÃO SOMENTE VARIÂNCIA DE y ************************************ *Qual o intervalo de confiança de 95% da média do salário *entre todos indivíduos com as seguintes características: *mulher=1 *idpia=30 *anest=8 reg lnrenpri mulher idpia anest display _b[_cons]+_b[mulher]*1+_b[idpia]*30+_b[anest]*8 *Obtendo o intervalo de confiança gen mulher0 = mulher-1 gen idpia0 = idpia-30 gen anest0 = anest-8 *Intervalo de confiança é de 5,8233 a 5,8588 reg lnrenpri mulher0 idpia0 anest0 ************************************ *INTERVALO DE CONFIANÇA DE PREVISÕES (OUTRA FORMA, MESMO RESULTADO) *LEVA EM CONSIDERAÇÃO SOMENTE VARIÂNCIA DE y ************************************ *Qual o intervalo de confiança de 95% da média do salário *entre todos indivíduos com as seguintes características: *mulher=1 *idpia=30 *anest=8 *Criando nova observação set obs 15683 replace mulher=1 in 15683/15683 replace idpia=30 in 15683/15683 replace anest=8 in 15683/15683 *Regressão reg lnrenpri mulher idpia anest *Salvando erro padrão predict lnrenpriEP in 15683/15683, stdp tab lnrenpriEP *Salvando valor predito predict lnrenpriVP in 15683/15683, xb tab lnrenpriVP *Gerando valor mínimo do intervalo de confiança de 95% gen min = lnrenpriVP - 1.96 *lnrenpriEP in 15683/15683 *Gerando valor máximo do intervalo de confiança de 95% gen max = lnrenpriVP + 1.96 *lnrenpriEP in 15683/15683 *Intervalo de confiança é de 5,8233 a 5,8588 list lnrenpriEP min lnrenpriVP max in 15683/15683 ************************************ *INTERVALO DE CONFIANÇA DE SALÁRIOS MÉDIOS FUTUROS *LEVA EM CONSIDERAÇÃO VARIÂNCIAS DE y E DE u ************************************ *Qual o intervalo de confiança de 95% do salário *de qualquer indivíduo que especificamente *tenha essas características: *mulher=1 *idpia=30 *anest=8 *Como vimos: *Variância de y = (0.009053^2) = 0.00008196 *Variância de u = MS Residual = 0.461380909 = (Root MSE)^2 reg lnrenpri mulher0 idpia0 anest0 *Ou seja, salário médio futuro deve levar em consideração este erro padrão di (0.461380909 + (0.009053^2))^(1/2) *Vamos operacionalizar isto no Stata *Criando nova observação set obs 15684 replace mulher=1 in 15684/15684 replace idpia=30 in 15684/15684 replace anest=8 in 15684/15684 *Regressão reg lnrenpri mulher idpia anest *Salvando erro padrão futuro predict lnrenpriEPF in 15684/15684, stdf tab lnrenpriEPF *Salvando valor predito predict lnrenpriVP1 in 15684/15684, xb tab lnrenpriVP1 *Gerando valor mínimo do intervalo de confiança de 95% gen min1 = lnrenpriVP1 - 1.96 *lnrenpriEPF in 15684/15684 *Gerando valor máximo do intervalo de confiança de 95% gen max1 = lnrenpriVP1 + 1.96 *lnrenpriEPF in 15684/15684 *Intervalo de confiança é de 4,5096 a 7,1725 list lnrenpriEPF min1 lnrenpriVP1 max1 in 15684/15684 *Intervalo de confiança é grande (R$90,89 a R$1.303,14) *Com base nesta regressão, não podemos definir com clareza *o salário futuro de um determinado indivíduo di exp(4.509638) di exp(7.172535) ************************************ *SALVANDO O LOG ************************************ log close