*Limpando memória clear *Tamanho da memória set mem 200m *Site do banco de dados *Dados do Estudo Eleitoral Brasileiro (2006) *Consórcio de Informações Sociais (CIS) *http://www.nadd.prp.usp.br/cis/index.aspx *Abrindo banco de dados use "C:\DCP859B4\eseb2006.dta", clear *Verificando voto no primeiro turno (q95) tab q95 tab q95, nolabel *Limpando variável de primeiro turno gen prit=. replace prit=q95 if q95>=1 & q95<=3 tab q95 prit, missing tab prit *Votou no Lula no primeiro turno gen lu1t=0 replace lu1t=1 if q95==1 tab q95 lu1t, missing *Votou no Alckmin no primeiro turno gen al1t=0 replace al1t=1 if q95==2 tab q95 al1t, missing *Votou na Heloísa Helena no primeiro turno gen he1t=0 replace he1t=1 if q95==3 tab q95 he1t, missing *Verificando voto no segundo turno (q100) tab q100 tab q100, nolabel *Limpando variável de segundo turno gen segt=. replace segt=q100 if q100>=1 & q100<=2 tab q100 segt, missing tab segt *Votou no Lula no segundo turno gen lu2t=0 replace lu2t=1 if q100==1 tab q100 lu2t, missing *Votou no Alckmin no segundo turno gen al2t=0 replace al2t=1 if q100==2 tab q100 al2t, missing *Criando variáveis dependentes *Transferência de Heloísa para Lula gen helu=0 replace helu=1 if he1t==1 & lu2t==1 sort lu2t by lu2t: tab helu he1t, missing *Transferência de Alckmin para Lula gen allu=0 replace allu=1 if al1t==1 & lu2t==1 sort lu2t by lu2t: tab allu al1t, missing *Lula no primeiro e segundo turno gen lulu=0 replace lulu=1 if lu1t==1 & lu2t==1 sort lulu by lulu: tab lu1t lu2t, missing *Criando variável única de transferência gen trans=. replace trans=1 if helu==1 replace trans=2 if allu==1 tab trans, missing *Criando variável do primeiro modelo *Transferência de Heloísa Helena para Lula gen mod1=0 replace mod1=1 if helu==1 *Cristóvan(4), Bivar(5), Branco(9), N-lembra(55), N-resp(99) replace mod1=. if q95==4 | q95==5 | q95==9 | q95==55 | q95==99 tab mod1 *Criando variável do segundo modelo *Transferência de Alckmin para Lula gen mod2=0 replace mod2=1 if allu==1 *Cristóvan(4), Bivar(5), Branco(9), N-lembra(55), N-resp(99) replace mod2=. if q95==4 | q95==5 | q95==9 | q95==55 | q95==99 tab mod2 *Qual o partido que melhor representa *a maneira como o Sr. pensa? (q53) tab q53, missing tab q53, missing nolabel gen pt=0 replace pt=1 if q53==13 tab q53 pt, missing *Em quais desses partidos o Sr *não votaria de jeito nenhum? *PT(q128) tab q128, missing tab q128, missing nolabel *PV(q132) tab q132, missing tab q132, missing nolabel *Não votaria no PTPV gen rejptpv=0 replace rejptpv=1 if q128==0 | q132==0 *Como o Sr acompanhou a campanha eleitoral? (q91) tab q91, missing tab q91, missing nolabel *Criando dicotômica para acompanhou campanha gen acomp=0 replace acomp=1 if q91==1 | q91==2 tab q91 acomp, missing *Novamente pensando em esquerda e direita na política. *Como o senhor se considera? (q89) tab q89, missing tab q89, missing nolabel gen esq=0 replace esq=1 if 0<=q89<=3 *Em que o Sr. votou no primeiro turno da eleição *presidencial de 2002...? (q141) tab q141, missing tab q141, missing nolabel gen lula02=0 replace lula02=1 if q141==1 *Qual assunto o Sr. considera que foi o *mais importante nesta eleição? (q43) tab q43, missing tab q43, missing nolabel *Dicotômica para corrupção gen corrup=0 replace corrup=1 if q43==2 *Idade (q9) tab q9, missing gen idade=q9 *Sexo (q8) gen homem=0 replace homem=1 if q8==1 *Instrução (q11) gen instrucao=q11 *Salvando banco de dados saveold "C:\DCP859B4\eseb2006aula05.dta", replace ********************* *Pré-Modelo 1 (Heloisa Helena para Lula) ********************* *Cálculo manual tab mod1 pt, nofreq row di (9.09/90.91)/(17.63/82.37) *Logistica logistic mod1 pt ********************* *Modelo 1 (Heloisa Helena para Lula) ********************* *COMPARANDO MODELOS RESTRITO E IRRESTRITO *Logística - coeficientes - modelo restrito logit mod1 pt rejptpv corrup acomp idade homem *Log(Lr)=-104.22632 *gl(r)=6 *Logística - coeficientes - modelo irrestrito logit mod1 pt rejptpv lula02 corrup acomp idade homem instrucao *Log(Li)=-97.225495 *gl(r)=8 *Diferença no Log(L) di 2*(-97.225495-(-104.22632)) *Diferença nos graus de liberdade di 8-6 *Teste de qui-quadrado cd C:\DCP854B\modulos tablesq X 2 14.00165 *COMPARANDO LOGIT, LOGISTIC E PROBIT *Logit - coeficientes logit mod1 pt rejptpv lula02 corrup acomp idade homem instrucao *Logistic - razão de chances logistic mod1 pt rejptpv lula02 corrup acomp idade homem instrucao *Probit - coeficientes probit mod1 pt rejptpv lula02 corrup acomp idade homem instrucao *COMPARANDO VALORES PREDITOS DE MQO, LOGIT E PROBIT *MQO reg mod1 idade predict mod1mqo *Logit - coeficientes logit mod1 idade predict mod1logit *Probit - coeficientes probit mod1 idade predict mod1probit *Probit - efeitos marginais dprobit mod1 idade predict mod1dprobit *Diagrama de dispersão twoway (scatter mod1mqo idade) (scatter mod1logit idade) (scatter mod1probit idade) (scatter mod1dprobit idade) ********************* *Modelo 2 (Alckmin para Lula) ********************* *Logística - coeficientes logit mod2 pt esq rejptpv lula02 corrup acomp idade homem instrucao *Logística - razões de chance logistic mod2 pt esq rejptpv lula02 corrup acomp idade homem instrucao *Probit - coeficientes probit mod2 pt esq rejptpv lula02 corrup acomp idade homem instrucao *Probit - efeitos marginais dprobit mod2 pt esq rejptpv lula02 corrup acomp idade homem instrucao *dprobit fits maximum-likelihood probit models *and is an alternative to probit. *Rather than reporting the coefficients, *dprobit reports the marginal effect, that is, *the change in the probability for an *infinitesimal change in each independent, *continuous variable *and, by default, reports the discrete change *in the probability for dummy variables. *probit may be typed without arguments after *dprobit estimation to see the model in *coefficient form. ************************************ *VARIANCE INFLATION FACTOR (VIF) ************************************ *É um fator que estima o aumento da variância, *devido à multicolinearidade na regressão de MQO. *Colinearidade aumenta a variância dos betas, ou seja, *diminui significância estatística (t-teste menor). *VIF > 5 indica multicolinearidade *VIF > 10 indica colinearidade que tende à perfeita *Testando multicolinearidade (válido somente para MQO) reg mod2 pt esq rejptpv lula02 corrup acomp idade homem instrucao estat vif *Sabemos que variância é o erro padrão ao quadrado, então *VIF de uma variável significa que o erro padrão do *coeficiente desta variável é "#" vezes maior (raiz de VIF) *do que se esta variável não fosse correlacionada com *outras variáveis independentes.