MAD??? Análise de Regressão II
60 horas - 4 créditos
Pré-requisitos: Inferência Estatística I?, Álgebra Linear II? - Recomendação: 6o período
60 horas - 4 créditos
Pré-requisitos: Inferência Estatística I?, Álgebra Linear II? - Recomendação: 6o período
Família exponencial e propriedades. Modelos lineares generalizados. Seleção de modelos por encolhimento (Lasso e Ridge) e métodos de estimação para grandes bases de dados. Métodos de classificação baseados em regressão e árvores de regressão. Classificação linear, GAM, filtros colaborativos. Aplicações.
Definir, ajustar e analisar modelos lineares generalizados. Escolha de modelos e estimação para problemas de grande complexidade (grandes bases e número elevado de preditores) em regressão logística, Poisson, Gama, multinomial.
UNIDADE I Regressão para variáveis binárias e contagens
I - Introdução ao GLM; Funções de ligação; Modelo de regressão para variáveis binárias; Modelo de regressão para contagens; Sobredispersão. Estimação e previsão; Aplicações;
UNIDADE II - GLM (modelos lineares generalizados)
I - Introdução: componentes do GLM; notação; Família de distribuição exponencial.
II - Estimação: EMV; EMQ; Método do gradiente descendente;
III - Inferência: Distribuição assintótica; Teste de hipóteses e IC para os parâmetros do modelo;
IV – Análise de resíduos, comparação de modelos e bondade do ajuste.
UNIDADE III - Métodos de classificação linear. (Capitulo 4 Hastie + ... )
I - Regressão logística. Aproximação quadrática; Regressão penalizada;
II - Amostras de treinamento e validação. Validação cruzada. Critérios de comparação de classificadores e impureza. Curva ROC. Aplicações em credit scoring.
UNIDADE IV – Modelos aditivos e árvores de regressão
I – Ajuste do GAM; Suavização; Relação vício-variância. Aplicações; (Capitulo 9 Hastie)
II – Árvores de regressão e classificação; (Capitulo 9 Hastie)
III - Método dos vizinhos mais próximos e vizinhos mais próximos adaptativo; (Capítulo 13, Hastie)
IV – Florestas aleatórias; Definição; Sobreajuste; Gráfico de proximidade; (Capítulo 15, Hastie)
UNIDADE V – Sistemas de recomendação
I - Medidas de associação; Filtro colaborativo baseado no usuário; Filtro colaborativo baseado no produto. Comparação de modelos.
BIBLIOGRAFIA
A. Agresti. Foundations of linear and generalized linear models. 2015, Wiley.
A. Dobson, A. G. Barnett. An introduction to generalized linear models 3.ed. Boca Raton : CRC Press, 2008.
T. Hastie, R. Tibshirani and J. Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, second edition, Springer.
R. A. Berk. Statistical Learning from a regression perspective. 2009, Springer.
T. Hastie, R. Tibshirani. 1990. Generalized Additive Models. London: Chapman & Hall.
M. D. Stasinopoulos, R. A. Rigby, G. Z. Heller, V. Voudouris, F. De Bastiani. Flexible
Regression and Smoothing: Using GAMLSS in R, 1st Edition, 2017, Chapman and Hall/CRC