Aula 1: Conceitos de machine learning. Passos fundamentais para análise de dados. Conceitos de teoria da decisão. Técnicas de vizualização de dados. Gapminder. Ggplot, tidyverse e Rmarkdown.
Aula 2: Noções de incerteza, modelagem, divergência de Kullback-Leibler, regressão linear. Seleção stepwise. Machine learning versus inferência estatística. Risco e decisões. Aprendizado com modelo correto e incorreto.
Aula 3: O classificador logístico. Regressão para váriaveis com duas ou mais categorias. Spam data. Método do gradiente descendente e gradiente descendente estocástico.
Aula 4: Seleção de variáveis em regressão logística e Normal. Regressão Lasso, ridge, elastic net. Regressão Bayesiana. Aplicação em credit scoring.
Aula 5: Dados multivariados. Análise de cluster: k-means, soft k-means e model based. Inferência Bayesiana no modelo de mistura Normal.
De 13:30 às 17h (segunda à sexta) no Parque Tecnológico da UFRJ.
Catarina Zaide, Victhor Sartório e Gabriely Xavier.
Bayesian reasoning and Machine Learning, D. Barber.
R4DS: R for Data Science, G. Grolemund and H. Wickham
The Elements of Statistical Learning, T. Hastie, R. Tibshirani, J.H. Friedman. Springer, 2001.
Information Theory, Inference, and Learning Algorithms, MacKay, 2005.
Introduction to Statistics and Data Analysis, R. Peck, C. Olsen e J. L. Devore, 5a edição