Tópicos de machine learning
Primeira Escola de Ciência de Dados da UFRJ
Aula 1: Conceitos de machine learning. Passos fundamentais para análise de dados. Conceitos de teoria da decisão. Técnicas de vizualização de dados. Gapminder. Ggplot, tidyverse e Rmarkdown.
Aula 2: Noções de incerteza, modelagem, divergência de Kullback-Leibler, regressão linear. Seleção stepwise. Machine learning versus inferência estatística. Risco e decisões. Aprendizado com modelo correto e incorreto.
Aula 3: O classificador logístico. Regressão para váriaveis com duas ou mais categorias. Spam data. Método do gradiente descendente e gradiente descendente estocástico.
Aula 4: Seleção de variáveis em regressão logística e Normal. Regressão Lasso, ridge, elastic net. Regressão Bayesiana. Aplicação em credit scoring.
Aula 5: Dados multivariados. Análise de cluster: k-means, soft k-means e model based. Inferência Bayesiana no modelo de mistura Normal.
Horário e local
De 13:30 às 17h (segunda à sexta) no Parque Tecnológico da UFRJ.
Monitores
Catarina Zaide, Victhor Sartório e Gabriely Xavier.
Bibliografia
Bayesian reasoning and Machine Learning, D. Barber.
R4DS: R for Data Science, G. Grolemund and H. Wickham
The Elements of Statistical Learning, T. Hastie, R. Tibshirani, J.H. Friedman. Springer, 2001.
Information Theory, Inference, and Learning Algorithms, MacKay, 2005.
Introduction to Statistics and Data Analysis, R. Peck, C. Olsen e J. L. Devore, 5a edição