Tópicos de machine learning

Primeira Escola de Ciência de Dados da UFRJ

Aula 1: Conceitos de machine learning. Passos fundamentais para análise de dados. Conceitos de teoria da decisão. Técnicas de vizualização de dados. Gapminder. Ggplot, tidyverse e Rmarkdown.

Aula 2: Noções de incerteza, modelagem, divergência de Kullback-Leibler, regressão linear. Seleção stepwise. Machine learning versus inferência estatística. Risco e decisões. Aprendizado com modelo correto e incorreto.

Aula 3: O classificador logístico. Regressão para váriaveis com duas ou mais categorias. Spam data. Método do gradiente descendente e gradiente descendente estocástico.

Aula 4: Seleção de variáveis em regressão logística e Normal. Regressão Lasso, ridge, elastic net. Regressão Bayesiana. Aplicação em credit scoring.

Aula 5: Dados multivariados. Análise de cluster: k-means, soft k-means e model based. Inferência Bayesiana no modelo de mistura Normal.

Horário e local

De 13:30 às 17h (segunda à sexta) no Parque Tecnológico da UFRJ.

Monitores

Catarina Zaide, Victhor Sartório e Gabriely Xavier.

Bibliografia

  • Bayesian reasoning and Machine Learning, D. Barber.

  • R4DS: R for Data Science, G. Grolemund and H. Wickham

  • The Elements of Statistical Learning, T. Hastie, R. Tibshirani, J.H. Friedman. Springer, 2001.

  • Information Theory, Inference, and Learning Algorithms, MacKay, 2005.

  • Introduction to Statistics and Data Analysis, R. Peck, C. Olsen e J. L. Devore, 5a edição