MAD??? Aprendizado de Máquina I
60 horas -4 créditos
Pré-requisitos: Computação Científica I, Inferência Estatística I, Cálculo das Probabilidades II - Recomendação?
60 horas -4 créditos
Pré-requisitos: Computação Científica I, Inferência Estatística I, Cálculo das Probabilidades II - Recomendação?
Aprendizado supervisionado. Técnicas clássicas de classificação binária. Análise de resultados e seleção de modelos. Outras técnicas de classificação. Introdução à teoria do aprendizado estatístico.
Aprender técnicas fundamentais de classificação via aprendizado estatístico supervisionado, análise de erro e seleção de modelos.
UNIDADE I - Introdução
Aprendizado supervisionado: nomenclatura básica, conjunto de treinamento, conjunto de teste, distinção entre classificação e regressão, exemplos.
Revisão de Álgebra Linear: produto interno, matrizes simétricas e positivas definidas, autovalores, autovetores e suas interpretações geométricas, diagonalização de matrizes, valores singulares, vetores singulares, interpretação geométrica e decomposição SVD de uma matriz.
UNIDADE II - Algumas técnicas clássicas de classificação binária
Naive Bayes: apresentação e hipóteses, algoritmos, exemplos.
Anáise de discriminante linear (LDA) e quadrático (QDA): a normal multivariada, LDA versus QDA, algoritmos, exemplos.
Perceptron: formulação, interpretação, algoritmos, exemplos.
UNIDADE III - Análise de resultados e seleção de modelos
O balanço entre viés e variância
Métricas para classificação: Matriz de confusão, precisão, acurácia, estatística F, curva ROC,
AUC; interpretações probabilísticas das métricas.
UNIDADE IV - Outras técnicas de classificação
Extensões dos métodos já vistos para classificação multiclasse: redução ao caso binário (um contra-um e um-contra-todos).
Máquinas de vetor suporte (SVM): Intuição geométrica, formulação matemática do problema,
algoritmos, regularização, o truque do kernel, exemplos.
Florestas aleatórias: arvores de decisão, agregação, aceleração, exemplos.
Introdução ao aprendizado não supervisionado: classificação via k vizinhos mais próximos, propriedades, limitações em alta dimensão.
UNIDADE V - Introdução à teoria do aprendizado estatístico
Dimensão VC de classificadores
Complexidade de Rademacher
Bibliografia
Gareth James, Daniela Witten, Trevor Hastie & Robert Tibshirani - An Introduction to Statistical
Learning with Applications in R
Norman Matlo - Statistical Regression and Classi cation: From Linear Models to Machine Learning
Trevor Hastie, Robert Tibshirani & Jerome Friedman - The Elements of Statistical Learning
Christopher Bishop - Pattern Recognition and Machine Learning
Kevin P. Murphy - Machine Learning: A Probabilistic Perspective