Horário das aulas: 24/9/2017 -- 21/12/2017, sexta-feira 14:20 -- 18:00
Sala: 1028
Horário de atendimento: quinta-feira 10h-11h ou sob agendamente prévio.
AVISO:
Pré requisitos
É suposto que o aluno possui conhecimentos sobre probabilidade, algebra linear, cálculo multivariado, otimização, e programação.
Neste curso os alunos desenvolverão um entendimento sobre os limites sobre o que podemos aprender com os dados e como fazê-lo. O estudante desenvolverá um entendimento sobre os compromissos básicos assumidos quando estimamos modelos baseados nos dados e suas armadilhas mais comuns. Ao fim do curso espera-se que o aluno seja capaz de: implementar (e ser crítico) modelos básicos de machine learning; formular o problema de aprendizagem de máquinas precisamente, em termos das entradas e saídas do modelo; selecionar um modelo e algoritmo adequado para o problema, aplicar este algoritmo em dados reais, e interpretar os resultados; providenciar medidas indicativas de quão efetivo foi o aprendizado; e, idealmente, ler de forma crítica artigos científicos publicados nesta área.
O problema do aprendizado estatístico (o que é aprendizado?). Treinamento vs teste (dimensão Vapnik-Chervonenkis, treinamento e generalização). Modelo linear (regressão linear, não linear e logística). Overfitting. Princípios da aprendizagem por máquinas: navalha de Occam, viés de amostra e data snooping. Métodos baseados em similaridade (vizinho mais próximo, funções de base radial, estimação de densidades). Redes neurais (MLP, treinamento, aproximação e regularização). Máquinas de vetor de suporte. Considerações finais (ferramentas utilizadas no aprendizado de máquinas).
O livro adotado possui capítulos extras e um forum online book.caltech.edu/bookforum e é usado por vários professores ao redor do mundo e cursos no EDX . Utilizem o forum de forma respeitosa e em sua linguagem original (inglês). Caso percam alguma aula, sugiro que visitem o site amlbook.com e busquem a versão online ministrada por um dos autores. Apesar deste curso ser suficientemente diferente, o material online pode servir de guia.
O aluno será avaliado através de listas de exercícios individuais. Caso o aluno colabore com outros ao solucionar as listas, deve deixar explicito a pessoa e a extensão da contribuição. Alguns exercícios podem estar solucionados na web. Solicito que não copiem a solução por motivos óbvios.
Livros:
Artigos e capítulos de livro:
Aproximação universal das Redes Neurais: