AM28CP - Aprendizado de Máquina e Reconhecimento de Padrões
Trabalhos
HW1 - Exercícios python (14/05)
Com base no documento L04_scipython_notes.pdf
Faça os exercícios sugeridos em Colab
Comente cada um dos comandos indicando ao que cada um faz
Compartilhe o link por email
HW2 - Exercícios python (14/05)
Com base na aula L02_knn
Implemente o knn em colab. Não utiliza bibliotecas. Implemente com estratégia tradicional, sem usar numpy
Use como base o dataset Iris
Sua implementação deve permitir que 5 novos objetos sejam classificados em uma das 3 classes
Refatore a implementação adicionando alguma melhoria de tempo ao knn, podendo ser uma fila de prioridades, qd-tree, ball-tree ou mesmo uma implementação vetorial com numpy
Meça tempo das 2 soluções e compare
Compartilhe o link por email
HW3 - Classificador centroid mais próximo (14/05)
Com base na aula L05c
Implemente o classificador do centroid mais próximo no colab.
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste
Normalize os dados antes de proceder o treinamento/classificação
A implementação deve ter a opção de utilizar distancia euclidiana. A implementação das distâncias deve ser manual (sem utilizar biblioteca, apenas numpy)
Deve mediar a acurácia no conjunto de treino e teste, comparar os resultados
Compartilhe o link por email
HW4 - Análise exploratória dos dados (21/05)
Com base na aula L06
Estime e plote a gaussiana 1d de cada uma das caracteristicas dos dados
Faça um scatterplot dos dados
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste, modele para ambas os subconjuntos
Escolha 2 características, modele e plote a gaussiana 2d resultante
Compartilhe o link por email
HW5 - Classificador LDA, QDA (21/05)
Com base na aula L08
Implemente o classificadores LDA e QDA colab.
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste
Normalize os dados antes de proceder o treinamento/classificação
Deve mediar a acurácia no conjunto de treino e teste
Compartilhe o link por email
HW6 - Seleção e avaliação de modelos
Com base nas aulas L11, L14, L15
Escolha uma base de dados qualquer do site kaggle.com, tarefa de classificação
Escolha um classificador do tipo ensamble
Rode o classificador na base de dados e estime a performace de generalização
Use método de hold-out para avaliação do modelo (treino/teste)
Use método 10-fold para seleção do modelo (treino validação)
Selecione o melhor modelo (hyperparâmetros) usando gridsearch
Utilizando o modelo selecionado, avalie se existe overfitting
Calcule intervalos de confiança via aproximação normal
HW7 - Kaggle projects
Escolha 20 projetos/datasets/códigos no site kaggle e analise as soluções propostas. Sua análise deverá ser sobre um código que possua pelo menos etapa de classificação e algum resultado.
Para análise faça uma tabela contendo os seguintes campos: Resumo, EDA, classificador, avaliação, métrica e resultado, hyperparametros, teste estatístico, análise
No campo resumo explique o objetivo da tarefa (e.g. separar imagens cancerígenas de não cancerígenas em análise de tumor de pulmão. classifiação binária)
No campo EDA (exploratory data analysis) indique que tipo de analises preliminares o projeto possui (histogramas, scatterplots, outros...)
No campo classificador indique qual classificador foi empregado. Se for mais de 1 escolher 1 apenas
No campo validação indique como o projeto realiza a seleção e avaliação do modelo, lembrando que validações válidas são: hold-out, k-fold, leave-one-out, randomsubsampling, bootstrap, entre outros.
No campo métrica e resultado indique qual medida foi retirada (e.g. acurácia, F1, kappa, etc). Indique também o resultado obtido
No campo hyperparâmetros indique se foi realizada a seleção de hyperparâmetros. E como essa seleção foi realizada (grid-search, random-search, nenhuma, etc)
No campo teste estatístico indique se foi realizado algum teste e qual (e.g. intervalo de confiança, Mcnemar, friedman, etc.
No campo análise deixe sua opinião a respeito do projeto analisado, indicando, por exemplo, se o projeto analisou ou não overfitting, o que vc faria diferente, etc.
Ao menos 1 projeto analisado deve conter todas as etapas corretas realizadas (EDA, seleção hyperparametros, avaliação modelo, teste estatístico)
News
Historia e Futuro
6 tecnologias que impactarão 2018
Dados são o recurso mais valioso
Computadores quanticos e softwares inteligentes
https://towardsdatascience.com/ten-machine-learning-algorithms-you-should-know-to-become-a-data-scientist-8dc93d8ca52e
https://www.terra.com.br/noticias/dino/especialista-em-inteligencia-artificial-alerta-empresas-brasileiras-precisam-avancar-em-deep-learning,3accd2fadf24b993b78ada0320ce9828czx6mmvv.html
Python
https://www.researchgate.net/publication/266617010_NumPy_SciPy_Recipes_for_Data_Science_Squared_Euclidean_Distance_Matrices
Mercado
China na frente dos US em patentes de Deep Learing
Análise de dados muda perfil de profissionais
Segunraça
Aplicações
IA do Google irá prever morte de pacientes
Como algoritmos controlam o mundo
Chatbot e eficiência na Unimed
Polícia chinesas e óculos de reconhecimento facial
Robôs inteligêntes para exploração de marte
Pedra, papel e tesoura, a velocidade da IA
Melhorando a descoberta de drogas
IA, Automação e Desemprego
Novos empregos serão criados, mas as habilidades necessárias serão diferentes