AM28CP - Aprendizado de Máquina e Reconhecimento de Padrões

Recursos

https://github.com/dalcimar/MA28CP-Intro-to-Machine-Learning

https://www.youtube.com/playlist?list=PL9At2PVRU0Zoa4_aFhnFDWFLyogcM1xpd

Trabalhos

HW1 - Exercícios python (14/05)

Com base no documento L04_scipython_notes.pdf
Faça os exercícios sugeridos em Colab
Comente cada um dos comandos indicando ao que cada um faz
Compartilhe o link por email

HW2 - Exercícios python (14/05)

Com base na aula L02_knn
Implemente o knn em colab. Não utiliza bibliotecas. Implemente com estratégia tradicional, sem usar numpy
Use como base o dataset Iris
Sua implementação deve permitir que 5 novos objetos sejam classificados em uma das 3 classes
Refatore a implementação adicionando alguma melhoria de tempo ao knn, podendo ser uma fila de prioridades, qd-tree, ball-tree ou mesmo uma implementação vetorial com numpy
Meça tempo das 2 soluções e compare
Compartilhe o link por email

HW3 - Classificador centroid mais próximo (14/05)

Com base na aula L05c
Implemente o classificador do centroid mais próximo no colab.
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste
Normalize os dados antes de proceder o treinamento/classificação
A implementação deve ter a opção de utilizar distancia euclidiana. A implementação das distâncias deve ser manual (sem utilizar biblioteca, apenas numpy)
Deve mediar a acurácia no conjunto de treino e teste, comparar os resultados
Compartilhe o link por email

HW4 - Análise exploratória dos dados (21/05)

Com base na aula L06
Estime e plote a gaussiana 1d de cada uma das caracteristicas dos dados
Faça um scatterplot dos dados
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste, modele para ambas os subconjuntos
Escolha 2 características, modele e plote a gaussiana 2d resultante
Compartilhe o link por email

HW5 - Classificador LDA, QDA (21/05)

Com base na aula L08
Implemente o classificadores LDA e QDA colab.
Use como base o dataset Iris
Sua implementação deve separar a base de dados em treino/teste
Normalize os dados antes de proceder o treinamento/classificação
Deve mediar a acurácia no conjunto de treino e teste
Compartilhe o link por email

HW6 - Seleção e avaliação de modelos

Com base nas aulas L11, L14, L15
Escolha uma base de dados qualquer do site kaggle.com, tarefa de classificação
Escolha um classificador do tipo ensamble
Rode o classificador na base de dados e estime a performace de generalização
- Use método de hold-out para avaliação do modelo (treino/teste)
- Use método 10-fold para seleção do modelo (treino validação)
- Selecione o melhor modelo (hyperparâmetros) usando gridsearch
- Utilizando o modelo selecionado, avalie se existe overfitting
- Calcule intervalos de confiança via aproximação normal

HW7 - Kaggle projects

Escolha 20 projetos/datasets/códigos no site kaggle e analise as soluções propostas. Sua análise deverá ser sobre um código que possua pelo menos etapa de classificação e algum resultado.
Para análise faça uma tabela contendo os seguintes campos: Resumo, EDA, classificador, avaliação, métrica e resultado, hyperparametros, teste estatístico, análise
- No campo resumo explique o objetivo da tarefa (e.g. separar imagens cancerígenas de não cancerígenas em análise de tumor de pulmão. classifiação binária)
- No campo EDA (exploratory data analysis) indique que tipo de analises preliminares o projeto possui (histogramas, scatterplots, outros...)
- No campo classificador indique qual classificador foi empregado. Se for mais de 1 escolher 1 apenas
- No campo validação indique como o projeto realiza a seleção e avaliação do modelo, lembrando que validações válidas são: hold-out, k-fold, leave-one-out, randomsubsampling, bootstrap, entre outros.
- No campo métrica e resultado indique qual medida foi retirada (e.g. acurácia, F1, kappa, etc). Indique também o resultado obtido
- No campo hyperparâmetros indique se foi realizada a seleção de hyperparâmetros. E como essa seleção foi realizada (grid-search, random-search, nenhuma, etc)
- No campo teste estatístico indique se foi realizado algum teste e qual (e.g. intervalo de confiança, Mcnemar, friedman, etc.
- No campo análise deixe sua opinião a respeito do projeto analisado, indicando, por exemplo, se o projeto analisou ou não overfitting, o que vc faria diferente, etc.
Ao menos 1 projeto analisado deve conter todas as etapas corretas realizadas (EDA, seleção hyperparametros, avaliação modelo, teste estatístico)

MA28CP - Notas

News

Historia e Futuro

IA em 3 ondas

6 tecnologias que impactarão 2018

Dados são o recurso mais valioso

Microship com fotônica

Boston Dynamics, história

Computadores quanticos e softwares inteligentes

https://towardsdatascience.com/ten-machine-learning-algorithms-you-should-know-to-become-a-data-scientist-8dc93d8ca52e

https://www.terra.com.br/noticias/dino/especialista-em-inteligencia-artificial-alerta-empresas-brasileiras-precisam-avancar-em-deep-learning,3accd2fadf24b993b78ada0320ce9828czx6mmvv.html

Python

https://www.researchgate.net/publication/266617010_NumPy_SciPy_Recipes_for_Data_Science_Squared_Euclidean_Distance_Matrices

Mercado

China na frente dos US em patentes de Deep Learing

Análise de dados muda perfil de profissionais

Segunraça

Hackeando IA

Banimento de robôs militares

Aplicações

IA do Google irá prever morte de pacientes

Como algoritmos controlam o mundo

Chatbot e eficiência na Unimed