PCA

Para hacer la pŕacitca de PCA vamos a usar dos conjuntos de datos

El primero, es la eficiencia en un campo de golf de tres jugadores

phil,tiger,vijay

datos = array([[4,4,5],

[4,5,5],

[3,3,2],

[4,5,4],

[4,4,4],

[3,5,4],

[4,4,3],

[2,4,4],

[5,5,5]], dtype=float)

El segundo, es la recolección de datos de pacientes con tumores cancerosos y no cancerosos

https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic)

Los datos están acá

https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

Los eigenvalores y la matriz de covarianza en python se pueden importar así

In [10]: from numpy.linalg import eig

In [11]: from numpy import cov

La tarea sería agrupar a los diferentes tipos de pacientes