PCA
Para hacer la pŕacitca de PCA vamos a usar dos conjuntos de datos
El primero, es la eficiencia en un campo de golf de tres jugadores
phil,tiger,vijay
datos = array([[4,4,5],
[4,5,5],
[3,3,2],
[4,5,4],
[4,4,4],
[3,5,4],
[4,4,3],
[2,4,4],
[5,5,5]], dtype=float)
El segundo, es la recolección de datos de pacientes con tumores cancerosos y no cancerosos
https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic)
Los datos están acá
https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/
Los eigenvalores y la matriz de covarianza en python se pueden importar así
In [10]: from numpy.linalg import eig
In [11]: from numpy import cov
La tarea sería agrupar a los diferentes tipos de pacientes