Utilize el repositorio de RapidMiner para cargar el conjunto de datos iris
Agrupe el conjunto de datos a partir del conjunto k-means usando un valor de k=3.
Evalue el comportamiento del clustering usando la distancia intra-cluster.
Automatice los dos puntos anteriores, de tal manera que el algoritmo k-means se ejecute 15 veces y reporte el mejor cluster de las 15 ejecuciones. (Utilice el operador Loop and deliver best).
Visualice el resultado del clustering. Cuantos datos quedan mal clasificados?
Importe en RapidMiner, el conjunto de datos credit-german.csv
Agrupe el conjunto de datos usando diferentes valores de k=1,2,3,4,5.
Tome nota de el SSE para cada k y grafíquelo.
¿Cuál es el mejor valor de k?
Describa el clustering obtenido para este k y su desempeño.
Convierta los datos nominales a variables binarias y normalice.
Repita el clustering, ¿mejoran los resultados?