Taller 1

    1. Obtenga el conjunto Adult del repositorio UCI Machine Learning Repository y cárguelo en RapidMiner

      1. Describa el conjunto de datos:

      2. Número de instancias:

      3. Número de atributos:

      4. ¿El conjunto de datos está etiquetado? ¿Cuántas clases tiene el conjunto de datos?

      5. ¿Cuántos atributos son numéricos y cuántos categóricos?

      6. Reporte la moda para cada atributo categórico.

      7. Reporte la media, rango y desviación estándar para cada atributo numérico.

      8. Determine el número de valores faltantes para cada atributo.

      9. Determine la distribución de las clases.

      10. Determine si existen atípicos de los datos.

    2. Aplique al menos dos estrategias diferentes para manejar los datos faltantes.

    3. Convierta todas los atributos numéricos a categóricos utilizando dos estrategias diferentes.

    4. Transforme el conjunto de datos de manera que todos los atributos sean numéricos.

    5. Escoja una técnica para la detección de datos atípicos y aplíquela sobre el conjunto de datos.