Tarea 1: Análisis Exploratorio y Preprocesamiento

Fecha de entrega: 23 de Agosto

Formato: por escrito

Grupos de máximo 2 estudiantes

  1. Descargar el siguiente conjunto de datos credit-german.csv e impórtelo en RapidMiner

  2. Genere una hipótesis del origen y significado de los datos.

    1. Número de instancias

    2. Número de atributos

    3. ¿El conjunto de datos está etiquetado? ¿Cuántas clases tiene el conjunto de datos?

    4. ¿Cuántos atributos son numéricos y cuántos categóricos?

    5. Reporte la moda para cada atributo categórico

    6. Reporte la media, rango y desviación estándar para cada atributo numérico

    7. Determine el número de valores faltantes para cada atributo

    8. Determine la distribución de las clases

    9. Determine si existen atípicos de los datos

  3. Responda las siguientes preguntas:

    1. ¿Cuál es lo propósito predominante de los préstamos?

    2. ¿Qué tipo de estatus tienen las personas que más hacen préstamos? ¿Y el perfil de la de menos préstamos? ¿Cuál es el perfil de las personas que hacen los prestamos más costoso? ¿Y el de los menos costosos?

    3. ¿Puede establecer alguna relación entre edad, estatus personal y la clase?

    4. ¿Puede establecer alguna relación entre clase de trabajo, el número de créditos, estatus personal y la clase?

    5. ¿Existe alguna relación entre la cantidad solicitada y el número de meses del préstamo?

    6. ¿Existe alguna relación entre la edad, el estatus, la clase y la cantidad del préstamo?

    7. Pruebe diferentes combinaciones entre los atributos y establezca las relaciones entre ellos, reporte la herramienta de visualización que utilizó para tal fin

  1. Realice los siguientes procedimientos sobre alguno de los atributos del conjunto de datos, analice los resultados y extraiga resultados

    1. Análisis de rangos intercuartiles

    2. Histogramas

    3. Gráfica de dispersión

    4. Gráficas de coordenadas paralelas

  1. Proponga tres preguntas y resuélvalas a partir de técnicas de visualización