1. Descargue el subconjunto de imágenes imageclef100 proveniente del conjunto de imagines médicas del ImageClef (http://www.imageclef.org/2012 o en el fichero zip adjunto)
2. Descomprima y cargue el conjunto de imágenes en Bigs
bigs load.files imageclef.imgs <images folder>
3. Prepare y ejecute la tarea de extracción de parches:
a. Descargue el pipeline patch-extraction.pipeline.properties
b. Prepare el pipeline:
bigs pipeline.load <pipeline path>/ patch-extraction.pipeline.properties
bigs pipeline.prepare <pipeline number>
bigs worker
c. Para observar los parches extraídos:
I. Descargue la tabla con los resultados del pipeline:
bigs download.table imageclef.randompatches <Nombre del archivo destino con información de parches > true
II. Ejecute el programa showpatches.jar para observar los parches extraídos:
Java –jar showpatches.jar <Nombre del archivo con información de parches>
4. Ejecute el algoritmo de kmeans para el conjunto de parches extraídos
a. Descargue el pipeline kmeans.pipeline.properties
b. Prepare y ejecute el pipeline:
bigs pipeline.load <pipeline path>/kmeans.pipeline.properties
bigs pipeline.prepare <pipeline number>
bigs worker
c. Revise el tiempo requerido en el trabajo realizado por este único worker:
bigs pipeline.info <pipeline number>
5. Observe los clusters generados
a. Descargue los resultados generados en un archivo:
bigs download.state <pipeline number> 1 <Nombre del archivo destino con información de centroides>
b. Ejecute showpatches.jar para observar los centroides generados como imágenes:
Java –jar showpatches.jar <Nombre del archivo con información de centroides>
Discuta acerca de la calidad de los centroides generados
6. Realice el mismo procedimiento del punto 4 utilizando 2 y 4 workers
a. Lance nuevos worker en otras maquinas o workers adicionales en su máquina a través de nuevas terminales
b. Revise la información de cada pipeline de kmeans para cada configuración de workers ¿Como cambian los tiempos de procesamiento?
bigs pipeline.info <pipeline number>
7. Edite el archivo kmeans.pipeline.properties
a. Modifique el número máximo de iteraciones, el porcentaje mínimo de cambio, y el valor k. ¿Cómo afectan estos parámetros?