En esta práctica continuaremos con el uso de Gephi y un poco de Cytoscape. Utilizaremos las funciones que tiene disponibles para cuantificar diferentes aspectos estructurales de la red y mostrarlos en la visualización.
PARTE A. RED "DE CERO"
Abre GEPHI.
Examina la diferencia entre abrir un archivo de red y una sesión de GEPHI. Para hacerlo, primero abre el archivo en formato graphml de la red desde datos crudos que generaste en la parte B de la práctica 2. Observa brevemente cómo se ve al abrirlo. Ciérralo (Archivo> Cerrar proyecto) y luego abre el proyecto de GEPHI (con extensión .gephi) correspondiente a la misma red pero que debe abrir la última visualización que trabajaste de la red. Con esta trabajarás los pasos siguientes.
Dirígete al panel de Vista general de la red. Ve a la sección del lado derecho en la pestaña que dice Estadísticas y ejecuta algunas de las métricas que vimos en clase. Observa cómo aparecen los valores de las métricas en la tabla de nodos o vínculos (dependiendo de la métrica). En algunos casos te aparecerán ventanas de reporte, indicando los resultados del análisis. Procura identificar algunas métricas globales (propias de toda la red) y algunas locales.
Asegúrate de haber ejecutado las funciones para calcular el Grado y la Modularidad. Después, dirígete a la sección superior izquierda de la ventana en la pestaña Apariencia y establece el color de los nodos de acuerdo con los resultados de la detección de módulos (es decir, de acuerdo con el módulo al que pertenecen) y el tamaño de los nodos de acuerdo con el grado.
Ahora, dirígete al panel de Previsualización. En los controles del lado derecho busca la sección de Aristas y selecciona la casilla para Reescalar pesos. Esto hace que el grueso de las aristas sea proporcional al peso de los vínculos. Cada vez que hagas un cambio en esta sección, debes presionar el botón Refrescar en la parte de abajo para que se actualice la imagen con los cambios. Juega con los valores que definen el grosor mínimo y máximo (Peso reescalado mínimo y Peso reescalado máximo) hasta tener una visualización que deje notar diferencias de peso entre las aristas.
Finalmente, explora los otros controles de la previsualización. Cuando tengas una imagen que te guste, expórtala.
Cierra el proyecto de GEPHI (Archivo> Cerrar proyecto) sin cerrar el programa.
PARTE B. RED DE BLUESKY
Para la siguiente sección de la práctica, trabajarás con la red de bluesky que descargaste durante la práctica 2.
Dirígete a la opción Abrir y navega hasta la sesión de GEPHI que guardaste en la sección A de la práctica 2 (archivo con terminación .gephi).
Igual que en la sección anterior, te vas a enfocar en describir propiedades estructurales de la red, utilizando las métricas disponibles en la pestaña de Estadísticas en la Vista General.
Nuevamente, utiliza algunas métricas para modificar la visualización de la red. Por ejemplo, modifica el tamaño de los nodos de acuerdo con su centralidad por eigenvector (Centralidad por vector propio), su centralidad por intermediación (Betweenness centrality; en gephi se calcula junto con el Diámetro) y el número de seguidores y mira cómo cambian los patrones que se ven en cada caso (procura jugar con la diferencia entre el tamaño mínimo y máximo de los nodos, por ejemplo, auméntala a Tamaño min: 10, Tamaño max: 100).
Un aspecto de mucho interés en el análisis de redes es la identificación de subconjuntos de nodos más conectados entre sí que con el resto de la red (comunidades o módulos). Como vimos en clase, esto se puede cuantificar de distintas maneras. Ejecuta la Modularidad en GEPHI y revisa el informe para identificar qué algoritmo utiliza.
Calcula varias veces la modularidad, cambiando el valor de Resolución en la ventana del análisis. Explora cómo cambian los resultados al aumentar o disminuir el valor de resolución (valor de modularidad, número de módulos, tamaño de los módulos).
Manipula las métricas y la visualización para generar una red donde el tamaño de los nodos indique alguna medida de centralidad y el color de los nodos indique el módulo al que pertenecen. Guarda una imagen de esta visualización para incluirla en tu reporte (Imagen 1 de la red de bluesky).
Usa los filtros de GEPHI para identificar el número y porcentaje de nodos y vínculos que quedan en la red si filtras los nodos con grado menor a 10.
Genera una nueva visualización que te parezca informativa, ahora de la red filtrada (Imagen 2 de la red de bluesky). Aprovecha lo que ya conoces sobre cómo manipular estilos y las métricas calculadas.
Exporta la red filtrada en formato Graphml.
Exporta la tabla de Nodos de la red sin filtrar (en Laboratorio de Datos > Nodos>Exportar tabla) en formato .csv. Esta tabla te puede facilitar el análisis de algunas métricas en programas distintos a Gephi.
Exporta la red sin filtrar como archivo con formato GraphML y guárdala en un directorio conocido.
PARTE C. MÉTRICAS EN CYTOSCAPE
En Cytoscape, abre el archivo GraphML de la red filtrada de bluesky que generaste en la sección anterior.
Ahora explora las funcionalidades básicas de análisis que ofrece este programa. Revisa las tablas de nodos y vínculos (abajo de la ventana donde se visualiza la red). A continuación, utiliza la función Tools > Analyze network. Deberás especificar si la red es dirigida o no. Posteriormente, verás que se calculan diversas métricas incluyendo varias de las que hemos visto en clase (detalles aquí); observa los datos que se añaden a la tabla de nodos y de vínculos.
Utiliza algunas de las métricas generadas para modificar la visualización de la red. Primero modifica el tamaño de los nodos de acuerdo con su coeficiente de acumulación local (clustering coefficient). Para ello, dirígete a la pestaña Style que se encuentra en el costado izquierdo. En la parte inferior asegúrate de que está seleccionada la opción Node. Ahora asegúrate de seleccionar la casilla que dice "Lock node width and height" en la parte inferior de las opciones de esa pestaña. Esto hace que se mantenga la relación de tamaño entre el ancho y alto de la figura del nodo. Ahora dirígete a la fila Size (tamaño). Selecciona el cuadro de en medio, en la columna de encabezado Map. Debajo aparecerán las filas "Column" y "Mapping type". Da click en la opción Column y selecciona la variable clustering coefficient. Ahora en la opción de Mapping type selecciona "Continuous mapping".
Ahora elige la opción Edge en la parte inferior de la ventana Style y busca la forma de modificar el grosor de los vínculos para que represente los valores de la columna Edge Betweenness en la tabla de vínculos. Si la característica Width no está disponible, revisa la lista desplegable en Properties para agregar esa y otras características manipulables en la visualización.
Una vez exploradas las métricas y visualizaciones, genera una visualización que, además de los dos puntos anteriores, presente una distribución distinta a las dos imágenes previas y modifica la forma de los nodos. Luego exporta la imagen (File > Export > Network to Image...) para incluirla en tu reporte (Imagen 3 de la red de bluesky).
Considerando tu exploración de la red filtrada de bluesky en gephi y cytoscape, presenta una descripción de sus propiedades estructurales incluyendo las que se enlistan abajo. Si observas diferencias entre los dos programas en los valores, reporta ambos.
a) Breve explicación de qué es la red (¿qué sistema está representando? ¿qué son los nodos y qué son los vínculos?).
b) ¿Es binaria o con pesos?
c) ¿Es dirigida o no dirigida?
d) Número de nodos
e) Número de vínculos
f) Número de componentes conectados
g) Número y porcentaje de nodos en el componente gigante
h) Número y porcentaje de nodos y vínculos en la red si se filtran los nodos con grado menor a 10
i) Densidad de la red
j) Grado promedio, grado mínimo y grado máximo. Si es pertinente, presenta la fuerza promedio, mínima y máxima.
k) Coeficiente de acumulación promedio (clustering coefficient).
l) Diámetro de la red.
m) Camino más corto promedio
n) Número de módulos identificados (explicando si usas pesos o no y el valor de resolución usado) y número de nodos por módulo (esto último se puede presentar como gráfico).
PARTE D. RED DE DELFINES
Finalmente, vas a trabajar con la red de delfines analizada en el artículo de Lusseau (2003): dolphin.gml. Descárgala por favor.
Abre Gephi y luego abre el archivo de la red que acabas de descargar (se trata de una red No dirigida).
Genera una visualización que te parezca informativa.
Haz una descripción de esta red con los mismos elementos (a-n) señalados en el punto 24.
-------------------
REPORTE (entregarse el 5 de marzo por correo electrónico curso.ars.unam.2020@gmail.com )
El reporte de esta práctica debe incluir:
Portada que incluya nombre y número de la práctica
Una breve introducción del tema de la práctica
Una breve descripción de la actividad que se desarrolló
Imagen de la "red de cero" de la primera sección donde el color de los nodos representa el módulo y el tamaño representa el grado.
Imagen 1 de la red bluesky mostrando alguna medida de centralidad representada en el tamaño de los nodos y donde el color de los nodos indica el módulo al que fueron asignados de acuerdo con el análisis (especifica los parámetros del análisis de modularidad que usaste).
Imagen 2 de la red de bluesky, mostrando la red una vez filtrados los nodos con grado menor a 10 y con características distintas a las de la Imagen 1.
Imagen 3 de la red de bluesky, ahora generada en Cytoscape.
Descripción cuantitativa de la red de bluesky incluyendo los aspectos indicados en el paso 24.
Imagen de la red de delfines y descripción cuantitativa incluyendo los aspectos indicados en el paso 24
Discute brevemente el contraste entre la red de bluesky y la red de delfines.
Una breve conclusión.
Para cada imagen que presentes, incluye una descripción de lo que se observa en la visualización (qué métricas están representadas).