El objetivo de esta práctica es explorar diversos aspectos del análisis de redes sociales usando R. Para ello, está organizada en 3 partes. La primera se enfocará a la visualizacion, la segunda en métricas, y la tercera en permutaciones y modelos para redes. Al final encontrarás los elementos mínimos que debe contener el reporte.
Para comenzar, descarga los siguientes materiales que utilizarás para la práctica:
SCRIPT PARTE 1: UNAM_ARS2024_1.R
Red de delfines: dolphin.gml
Imagen dolphin.png
Red de The Matrix: "THE MATRIX.graphml" (los nodos son los personajes vinculados en función del número de escenas en las que aparecen juntos).
SCRIPT PARTE 2: UNAM_ARS2024_2.R
Archivo S2_R.csv
SCRIPT PARTE 3: UNAM_ARS2024_permutaciones.R
Archivos Grey's Anatomy - attributes.tsv y Grey's Anatomy - sociomat.tsv
PARTE 1. VISUALIZACIÓN
La primera parte consiste en visualizar redes en R. Trabajaremos con el primer script (UNAM_ARS2024_1.R.) Además usaremos el archivo dolphin.gml y el archivo "THEMATRIX.graphml". Por favor coloca ambos archivos en un carpeta conocida. Luego abre el script en Rstudio y ahí encontrarás instrucciones para continuar.
Para explorar más a fondo algunas posibilidades para la generación de visualizaciones de redes en R, revisaremos también el tutorial creado por Katya Ognyanova en la versión que fue ofrecida como taller virtual en Sunbelt 2023. Para ello, dirígete al sitio https://kateto.net/network-visualization y sigue el tutorial. Ahí encontrarás las instrucciones y enlaces para descargar los materiales necesarios.
PARTE 2. MÉTRICAS
En la segunda parte de la práctica trabajaremos en R con el script (UNAM_ARS2024_2.R). Además usaremos nuevamente el archivo dolphin.gml y los archivos dolphin.png y S2_R.csv. Por favor coloca los archivos en una misma carpeta. Luego abre el script en RStudio y sigue las instrucciones.
PARTE 3. PERMUTACIONES y MODELOS
Descarga el script UNAM_ARS2024_permutaciones.R y los archivos Grey's Anatomy - attributes.tsv y Grey's Anatomy - sociomat.tsv y colócalos en tu directorio de trabajo.
Este script está conformado por 4 secciones. La práctica se desarrolla con la SECCIÓN 1, que consiste en usar aleatorizaciones de redes para analizar dos métricas. Si lo prefieres, puedes resolver el ejercicio en python.
Las secciones restantes del script son demostrativas presentando lo siguiente:
SECCIÓN 2. Permutaciones de la base original de datos y su uso para hacer análisis estadísticos de redes.
Las secciones 3 y 4 presentan ejemplos de cómo realizar un análisis usando MRQAP y ERGM, respectivamente.
SECCIÓN 3. Presenta un ejemplo de un "Multiple regression quadratic assignment procedure" (MRQAP) que es un tipo de regresión múltiple desarrollado para usar con redes, el cual permite evaluar el efecto de variables independientes sobre una variable dependiente vinculada a la red. A diferencia de regresiones múltiples "convencionales", donde la unidad de análisis es el individuo, en el MRQAP la unidad de análisis es la diada. Aquí un ejemplo de un estudio donde utilizan el análisis.
SECCIÓN 4. Presenta el desarrollo de un análisis usando un ERGM: "Exponential Random Graph Models" (modelos exponenciales de redes al azar). Los ERGMs permiten explorar los procesos de formación de vínculos en las redes y el surgimiento de propiedades estructurales (propiedades emergentes). A partir de propiedades conocidas de las redes de interés, se pueden utilizar las distribuciones de dichas propiedades para generar redes azarosas. Posteriormente, se comparan las redes azarosas con las redes observadas para evaluar su similitud. Una de las características recomendadas que se pueden usar para la construcción de ERGMs son el número de vínculos y también se pueden utilizar los atributos de nodos para explorar el efecto de procesos de asortatividad (por ejemplo homofilia).
Abre el script y sigue las instrucciones.
##########################################
REPORTE (entregarse el 18 de abril por correo electrónico antes de las 8:30 pm)
Parte 1.
El tutorial enfatiza que el objetivo de una visualización puede determinar qué tipo de representación usar. Menciona dos aspectos de una red (de los ejemplificados en el tutorial), que pueden guiar las decisiones de visualización.
Indica dos tipos de visualización además de grafos, que pueden usarse para representar redes.
Presenta la imagen de la red de "The Matrix", con una descripción de lo que se muestra, mencionando al menos 3 atributos de la visualización.
Parte 2.
Presenta la imagen de la red de The Matrix mostrando (a) alguna medida de centralidad representada en el tamaño de los nodos, (b) la pertenencia a módulos (indicando a qué algoritmo corresponden) representada con el color de los nodos y (c) el peso de las aristas representado en el ancho de las mismas.
Parte 3. Se puede resolver en R o Python según se prefiera.
Presenta una breve descripción de lo que hiciste en esta sección presentando:
a) Las imágenes de los 4 histogramas reportando si los valores correspondientes a las redes observada cayeron dentro o fuera del 95% de la distribución de valores de las obtenidos para las submuestras y para las versiones aleatorias de la red.
b) Una interpretación de los resultados de estas pruebas discutiendo cómo se relacionaron los valores obtenidos a partir de la red observada (net0) con los de sus submuestras y con los de las versiones aleatorias de la red.
c) La visualización de la red observada (net0) y de la red aleatoria (alea) generada en la primera sección del script.
OPCIONAL. Revisa las sección 2 del script. Para tu reporte, incluye un resumen breve de los resultados que se obtienen en esta sección y tu interpretación de los mismos.