Programa: Escuela de Doctorado de Ciencias Sociales, Jurídicas y Humanas de la Universidad de Granada
Imparten: Nicolás Robinson-García y Daniel Torres-Salinas
Aproximación docente: 10 horas teórico-prácticas
Parte 1 - Herramientas computacionales para el análisis y la visualización de datos
Parte 2 - Culturonomics como método digital para las Ciencias Sociales
En este curso pretendemos daros una introducción metodológica y conceptual al uso de dos tipos de herramientas:
1. Herramientas computacionales. Es decir, aquellas que emplean análisis cuantitativos avanzados para analizar grandes masas de datos.
2. Métodos digitales. Esto es, métodos que reutilizan y reorientan datos generados en el entorno digital para responder a una pregunta de carácter social o cultural.
Hemos diseñado este curso con el objetivo de inspirar y dotaros de nuevas herramientas y de nuevas perspectivas sobre cómo abordar una investigación en el ámbito de las Ciencias Sociales.
Las dos sesiones que hemos diseñado son en gran medida instrumentales, mostrando diferentes herramientas y abordajes a preguntas del ámbito de las Ciencias Sociales. Ahondaremos en algunas de ellas y de hecho, las probaremos juntos introduciendo alguna práctica, pero el objetivo principal es familiarizaros con este tipo de aproximaciones metodológicas.
En esta primera sesión, veremos herramientas computacionales que permiten analizar grandes masas de datos de diferente naturaleza y observar patrones generales a través de la visualización de los mismos. Nos centraremos en 3 herramientas: VOSVIEWER - BIBLIOMETRIX - TALL
Las CIENCIAS SOCIALES COMPUTACIONALES pueden definirse como el desarrollo de métodos y aplicaciones computacionales aplicados a gran escala 🌟BIG DATA🌟 para estudiar el comportamiento humano.
La principal revolución de estos métodos es el permitir el análisis masivo de datos sociales mediante técnicas cuantitativas y de machine learning.
Esto incluye metodologías como el análisis de redes sociales, identificación de patrones de comportamiento o predicción de fenómenos sociales.
Hasta hace no mucho, la forma tradicional de recogida de datos en el ámbito de las Ciencias Sociales ha sido a través: encuestas, entrevistas, observación y trabajo de campo, datos secundarios (archivos, estadísticas nacionales, bases de datos).
Las nuevas tecnologías ofrecen formas más rápidas de recogida de datos, pero también nuevas fuentes de información y el análisis de fenómenos sociales hasta una escala impensable.
Esto supone grandes retos desde el punto de vista conceptual, ético y metodológico
1
Cuestionamiento de marcos teóricos clásicos. Toda la teoría desarrollada sobre el comportamiento social y humano hasta el momento se cimenta sobre estudios empíricos realizados a pequeña escala, casos de estudios o evidencias testimoniales. El reto de analizar fenómenos sociales a gran escala pone en jaque la capacidad de estos marcos teóricos para explicar los resultados obtenidos.
2
Desarrollo de nuevas habilidades y destrezas técnicas. El uso de herramientas computacionales supone un cambio de paradigma a nivel metodológico brutal. Ya no es suficiente con el conocimiento teórico de una disciplina ni con manejar las metodologías tradicionales, hay que tener conocimientos de programación y estadística. ESTO NO SIGNIFICA SER INFORMÁTICO NI MATEMÁTICO, PERO SI ENTENDER LOS MÉTODOS Y TÉCNICAS DE ESTOS CAMPOS
3
Infrastructura y transparencia de datos. El acceso masivo a datos personales sean públicos o privados, de manera masiva plantean importantes cuestionamientos éticos, ya que se emplean para fines muy distintos de los que pretendía el usuario. Asimismo, la escala de los datos hace que también haya problemas a la hora de asegurar la replicabilidad y transparencia de los resultados, al estar sólo al alcance de unos pocos.
4
Acceso y propiedad los datos. Uno de los temas más peliagudos es el de la propiedad de los datos. Prácticamente toda la actividad que realizamos en la web y que en ella queda grabada, la realizamos en plataformas privadas que a su vez comercializan con nuestros datos de navegación y publicación, por tanto, hay un importante incentivo por su parte para no dejarnos realizar este tipo de análisis, lo que limita la capacidad del sector público de estudiar fenómenos sociales desde la óptica computacional.
Gary King, Jennifer Pan, and Margaret E. Roberts. 2014. “Reverse-engineering censorship in China: Randomized experimentation and participant observation.” Science, 345, 6199, Pp. 1-10
Arroyo-Machado W, Torres-Salinas D, Herrera-Viedma E, Romero-Frías E (2020) Science through Wikipedia: A novel representation of open knowledge through co-citation networks. PLoS ONE 15(2): e0228713. https://doi.org/10.1371/journal.pone.0228713
Arroyo-Machado, W., Torres-Salinas, D. & Robinson-Garcia, N. Identifying and characterizing social media communities: a socio-semantic network approach to altmetrics. Scientometrics 126, 9267–9289 (2021). https://doi.org/10.1007/s11192-021-04167-8
🕹️Vamos a jugar con Vosviewer🕹️
En este caso se trata de un programa de visualización de datos de uso libre y gratuito. Aquí os dejo el video 🎬 para que descarguéis e instaléis el programa. Tened en cuenta que es necesario tener Java instalado. Una vez esté instalado vamos a hacer los siguiente ➡️ 1) Descargar a través de la API de OpenAlex las publicaciones de Dani y hacer un perfil temático (0000-0001-8790-3314) - 2) Importar este set de datos y hacer un mapa de co-palabras con las palabras clave - 3) Crear un mapa de co-palabras a través de este corpus de títulos
En los siguientes mini videos te presentamos cómo instalar Bibliometrix. Bibliometrix es un paquete de R y por tanto, necesitamos instalar primero este software así como su interfaz gráfica RStudio.
☣️IMPORTANTE☣️ Para que todo funcione, deberás seguir el mismo orden que te pongo aquí ➡️ 1) Instalar R - 2) Instalar RStudio - 3) Instalar Bibliometrix
Aquí os dejo un manual molón que hizo Dani hace unos años para que veáis todas las opciones disponibles. Hoy veremos sólo algunas de ellas.
Una vez instaléis Bibliometrix y lo carguéis al medio de RStudio, arrancad Biblioshiny 🫧
> biblioshiny()
Ahora vais a descargar este set de datos que contiene publicaciones sobre desinformación de 2023. Debería incluir 909 registros.
Vamos a explorarlo 🤤
Esta aplicación está creada por los mismos que Bibliometrix, pero aún no está del todo desarrollada. Vamos a ver qué nos dice el bueno de Massimo sobre ⬅️cómo obtenerla 👀. También se accede a través de RStudio.
Una vez cargada la interfaz vamos a explorar algunas de sus funcionalidades. Ten en cuenta de que aún puede dar fallos... 🙈