Cuando nos hablan del procesamiento de datos en lo primero que piensas son números, cifras, técnicas estadísticas, conclusiones cuantitativas, etc. Pero también hay que tener en cuenta que hay mucho más que eso. Dos de las explotaciones de datos que más se estan usando en los últimos tiempos son el análisis de textos y el análisis de redes sociales.
El análisis de textos hace referencia al análisis de contenidos escritos sin ningún tipo de estructura. Se calcula que aproximadamente el 80% de la información en una empresa suele estar almacenada en forma de documentos. Este campo es muy amplio, por lo que técnicas como la categorización de texto, la extracción y recuperación de datos o información, el procesamiento de lenguaje natural o el aprendizaje automático entre otras cosas apoyan el análisis de textos.
El segundo campo que veremos sera el análisis de redes sociales o estructuras de grafos. Esto es mucho más que el análisis de redes sociales entendido como análisis de contenido de Social Media. Es un estudio algebráico, numérico de una representación de conocimiento a partir de un grafo. Un campo que mezcla las matemáticas y la sociología, en el que hay actores o entidades que interactuan y representando todas estas acciones con un grafo.
El interés por estudiar la estructura y los patrones que esconden esta representación de nodos y aristas a crecido en los últimos años ya que se ha visualizado un gran crecimiento en la cantidad de agentes. Es decir, a medida que han crecido las redes sociales, ha crecido la influencia de una persona en otro por ejemplo para comprar lo que ha causado que las redes de proovedores y clientes aumenten y es asi como crece el ineterés por estudiar que patrones pueden descubrirse para incrementar la inteligencia del negocio.
¿Qué nos puede aportar un grafo, una red social, y su análisis a nuestros intereses?
Las redes sociales pueden definirse como un conjunto definido de actores como pueden ser grupos, individuos, organizaciones, comunidades, entre otros. Estos actores están vinculados entre si por una relación o un conjunto de relaciones sociales. El análisis de estos vínculos puede ser usado para interpretar comportamientos sociales de los distintos implicados. Esto es lo que ahora es denominao como Análisis de Redes Sociales o ARS.
Dentro del ARS se encuentra la sociometría, su fundador la describió como:
“La sociometría tiene por objeto el estudio matemático de las propiedades psicológicas de las poblaciones; con este fin utiliza una técnica experimental fundada sobre los métodos cuantitativos y expone los resultados obtenidos por la aplicación de estos métodos. Persigue así una encuesta metódica sobre la evolución y la organización de los grupos y sobre la posición de los individuos en los grupos”.
Usando herramientas interactivas se puede visualizar y analizar toda clase de redes y sistemas complejos, grafos jerárquicos y dinámicos. Es decir, hacer sociometría. Este tipo de herramientas nos permitirá obtener diferentes métricas, que podemos clasificar en tres niveles:
1.- Nivel global de un grafo:
Coeficiente de agrupamiento: nivel de agrupamiento de los nodos, así se sabe como de integrados están los nodos.
Camino característico: mide como de separados están los nodos, para ver como de alejados estan y buscar como juntar más la relación entre agentes/actores.
Densidad: un grafo puede ser denso (muchas aristas) o disperso (pocas aristas).
Diámetro: el máximo de las distancias entre un par de nodos.
Grado medio: numero de conexiones a otros nodos que tiene un grafo.
Centralidad: para indicar los nodos que tienen mayor cantidad de relaciones.
2.- Nivel de comunidad (grupo de nodos dentro de un grafo):
Comunidades: para conocerse a uno mismo y a otros, en general a los grupos que viven procesos similares.
Puentes entre comunidades: para llevar a cabo planes de actuación y marketing.
Centros locales: para saber los nodos que son mas centrales y críticos frente a los que no lo son.
3.- Nivel nodo (propiedades de un influenciador):
Centralidad: métrica de poder.
Modularidad: medida de la estructura de redes o grafos.
Intermediación: capacidad de un nodo en obtener una posición intermediaria en las comunicaciones.
Pagerank: algoritmo que le da un valor numérico a cada nodo y mide su conectividad
Closeness: como de fácil es llegar a los otros vértices.