BASES
BASES
Concurso de Análisis y Visualización de Datos RSME-NTT Data
Descripción del Concurso
El concurso de Análisis de Visualización de Datos RSME-NTT Data nace de la voluntad de la Real Sociedad Matemática Española (RSME) en fomentar y promover la Ciencia Matemática y sus aplicaciones en la educación española, en este caso en el nivel universitario. Los datos están cada vez más presentes en todos los sectores de la sociedad.El análisis y la visualización de datos es una disciplina que combina conocimientos matemáticos y estadísticos para transmitir información rigurosa, veraz y libre de sesgos, y también conocimientos de comunicación y psicología, para transmitir ideas de manera efectiva.
Con este concurso, la RSME promueve desarrollar capacidades para el tratamiento y comunicación de datos entre jóvenes que pronto se incorporarán al mercado laboral. Las capacidades que se promueven y valoran en el concurso, ayudan a la comprensión de realidades complejas, a mejorar la toma de decisiones, y por supuesto a alimentar algoritmos de inteligencia artificial. Ser capaz de analizar conjuntos de datos, extraer información relevante y presentarla de manera intuitiva y rigurosa para su comprensión es un conocimiento particularmente valioso.
El concurso de Análisis de Visualización de Datos consiste en realizar un análisis de un Dataset proporcionado para el concurso, seguido de una presentación visual de las conclusiones obtenidas del análisis
Un ejemplo de gráfico con un efecto social importante ha sido el gráfico de “palo de hockey” sobre el calentamiento global.
La Real Sociedad Matemática Española es una institución sin ánimo de lucro que tiene entre sus fines el desarrollo de las matemáticas en España mediante la promoción de su investigación, la difusión en la sociedad y la mejora de la educación matemática en todos sus niveles. Sus finalidades principales son divulgar la calidad y los progresos de la matemática, promocionar su enseñanza y su aprendizaje, transmitir a la sociedad su importancia y ser una referencia en todo lo relativo a las ciencias y a las tecnologías
matemáticas.
¿Quién puede participar?
La participación en el concurso está abierta a equipos de 1 a 3 personas con alumnos de grado o de master. Para participar en el concurso los equipos interesados deberán registrarse y subir la documentación en la página web del concurso a partir del 29 de abril y antes del 31 de mayo de 2024.
Se recomienda que los equipos incluyan personas con diferentes capacidades, por ejemplo miembros con más conocimientos de estadística o ciencia de datos, otros con más conocimiento específico sobre el tipo de datos (economía y comercio), y otros con mejor conocimiento de comunicación visual, diseño gráfico, etc.
Descripción del dataset
El conjunto de datos escogido para la competición es la base de datos de UNCTAD (United Nations Conference on Trade and Development), disponibles en el siguiente enlace:
https://unctadstat.unctad.org/datacentre/
En dicho repositorio se encuentran tablas de datos económicos, demográficos, sociales y de comercio referentes a muchos países sobre un largo periodo de tiempo. Los datos tienen por tanto estructura espacial y temporal.
La manipulación de datos habrá de incluir la selección de los ficheros adecuados, limpieza y agrupamiento de datos, combinación de datos de diferentes tablas, etc.
Es posible realizar modelos predictivos o proyecciones a futuro como parte del tratamiento matemático-estadístico, basados en los datos de UNCTAD.
Se podrá enriquecer la base de datos con información externa, siempre que los datos externos no superen el 25% de los datos utilizados para el proyecto. En tal caso, se deberá hacer notar la procedencia de dichos datos citando la fuente original en la documentación entregada.
Mecánica del concurso
El objetivo de la competición es la creación de un póster en formato A2 con diversas visualizaciones de datos que refleje una realidad compleja, transmitiendo ideas de manera visualmente atractiva y convincente, y matemáticamente rigurosa, soportado sobre los datos de UNCTAD.
El dataset del concurso está disponible para descargar en la web. Los concursantes habrán de escoger qué tipo de sector quieren investigar, familiarizarse con los datos, formular preguntas relevantes y realizar operaciones sobre los datos para abordar dichas preguntas.
Si los datos tienen estructura geográfica, tendrán que investigar visualizaciones originales, si tienen variables categóricas, agregaciones que aporten información relevante, correlaciones entre variables, proyecciones de evolución futura, etc.
Se habrá de aportar evidencia del código desarrollado para justificar las manipulaciones realizadas sobre los datos, incluyendo la carga, limpieza, procesamiento, etc. aunque el jurado valorará principalmente el resultado final.
Los participantes habrán de entregar los siguientes documentos antes del 31 de mayo de 2024 a través de un formulario en la página web del concurso.
Un póster en formato PDF con la calidad necesaria para ser impreso en formato A2.
Enlace al código comentado en python, R, etc. que contenga todas las operaciones de manipulación de datos (por ejemplo, un notebook de jupyter, RStudio, etc.).
Enlace a un vídeo, de un minuto de duración como máximo, colgado en YouTube y explicando el póster subido.
Documentación adicional (en un único PDF):
Autorización de cada uno de los alumnos y alumnas menores de edad firmada por ellos y sus padres/madres/tutores legales, descargable aquí, con una fotocopia de sus DNIs y fotocopia del libro de familia.
Documento de cesión de derechos de propiedad intelectual a favor de RSME y NTT.
Criterios de valoración
Se valorarán los siguientes aspectos:
Rigor y capacidad técnica en el análisis y manipulación de datos para extraer información relevante.
Composición visual del poster, claridad en la comunicación de ideas basadas en datos.
Storytelling: relevancia e interés de las preguntas abordadas.
Originalidad. Trabajos en los que se detecte plagio total o parcial no serán considerados por el tribunal evaluador.
Tribunal evaluador
El tribunal del concurso estará compuesto por profesionales en el ámbito de las matemáticas, la ciencia de datos y la comunicación científica.
Premios
El 7 de junio 2024 se harán públicos los tres proyectos finalistas. La adjudicación de premios se hará posteriormente en un acto público, anunciado con suficiente antelación, en el que se desvelará que proyecto obtiene el primer premio, dotado con 1000€ y cuáles son galardonados con el segundo (500€) y tercero (250€).