De cómo clasificar en géneros a las canciones

Theo Alkibiades

En esta mentoría vamos a usar diversas herramientas para obtener features tanto textuales de las letras de las canciones (con técnicas de PLN) como del audio de estas (usando la API de Spotify) para intentar encasillarlas dentro de un género musical mediante un clasificador.

En la parte de análisis y visualización vamos a usar estos datos para descubrir qué es lo que distingue y hace especial a cada género y a cada artista.

Por último vamos a aprender a implementar modelos de aprendizaje supervisado y no supervisado desde lo más básico hasta algo medianamente complejo.

Este tema es interesante porque…

  • En general despierta el interés de la gente.

  • Se puede aplicar a algo que hacemos todos los días como escuchar música y a algo que nos gusta, como un género o una banda en particular

  • Este trabajo involucra el aprendizaje y uso básico de varios frameworks y APis de Python como sklearn, keras, pandas, numpy y Spotify, junto con embeddings de BERT en la tarea más compleja.

  • Se trabajará con gráficos y análisis poco convencionales, por ejemplo:

  • La primera intención va a ser trabajar sólo con canciones en español, salvo que los alumnos o la situación sugieran que trabajemos en inglés.

Trataremos de responder algunas de las siguientes preguntas:

  • ¿A qué género pertenece una canción?

  • ¿Cómo se distinguen entre sí los géneros?

  • ¿Y los artistas?

  • ¿Qué es lo que hace más exitosos, dentro del mismo género, a ciertos grupos respecto a otros?

Los datos

http://millionsongdataset.com/tasteprofile/

http://millionsongdataset.com/secondhand/index.html#getting

Hitos de la mentoría

22/6 práctico de análisis y visualización

19/7 práctico de análisis y visualización

16/8 práctico de introducción al aprendizaje automático

13/9 práctico de aprendizaje supervisado

27/9 práctico de aprendizaje no supervisado

6/11/2020 – 7/11/2020 presentación de mentorías