Community Challenge 2021
bit.ly/tfcol-reto2021
bit.ly/tfcol-reto2021
Conocer la demografía económica de un país o una región es fundamental para poder entender la dinámica de su sociedad, establecer políticas y programas de crecimiento, entender su impacto, necesidades de mejora, etc. Si bien existen esfuerzos de recolección de datos a distintos niveles (www.antioquiadatos.gov.co , www.gov.co , www.wto.org y muchas más) su actualización y niveles de agregación dependen de factores que en muchas ocasiones limitan su utilización a escenarios muy globales.
Con este challenge queremos desarrollar, como comunidad, procesos de analítica que permitan entender nuestra sociedad de manera dinámica y detallada, y ponerlos a disposición de quien desee utilizarlos.
Queremos reponder a la siguiente pregunta
¿Podemos obtener una idea de la distribución del comercio en una ciudad, región o zona a través de imágenes de Google Street View?
Detectar qué tipo de comercios están presentes en una ubicación de Google Street View
Adquirir una experiencia integral en la construcción de un proyecto deep learning, no solo en la generación de modelos.
Fomentar el trabajo colaborativo dentro de la comunidad.
Enriquecer la hoja de vida de los participantes.
Este challenge no se va a limitar a desarrollar modelos, sino que trabajaremos conjuntamente para crear el dataset que vamos a utilizar y, posteriormente, crearemos modelos sobre el mismo. Tanto el dataset como los modelos generados serán un producto valioso para quien quiera seguir investigando y trabajando en este área.
Con esto, la comunidad trabajará a la vez de manera colaborativa (para crear un dataset) y competitiva (para desarrollar soluciones).
En esta fase los equipos participantes trabajarán conjuntamente para construir el dataset que vamos a utilizar:
A cada equipo se le darán dos zonas a etiquetar de alguna parte comercial de una ciudad de colombia, en forma de polígono sobre Google Maps.
Cada equipo tendrá que etiquetar imágenes en 200 localizaciones de cada zona que el propio equipo escogerá al azar dentro de las zonas asignada.
La misma zona será entregada a dos equipos. Cada equipo tendrá que revisar las anotaciones del otro equipo e interaccionar para corregirlas y consolidarlas.
A los participantes se les entregará un protocolo de anotación (resoluciones de las imágenes, etiquetas, forma de entrega, etc.)
En esta fase cada equipo desarrollará su solución
El dataset conformado se partirá entre entrenamiento y test de manera proporcional entre todas las zonas etiquetadas por los equipos
Cada equipo tiene que entregar un csv con sus predicciones y un notebook reproducible con su solución.
No se podrán usar datos previos (p.ej. registros de cámaras de comercio, datos etiquetados por mi equipo, etc.)
Los notebooks han de ser ejecutables en notebooks sobre una sola sesión de Google Colab con los límites de la versión gratuita (incluyendo todo el proceso: preprocesado, entrenamiento, etc. pero no la búsqueda de hiperparámetros)
Se usará el promedio de Hamming distances [Wikipedia] entre vectores binarios de todas las localizaciones.
Los notebooks con todas las submisiones se publicarán para la revisión y aprendizaje por parte del resto de los equipos.
Para ser considerado, un equipo ha de participar en AMBAS la Fase 1 y la Fase 2
Se realizará una publicación científica describiendo el challenge, los resultados y publicando el dataset:
Será revisada y firmada por todos los participantes que enviaron etiquetas + soluciones (fase 1 + fase 2)
Se incluirá una versión pública del dataset anotado para que otros investigadores puedan trabajar sobre el mismo y referencien nuestro trabajo.
Tendremos un espacio en JURSE 2021 https://www.eafit.edu.co/jurse2021 para presentar nuestros resultados como comunidad y los tres primeros clasificados presentarán sus soluciones.
Los tres equipos con mejor desempeño una vez consolidados los resultados y revisadas las soluciones recibirán los siguientes premios.
Google Nest Hub para c/u del grupo.
Descuentos para curso Tensorflow en Harvard.
SWAG: Hoodie TF, Botella TF, Sticker TF, Pin TF, Bolsa TF.
Cupones para realizar el examen que certifica como desarrollador de TensorFlow para cada participante: https://www.tensorflow.org/certificate
Dos licencias para seleccionar cualquier curso de Tensorflow o Google Cloud Platform en Coursera
Cupones para realizar el examen que certifica como desarrollador de TensorFlow para cada participante: https://www.tensorflow.org/certificate
SWAG: Hoodie TF, Botella TF, Sticker TF, Pin TF, Bolsa TF.
Cupones para realizar el examen que certifica como desarrollador de TensorFlow para cada participante: https://www.tensorflow.org/certificate
Esta es la clasificación final del challenge.
En la siguiente carpeta de drive
https://drive.google.com/drive/folders/1-PNTrdUyQBqCdSRoFK2t0RmLL0A4sEDn
puedes encontrar:
los datos de train y test
las submisiones de cada equipo