Datasets y mirrors

Los datasets son conjunto de datos que comparten alguna relación entre sí. Estamos, cada vez, rodeados de montañas de datos, pero sin un análisis de estos, no podemos decir casi nada. Una cosa son los datos y otra la información o el conocimiento. Analizando datos obtenemos información, y asimilando la información llegamos al conocimiento, con el que podemos seguir avanzando.


Me gusta trabajar con grandes cantidades de datos, el problema es que a veces son demasiado grandes y los experimentos no salen bien ; )


La siguiente es una colección de datasets y recopilatorios de datos que voy encontrando por Internet.

Seguiré ampliando la lista: ftp://ftpdatos.aemet.es/ (comunicado), AT at IA

Otras webs y blogs que tratan el tema de los datasets:

Mirrors

Generalmente uso Webcite para almacenar una copia de páginas concretas que me interesan, aunque a veces es un sitio completo el que merece la pena. En esos casos intento bajármelos con wget u otros métodos. Aquí se listan algunas webs que quiero conservar por ser de un gran valor (estoy trabajando en ello).

Véase también Archive Team en Internet Archive o su host local.


Minería de datos

Comments