Análisis de datos en Eco-Epidemiología Espacial: más alla de P<0.05
Docentes Dr Fernando Abad-Franch (Centro de Pesquisas Rene Rachou, FioCruz-MG) y Dr David E Gorla (CONICET, Instituto Gulich)
CONTENIDO
Presentación: objetivos, estructura y metodología del curso. La estructura básica de los proyectos de investigación: Relevancia y contribución esperada, Preguntas: originalidad, importancia y viabilidad, Respuestas a priori: especificando hipótesis plausibles y sus predicciones, Poniendo a prueba las hipótesis: predicciones versus observaciones, Diseñando las pruebas: muestreo, variables, medidas, construcción de las bases de datos, datos previos. Estudios espaciales: Fuentes de datos espaciales, Tipos de variables espaciales y sus usos en estudios eco-epidemiológicos, Independencia versus autocorrelación (espacial y temporal), Análisis espacialmente explícitos: construcción de mapas, Presentación de estudios en desarrollo por parte de alumnos participantes
Explorando los datos: gráficos, tablas y estadística descriptiva. NHST – ‘Null-Hypothesis Significance Testing’. La ‘hipótesis nula’: significado, utilidad y limitaciones. Valores de P: diferencias “estadísticamente significativas”. Uso de NHST en estudios observacionales: una visión crítica. Transformación y estandarización de variables independientes. Tamaño del efecto: ‘odds ratio’ (OR), riesgo relativo (RR) y otras medidas de efecto. Precisión, incertidumbre y diferencias “estadísticamente significativas”: intervalos de confianza. Práctica: análisis exploratorio, extracción y análisis descriptivo/exploratorio de datos espaciales. Visualización de datos espaciales. Análisis de casos presentados por alumnos.
Especificación de modelos: correspondencias entre modelos e hipótesis. Modelos generalizados lineares (GLMs) para datos binarios y de conteo. Distribuciones binomial, Poisson y binomial negativa; funciones de ‘link’. Coeficientes: valores de β, ORs y RRs (y sus varianzas). Variables ‘offset’. Factores de confusión: coeficientes ‘ajustados’. Efectos aleatorios. Selección de modelos: técnicas ‘step-wise’, verosimilitud, complejidad, parsimonia y teoría de la información. Práctica: ajuste de GLMs para datos binarios y de conteo, usando datos espaciales. Visualización de las predicciones de los modelos. Análisis de casos presentados por alumnos.
Poder explicativo de los modelos y soporte de las hipótesis específicas asociadas. Importancia relativa de las covariables. Efectos medios ponderados y sus varianzas. Práctica: inferencia multi-modelo para datos binarios y de conteo, usando datos espaciales. Visualización de predicciones de modelos ajustados. Análisis de casos presentados por alumnos.
Procesos de observación y procesos biológicos. Muestreo repetido y modelos de ocupación de hábitat: potencial y limitaciones. Historias de detección. Probabilidad de detección (p) y probabilidad de ocupación (Ψ). Variación en p y variación en Ψ. Extensiones: otros modelos ‘mixtos’ con sub-modelos binarios. Práctica: análisis ‘final’, en grupo, de bases de datos (binarios y de conteo) proporcionadas por los docentes. Presentación y discusión de estudios en desarrollo por parte de alumnos participantes.
El curso se realizará en el Instituto Gulich (http://ig.edu.ar), en Falda de Cañete, entre la ciudad de Córdoba y Villa Carlos Paz
Los alumnos realizarán las prácticas en computadoras personales que deberán llevar al curso
Software que debe estar instalado en las computadoras personales
R (https://cran.r-project.org/)
RStudio (https://www.rstudio.com/). Instalar DESPUES de haber instalado R
============ Septiembre 26 2017 =====================
Después de instalar RStudio, instalar los siguientes paquetes R: dismo, car, boot, rgeos, maptools, MASS
La instalación de paquetes de R en RStudio se hace a) desde la solapa "Paquetes" (ventana derecha), b) click en "Instalar", c) escribir el nombre del paquete en la ventana apropiada aceptando las opciones por defecto
===================================================
QGIS (http://qgis.org). El link para ejecutar el programa es "QGIS Desktop" (se instalan varias aplicaciones QGIS)
===================================================
datos modelo distribución ATENCION, al script AGREGAR library(rgdal)