Hay dos formatos disponibles para entra los datos de recuperación al programa MARK. El más general es el formato llamdo LDLD (live-dead-live-dead) que es disponible tanto en MARK como en RMark. En esto formato hay dos columnas para cada período de recuperación. La primera signífica que si (1) o no (0) el animal fue observado vivo durante el período. Para los datos de recuperación 1 es solo aplicable durante el periódo de la suelta. La segunda columna signífica si (1) o no (0) el animal fue recuperado durante el período, y es posible solo una vez pero incluso el período de la suelta (es decir un animal puede ser recuperado en el período o estación de caza inmediatemente después de la suelta). Por ejemplo
100100
signífica que el animal fue soltado en el período 1 y recuperado en el período 2. Este format es muy general y permite uso de covariables individuales, pero es ineficiente cuando hay muchos animales en el estudio y no hay covariables individuales.
El otro formato es un formato triangular que resume los datos en un table de frequencias donde las filas representan período de suelta, las columnas los períodos de recuperación, y las entradas son el número de animales de la suelta i recuperado en el período j. Ilustramos esta estructura abajo.
Vamos a utilizar la estructura de datos se resumida como entrada en el programa MARK, con el aspecto adicional de estratificación por grupos, utilizando un conjunto de datos para Patos Negros Americanos , adultos machos y hembras anillado 1989-1998 (10 años) y se recuperaron durante los mismos 10 años . Los datos se codifican en el formato de recuperación resumido de MARK, que es 1) una matriz de recuperación de anillos, seguida por 2) un vector de los números anilladas y liberadas en cada año. Lea estos datos en el programa MARK, asegurándose de utilizar la parametrización Brownie (abajo en la lista modelo de una maneras). Tenga en cuenta que en este ejemplo hay 10 ocasiones de encuentro (y 2 grupos, machos y luego las hembras). En general, el número de "ocasiones de encuentro 'corresponde a un problema de recuperación es el número de períodos de recuperación. En MARK la matriz de datos debe contener el mismo número de filas (ocasiones de captura) como columnas (ocasiones de recuperación). Cuando k> l esto se logra por la simple adición de 1 o más filas de ceros en la matriz de recuperación, y aumentando el vector de bandas por ceros.
Leí estos datos y corrí los 16 de los modelos PIM estándar; los análisis se almacenan en los archivos de proyecto MARK (ver archivo zip) que se puede abrir directamente en MARK (guardarlos en un directorio y luego abrirlos). Abrir y examinar la PIM para los S "globales" (g * t) modelo f (g * t). Las PIMs para las tasas de supervivencia de los machos y las hembras se verá de la siguiente manera:
Es decir, los 9 primeros parámetros son las tasas de supervivencia para los machos adultos para el primero, segundo, ... noveno intervalo (es decir, hay 10 años de las bandas, por lo que 9 intervalos), S1, S2, S3, .... ., S9. Estos parámetros son específicos de tiempo, pero no de cohorte (año de lanzamiento) específico, por lo que, por ejemplo, un animal lanzado en el año 3 tiene exactamente la misma tasa de supervivencia entre los años 5 y 6 (índice de parámetro 5) como una liberación en el año 1, ya que estos índices son los mismos en toda la columna (que representan años de supervivencia) para todas las filas (que representan años de liberación). Asimismo, los índices de supervivencia de las mujeres son indexados por 10 a 18.
De la misma manera, las tasas de recuperación para los hombres son indexados por los parámetros 19 a 28, y para las mujeres de 29 a 28 (una por cada año de bandas para cada sexo).
Este es el general o el modelo "global" que describe el tiempo-y el grupo (el sexo) - la supervivencia y la recuperación específico. Modelos de parámetros reducidos se pueden formar de forma automática (con la carrera | modelos predefinidos cuentan) o el uso de los PIM. Por ejemplo, la supervivencia se puede hacer el tiempo, pero no el sexo-específicas mediante el establecimiento de los primeros 2 PIMS iguales.
Otros modelos, incluyendo no los disponibles en el menú, se pueden crear mediante la manipulación del PIMS. Por ejemplo,
especifica que las tasas de supervivencia al año es constante durante los primero 5 años y desde hace 4 años, pero la hipótesis de que diferentes entre los 2 períodos.
Muchos modelos adicionales se pueden construir a partir de los PIM, pero algunos modelos requieren el uso de una matriz de diseño. Volver al modelo S (g * t) f "global" (g * t); recuperar este modelo, y obtener la matriz de "lleno" de diseño. Considere la porción de esta matriz relacionada sólo para la supervivencia en los 2 grupos (parámetros 1-18). Debería ver algo como esto:
donde la primera columna es una intersección (en la escala logit), el segundo un "efecto de grupo" (1 = machos, 0 = hembras, los próximos 8 columnas columnas son el tiempo (años) los efectos, y los últimos 8 columnas son del grupo * interacción año. al igual que con la versión de PIM de este modelo, que permite todas las combinaciones de tasas de supervivencia en el grupo * años, es decir, 18 la supervivencia, 9 para los hombres y 9 para las hembras. Sin embargo, puede ser posible para describir tanto el sexo-y tiempo específica variación supervivencia de una manera biológicamente significativa pero más simple. En particular, mientras que puede haber diferencias intrínsecas en la supervivencia masculina y femenina (por ejemplo, las mujeres tienen una menor supervivencia, debido al aumento del riesgo de depredación durante la anidación), hay otros factores que varían de año a año, como las condiciones meteorológicas, que debe afectar a hombres y mujeres por igual, uno la diferencia media entre el varón y la supervivencia femenina se contabiliza. Bajo un modelo de este tipo no habría siguen siendo de grupo y tiempo efectos, pero ningún grupo * interacción en tiempo . Este modelo está formado por la simple eliminación de la Sg1 * T1 - T8 * Sg1 columnas en la matriz anterior, produciendo
Se trata de un modelo en el que (en la escala logit) efectos de grupo son aditivos a los efectos del tiempo; un gráfico de las tasas de supervivencia transformado por logits con el tiempo parece paralelo para los 2 grupos (machos y hembras), con un grupo sistemáticamente por encima o por debajo de la otra.
Si hay pruebas (por ejemplo, sobre la base de la AIC) que este modelo funciona bien en comparación con el modelo más complejo, probablemente se debe utilizar para describir el tiempo y la variación del sexo en la supervivencia por 3 razones: 1) que tiene sentido biológico, a priori ; 2) es un modelo más simple, con menos parámetros, y 3) a menudo es más fácil de entender los efectos biológicos en la ausencia de interacción. La misma lógica puede ser cierto para las tasas de recuperación: si existen regulaciones de la caza específicas del sexo luego uno priori espera que las tasas de cosecha para un sexo a ser más altos o más bajos que los del otro sexo. Por lo tanto la construcción de modelos aditivos para los grupos tasa de recuperación de parámetros puede ser sensible, también.
Estimados promedio ponderado
Aunque un modelo S (g) f (t) es el líder indiscutible en cuanto a la AIC, usted todavía puede hacer promedio de modelo para tener en cuenta el modelo de selección de incertidumbre. Esto se hace mediante la selección de la barra de herramientas 'de salida / promedio de modelo / real "y la selección de los parámetros reales (S y f) que desea promediar.
Bondad de ajuste y QAIC
Antes de seguir adelante con la construcción de modelos y pruebas, es importante comprobar el "modelo global" para ver si se ajusta adecuadamente a los datos. MARK produce una estadística "desviación" que se puede utilizar como una medida de ajuste del modelo. Bajo la hipótesis nula de que el modelo se ajusta a los datos, la estadística sigue una distribución chi-cuadrado con grados de libertad (df) suministrados por la salida de MARK, y uno puede realizar una prueba de esta hipótesis nula por comparación con una tabla de chi-cuadrado . Sin embargo, un enfoque algo más útil se basa en el reconocimiento de que si el modelo se ajusta a los datos, en la teoría de la relación
c-hat = desviación / df,
que también se produce por MARK, debe ser igual a 1. En la práctica esta relación a menudo es superior a 1, incluso para los modelos en los que todas las fuentes de variación (por ejemplo, el tiempo, el grupo, la edad) son capturados por el modelo. Hay 2 posibles razones para esto. En primer lugar, se necesita un modelo aún más complejo para capturar la variación en los datos, es decir, hay heterogeneidad en la supervivencia, recuperación, o ambos que no está capturada por el modelo. Esto podría suceder cuando uno está utilizando un modelo de una sola edad inapropiada, cuando los animales jóvenes son parte de la muestra en libertad. La estratificación de los datos por edad y utilizando un modelo de 2 edades pueden resolver este problema. Sin embargo, incluso cuando se han modelado todas las formas identificables de la variabilidad es posible que el modelo multinomial básica todavía no captura adecuadamente reflejar la variabilidad en los datos, debido a lo que se conoce como "sobredispersión" o "variabilidad extra-biniomial". En cualquiera de los casos, los valores de la verosimilitud, el AIC, y las varianzas de los parámetros deben todos se ajustarán en consecuencia. Suponiendo que c-hat bastante representa esta "variabilidad extra-biniomial", las estadísticas anteriores se pueden ajustar con la marca, usando la herramienta de los "ajustes" en el navegador los resultados. Este ajuste produce lo que se conoce como un "cuasi verosimilitud" o la verosimilitud ajustada por el factor de inflación de la varianza, y de este "cuasi-AIC" o QAIC; varianzas estimadas y los intervalos de confianza también se ajustan. En el ejemplo de Pato Negro MARK produce una c-hat de 1,26, que debe ser usado como un ajuste. Cálculo de c-hat basado en el modelo de desviación a veces no es un reflejo exacto de la "variabilidad extra-biniomial", y existen alternativas basadas en el muestreo de arranque para la recuperación (Seber parametrización, ver más abajo) y algunos otros modelos de MARK. He realizado 1.000 simulaciones bootstrap bajo la f S (g * t) modelo (g * t) y se acercó con un c-hat promedio de 1.18. Dado que las simulaciones generan datos donde S (g * t) f (g * t) fue el modelo "verdadero", un cálculo más justa de la c-hat con base en los datos sería 1.26/1.18 = 1.07, que es el valor que recomendaría como un ajuste.
Parametrización de Seber
Para la comparación, también analicé estos datos bajo la parametrización Seber ( archivos de DBF y FPT). El modelo global es similar (pocas diferencias en las estimaciones puntuales y los valores de la verosimilitud), pero observe que la clasificación de los modelos es bastante diferente. Mi interpretación es que algunas de las variaciones que pertenece adecuadamente en el proceso de recuperación (f) está siendo arrojados a S; es común que las aves de caza como los patos tasa de supervivencia anual varía de menos de tasas de cosecha. Creo que la parametrización Brownie es mucho más razonable para este tipo de datos, en los que estamos tratando de separar limpiamente el proceso de recuperación (influyendo fuertemente por la cosecha ) de supervivencia global (que incluye la cosecha, así como otros factores).
Covariables
Dado que los modelos de recuperación son un caso especial de CJS, pueden generalizarse para incluir grupos múltiples, la estructura de edad (la próxima vez), y las covariables. Covariables por tiempo o individuales pueden ser incluidos en la matriz de diseño; tiempo covariables se ilustran a continuación.
Un ejemplo de una covariable tiempo -específico
Al igual que con los datos de destinos conocidos, la covariables tanto tiempo-específicas e individuales se pueden incorporar en el análisis de recuperación de banda. Como ejemplo, tenemos los datos de ánades hembras adultos durante 1966-1978 en las praderas de Canadá (véase la página 22 del capítulo 16 de Williams et al. 2002). Una relación negativa dependiente de la densidad se planteó la hipótesis entre las tasas de supervivencia y las densidades de cría (patos / estanque de patos); esta última estadística para cada uno de los años 1966 a 1977 (el último año sobre el que la supervivencia puede ser estimado) fue:
D = {0.978, 2.245, 1.268, 1.090. 1.336, 1.307, 2.260, 0.665, 0.890, 1.318, 2.116, 0.871}.
Leer los datos de recuperación de banda para estos ánades reales (13 ocasiones, 1 grupo, sin covariables individuales). Construir y ejecutar el f mundial S (g * t) (g * t). Luego recuperar la matriz de diseño para este modelo y obtener la matriz de "lleno" de diseño.
Formular el modelo de covarianza mediante la creación de una nueva matriz de diseño :
Construir un modelo adicional en el que la supervivencia es constante en el tiempo (ya sea mediante la eliminación de la columna 2 por encima de, o el uso de PIM); Finalmente, se combinan los distintos modelos de supervivencia con supuestos sobre la recuperación (f (t), f (.)) y encontrar un "mejor" modelo.
Covariables individuales serían manejados de una manera similar como con los datos conocidos sinos, que requiere el uso del formato de la historia encuentro LDLD para permitir de introducción de covariables individuales junto con las historias de encuentro
Como se notó anteriormente, RMark implementa tanto las parametrizaciones Seber y Brownie de modelos de recuperación. Sin embargo, RMark requiere que la entrada para historias de encuentros están únicos en formato LDLD, por lo que para usar RMark primero debemos convertir la matriz triangular en formato LDLD.
El script adjunto lee desde el archivo de datos del formato de MARK para machos y hembras de los Patos Negros Americanos, y crea un objeto de datos que sea compatible con RMark. La secuencia de comandos implementar una serie de modelos en RMark (incluyendo varias que yo no he creado en la GUI MARK), resume y produce un promedio de las estimaciones de supervivencia del modelo, y traza la estimación en el tiempo para machos y hembras.
Siguiente: Modelos de 2 edades en MARK y RMark