Nuestra capacidad de modelar parámetros en CMR depende de la estructura de los datos, incluyendo:
El periodo de tiempo (si la población se considera cerrado o abierto)
El número y tipo de capturas y reencuentros
Inclusión de efectos de grups o covariables
Tipo y número de parámetros y los característicos de cualquier modelización de la variación en los parámetros que deseamos
Cualesquiera otros supuestos específicos que deseamos hacer sobre los parámetros
Voy a cubrir aquí algunas ideas elementales en CMR inferencia, ilustrados con 2 de nuestras estructuras de datos importantes:
Abundancia Cerrado CMR
CMR abierto bajo supuestos Cormack-Jolly-Seber
Los parámetros, las estructuras de los datos, y los modelos alternativos
CMR Cerrado
Nuestros modelos de CMR para poblaciones cerradas generalmente tienen 2 tipos de parámetros:
Abundancia (N), que es nuestro principal parámetro de interés
Las probabidades de captura (p) y recaptura (c) , relacionados con el modelado del process de detección (captura)
Los datos son historias de encuentro (captura) de los animales individuales que han sido capturados una o más veces. Estos suelen resumirse en una matriz con filas para los individuos y las columnas para las ocasiones de captura, por ejemplo
10001
01001
00001
denota hay 3 animales que han sido capturados, el primero en ocasiones 1 y 5, el segundo 2 y 5, y el tercero, hasta el 5. Así que, en general, habrá n * k elementos, siendo n el número de diferentes animales capturados y k = el número de ocasiones de captura.
Vamos a utilizar los datos y uno o más modelos que contienen supuestos alternativos sobre la variabilidad de los parámetros para obtener los valores estimados de N, p y c utilizando máxima verosimilitud (y más tarde métodos bayesianos) . Si tenemos un solo estrato, entonces N es una sola constante, pero p y c pueden variar con el tiempo o con respecto a la captura previa de un individuo. Los muchos modelos posibles, aquí están algunas de ellas:
p y c diferente (por lo recapturar mayor o menor que la captura inicial), pero constante durante los 5 ocasiones
p = c y constante
p y c variable en el tiempo y diferente
p = c pero variable en el tiemp
CJS
Aunque los datos parecen superficial de los mismos, supuestos CJS son en realidad muy diferente a la CMR cerrado por 2 razones:
La población se supone abierto entre períodos de muestreo
El análisis se concentra sólo en los animales que han sido marcados previamente. Por esa razón la abundancia ya no se estima (ya que requiere información sobre los animales no marcados)
El enfoque es de la estimación y modelización de las probabilidades de supervivencia entre los períodos (Phi) y probabilidades de recaptura (p), por lo que estos son los tipos de parámetros 2
Al igual que con estimación de la abundancia que utilizamos los datos y la máxima verosimilitud de obtener inferencias sobre phi y p, bajo supuestos alternativos sobre cómo varían. por ejemplo
phi y p tanto constante
constante phi, pero p varía en el tiempo
p constante, sino que phi varía en el tiempo
efectos de grupos o covariables para phi y / o p
Distribuciones y verosimilitud
Aunque vamos a utilizar muchos métodos en los que los cálculos se realizan en un "caja negra", es importante conocer algunos conceptos básicos y la terminología. En primer lugar, nuestros datos de CMR son generalmente van a ser modelado como se hayan derivado de determinadas distribuciones estadísticas, en particular la distribución binomial o la multinomial. Por ejemplo, si hay N animales en una población y tomamos una muestra de la captura, el número n obtenemos en una muestra al azar se considera como un resultado binomial con probabilidad p de una muestra de N. Una función de verosimilitud por otro lado se supone que hemos recogido los datos (decir una lista de historias de captura) y luego pregunta: bajo nuestro modelo asumido, ¿cuál es el valor más probable de N (y p, c, y otros parámetros)? Obtenemos valores estimados encontrando valores de N y otros parámetros que maximizan la función de verosimilitud (de ahí que se conoce como las estimaciones de máxima verosimilitud o MLE).
Selección del modelo y de multi-modelo de inferencia
Por definición, el MLE son los valores que maximizan la función de verosimilitud , pero lo hacen asumiendo un modelo, y por lo tanto los valores estimados serán diferentes entre diferentes modelos. Esto plantea la cuestión de cuál valor estimado o combinación de los valores estimados deben ser utilizados para la inferencia, y no es trivial: la selección de un modelo demasiado complejo producirá valores estimados con mala precisión, pero un modelo demasiado simple puede dar lugar a valores estimados sesgados. Vamos a utilizar un estadístico basado en la verosimilitud llamada el Criterio de Información de Akaike o AIC para equilibrar la complejidad del modelo y la parsimonia. Nos utilizado AIC en 2 maneras:
A veces para seleccionar uno (o unos pocos) los modelos de uso exclusivo en la inferencia, pero
Más comúnmente, a un promedio de más de varios modelos, para retener información sobre el modelo de la incertidumbre en el cálculo de las varianzas e intervalos de confianza.
Usaremos AIC y un enfoque de inferencia de modelos múltiples para la práctica totalidad de nuestra CMR análisis, así que por favor familiarizarse con él.
Simulación de datos
A pesar de que suena como una herramienta reservada para los frikis, la simulación es en realidad un poderoso medio de tanto la comprensión de su modelo, así como la visualización de los datos que debe ser similar, si los supuestos del modelo son "verdaderos". La idea básica es simple, ilustrado para una población cerrada con 3 ocasiones de muestra:
Suponemos que los datos legítimamente podrían surgir de un determinado conjunto de supuestos, por ejemplo N = 100 y constante probabilidad de captura de p = 0.3 por muestra ocasión
Tratamos a la población como es conocido y para cada uno de los N = 100 individuos extraer una muestra de la distribución supuesta (en este caso, una de Bernoulli o binomial con n = 1 y p = 0.3). En este ejemplo, el código sería x <-rbinom (3,1,0.3) para 3 repeticiones de una binomial = 1 p = 0.3
Se resulta en captura (x [i] = 1) o sin captura (x = 0) en cada ocasión
Repetimos esto para cada "animal" en la población (n = 100 veces)
Cada línea de datos (las x) se utiliza como una historia de captura
A continuación, podemos utilizar estos datos para estimar N y p bajo nuestro modelo
Siguiente: Ejercicios de repaso