Sesión Estadística y sus Aplicaciones

Diciembre 15, 16:30 ~ 16:50

Estudio de modelos para analizar ocurrencia y co-ocurrencia de especies

BERGESIO, Andrea

En Ecología es de interés estudiar la interacción entre especies que integran una misma comunidad. Dicha interacción entre especies puede ser inferida a partir de datos de presencia/ausencia, observando si la cantidad de veces que co-ocurren se desvía de lo esperado por azar. Se han desarrollado modelos probabilísticos para testear la significancia estadística que un par de especies co-ocurran (\cite{E10}). Sin embargo, una asociación positiva o negativa no necesariamente implica una interacción directa entre ellas, ya que puede haber otra especie que las relacione, o también puede deberse a condiciones ambientales o a su distribución espacial. En este contexto, el problema de presencia/ausencia se puede plantear como un modelo de regresión multivariada con respuesta binaria (\cite{E03}). Sin embargo, cuando el número de especies ($m$) es grande, el vector respuesta tiene tiene $2^m$ posibles estados lo que hace dificultoso su trato. Una solución práctica a este problema es modelar solo las asociaciones de a pares, e incorporar las asociaciones de orden más alto a través de alguna estructura en el modelo (\cite{E08},\cite{E06}). Uno de los primeros objetivos de nuestro estudio es introducir modelos lineales generalizados (en especial Bernoulli multivariado) para el análisis estadístico de datos de presencia/ausencia de especies. Aunque técnicamente más complicados de estudiar, estos modelos parecerían ser más adecuados para el tratamiento estadístico. Otro factor a considerar es que el estudio clásico de regresión lineal generalizada multivariada es para datos independientes y los En general estos tipos de datos han sido modelados utilizando modelos de variables latentes (\cite{E08}, \cite{E07}, \cite{E09}). datos empíricos de presencia/ausencia no lo son ya que, en general, los mismos presentan correlación espacial o bien temporal. Posibles extensiones al modelo Bernoulli multivariado para incorporar el factor espacial es otro de los objetivos de nuestro estudio. Presentaremos además ventajas en la interpretación y la visualización de los datos cuando un modelo Bernoulli multivariado es utlizado, así como también en el hecho de incorporar penalidades LASSO (\cite{E01}). Esto nos conduce a la estimación de una estructura de grafos donde los nodos representan las especies y las aristas el grado de relación entre ellas. \begin{thebibliography}{99} t\bibitem{E01} Cheng, J., Levina, E., Wang, P. and Zhu, J. (2014), A sparse ising model with covariates. Biom, 70: 943-953. t\bibitem{E03} Dai, B.; Ding, S.; Wahba, G. (2013), Multivariate Bernoulli distribution. Bernoulli 19 , no. 4, 1465--1483. t\bibitem{E06} O'Brien, S.,Dunson, D. (2004), Bayesian Multivariate Logistic Regression. Biometrics, Vol. 60, No. 3, pp. 739-746. t\bibitem{E07} Ovaskainen, O., Abrego, N., Halme, P. and Dunson, D. (2016), Using latent variable models to identify large networks of species-to-species associations at different spatial scales. Methods Ecol Evol, 7: 549-555. t\bibitem{E08} Ovaskainen, O., Hottola, J. and Siitonen, J. (2010), Modeling species co-occurrence by multivariate logistic regression generates new hypotheses on fungal interactions. Ecology, 91: 2514-2521. t\bibitem{E09} Ovaskainen, O., Roy, D. B., Fox, R. and Anderson, B. J. (2016), Uncovering hidden spatial structure in species communities with spatially explicit joint species distribution models. Methods Ecol Evol, 7: 428-436. t\bibitem{E10} Veech, J. A. (2013), A probabilistic model for analysing species co-occurrence. Global Ecology and Biogeography, 22: 252-260. \end{thebibliography}

Autores: BERGESIO, Andrea / MARCOS, Miguel / FORZANI, Liliana / GIRI, Federico.