Sesión Estadística y sus Aplicaciones

Diciembre 14, 16:10 ~ 16:30

Estimación Robusta en Modelos Parcialmente Lineales de Índice Simple

Statti, María Florencia

\thispagestyle{plain} Los modelos semiparamétricos combinan la facilidad de interpretación de los modelos lineales con la flexibilidad de los modelos no paramétricos, y en las últimas décadas estos modelos han recibido una creciente atención dado su potencial en numerosas aplicaciones. En esta familia de modelos se encuentran los \textit{Modelos Parcialmente Lineales de Índice Simple} (\textsc{MPLIS}), en los que la variable de respuesta $y$ se relaciona con dos vectores de covariables $\mathbf{x}$ y $\mathbf{z}$ mediante la ecuación \begin{eqnarray} \label{modelo} y &=& \boldsymbol{\beta}_0^t \mathbf{x} + \eta_0(\boldsymbol{\theta}_0^t\mathbf{z})+ \sigma_0 \epsilon \, , \end{eqnarray} donde $(\mathbf{x},\mathbf{z}) \in \mathbb{R}^p \times\mathbb{R}^q$. Tanto la función real univariada $\eta_0$ como el vector de parámetros $(\boldsymbol{\beta}_0, \boldsymbol{\theta}_0) \in \mathbb{R}^p \times\mathbb{R}^q$ y el parámetro \textsl{nuisance} $\sigma_0$, son desconocidos. Con el propósito de que el modelo sea identificable, se supone que $\|\boldsymbol{\theta}_0\|=1$, ya que por el hecho de ser $\eta_0$ desconocida, sólo la dirección del vector $\boldsymbol{\theta}_0$ puede ser reconocida, y además supondremos, sin pérdida de generalidad, que la primera componente de $\boldsymbol{\theta}_0$ es positiva. En el tratamiento clásico del problema de estimación e inferencia en estos modelos, además se supone que $\mathbb{E}(\epsilon |(\mathbf{x},\mathbf{z}))=0$ y $\mathbb{E} (\epsilon^2 |(\mathbf{x},\mathbf{z}))< \infty$. Estos modelos poseen un gran potencial en el caso de regresión múltiple no paramétrica, pues logran reducir la dimensión del vector $\mathbf{z}$ a la del í ndice univariado $\boldsymbol{\theta}_0^t\mathbf{z}$, evitando la \emph{maldición de la dimensionalidad}, y al mismo tiempo capturan una posible relación no lineal a través de la función $\eta_0$. La mayoría de los métodos clásicos de estimación, inferencia y selección de variables están basados en procedimientos que son muy sensibles a la presencia de datos atípicos. Por este motivo, es necesario contar con procedimientos robustos que protejan de una minoría de datos anómalos que puedan tener gran influencia sobre las estimaciones y los métodos de inferencia. Proponemos un procedimiento de estimación robusta, es decir resistente ante datos anómalos, que extiende los estimadores de Boente y Rodrí guez (2012), introducidos para modelos parcialmente lineales generalizados, a los modelos \textsc{MPLIS} con parámetro \textsl{nuisance} desconocido, $\sigma_0$, en nuestro caso. La metodologí a propuesta está basada en el \textit{método de perfiles robustos}, por lo tanto mediante el uso de un procedimiento de perfiles, se definen estimadores robustos de los parámetros involucrados usando un algoritmo de tres pasos. Este procedimiento requiere el cálculo de un estimador inicial de $(\boldsymbol{\beta}_0,\boldsymbol{\theta}_0,\sigma_0)$ que, como en Bianco y Boente (2004), se basa en un estimador local robusto de posición para $\eta_0$ a partir del cual se calcula un $S-$estimador para el resto de los parámetros. Bajo condiciones de regularidad, obtenemos la consistencia de los estimadores de $\boldsymbol{\beta}_0, \eta_0, \boldsymbol{\theta}_0$ y $\sigma_0$ para el caso en que el estimador inicial sea un estimador consistente, pudiendo utilizar cualquiera de los estimadores iniciales mencionados, ya que resultan ser consistentes. Para evaluar el desempe\~no de los estimadores propuestos para muestras finitas, se realizaron estudios de simulación en distintas condiciones. Como se trata de estimadores robustos, se consideraron varios escenarios de contaminación con el objetivo de verificar su robustez.

Autores: Statti, María Florencia / Bianco, Ana M..