Modelos Aditivos Generalizados y extensiones. Aplicaciones en Biomedicina - July 5th to July 9th

Date:

From July 5th to July 9th . Afternoon, from 3.00 to 6.00 pm

Classroom:

002

Modality:

Face-to -Face or Streaming

Instructor

María Carmen Cadarso-Suárez

Carmen Cadarso-Suárez, es Catedrática de Bioestadística de la Universidad de Santiago de Compostela. Actualmente dirige el grupo de investigación interdisciplinar, de referencia competitiva, Bioestadística y Ciencia de Datos Biomédicos.

Es autora de artículos de impacto en Estadística, en Medicina y en Computación. Una de sus principales líneas de investigación se centra en los Modelos Aditivos Generalizados, y su aplicación en el ámbito biomédico.

Desde hace años, es investigadora Principal de proyectos nacionales en Estadística.. Actualmente es coordinadora de la red interdisciplinar de Bioestadística, BIOSTATNET. Desde hace unos años se interesa por la transferencia de la Bioestadística a la sociedad, liderando proyectos FECYT para promover la vocación bioestadística entre los más jóvenes.

Cuenta con una dilatada experiencia docente en diversos doctorados y másteres de Estadística y de Biomedicina, particularmente en el tema de modelos de regresión flexible y sus aplicaciones.

Language

Castellano

Description

Los Modelos Aditivos Generalizados (Generalized Additive Models, GAM) son modelos de regresión que están ganando gran popularidad en la práctica debido a su flexibilidad, su versatilidad, y su interpretabilidad en una gran variedad de estudios reales en diversas disciplinas (Medicina, Biología, Economía,…), La existencia de paquetes estadísticos potentes de uso libre (fundamentalmente en R) implementando dichos modelos, facilita enormemente que los GAM puedan tranferirse con rapidez a la investigación aplicada.

El Modelos Aditivo Generalizado (GAM) fue propuesto por Hastie y Tibshirani, 1990) como una extensión del Modelo Lineal Generalizado (GLM, McGullagh y Nelder, 1989), introduciendo efectos suaves (no lineales) de las covariables continuas en la respuesta de interés (de la familia exponencial). El proceso de suavización en GAMs se lleva a cabo a través de los suavizadores (smoothers), entre los que destacan, entre otros, los Splines penalizados P-Splines.
Desde 1990, fueron muchos los avances metodológicos que se han realizado en los procesos de estimación e inferencia de los modelos GAM. Hoy en día podemos encontrar excelentes monografías (p.e., Wood, 2017) revisando la teoría y aplicaciones de los GAM y algunas extensiones de interés, como pueden ser las versiones flexibles de la regresión basada en: modelos mixtos (GAMM), estadística espacio-temporal, datos funcionales, o en modelos de supervivencia con datos censurados.

Recientemente, también se han propuesto otro tipo de extensiones interesantes basadas en los modelos GAMLSS (Generalized Additive Models for Location, Scale and Shape, Rigby .Stasinopoulos, 2017). Los GAMLSS asumen que la respuesta tiene una distribución que puede pertenecer una amplia familia más allá de la exponencial (no normales, asimétricas, con varianza no constante…) y los parámetros de dicha distribución (de posición, escala y forma) pueden ser modelados de forma flexible,y cada uno de forma independiente.

En este curso se formularán los modelos de regresión GAM y GAMLSS, y se describirán algunos paquetes de R, como el mgcv y gamlss, implementando dichos modelos. Finalmente, se realizarán diversas aplicaciones prácticas, utilizando para ello bases de datos reales, fundamentalmente del ámbito biomédico.

Referencias
Hastie, TJ, Tibshirani, RJ. Generalized Additive Models. Chapman and Hall: London, 1990.
McCullagh, P., Nelder, J.A. Generalized Linear Models, 2nd ed. Chapman and Hall: London, 1989.
Stasinopoulos, MD, Rigby, RA, Heller, GZ, Voudouris V, De Bastiani F (2017). Flexible regression and smoothing: Using GAMLSS in R. Chapman and Hall/CRC the R Series, 2017.
Wood, SN. Generalized Additive Models: An Introduction with R, Second Edition (Chapman & Hall/CRC Texts in Statistical Science), 2017.

Course goals

Aprender los conceptos básicos sobre técnicas de suavización en regresión.
Dotar al alumnado de los conocimientos sobre los modelos GAM.
Saber utilizar paquetes diversos estadísticos en R, como el mgcv o el gamlss, para el ajuste de los modelos GAM y extensiones.
Saber interpretar y presentar correctamente los resultados obtenidos en la aplicación de un modelo GAM a datos reales biomédicos.

Course contents

Introducción
Modelo Lineal (LM). Modelo Lineal Generalizado (GLM)
Regresión flexible

Regresión polinómica
Regresión polinómica “local”:
Splines de Regresión (regression splines). B-Splines.

Técnicas de suavización en regresión.

Concepto de Suavizador (Smoother).
Regresión Spline Penalizada.

Modelo Aditivo Generalizado (GAM)

Algoritmos de estimación
Inferencia
Software: paquete mgcv

Extensiones del modelo GAM

Modelo de Supervivencia Aditivo de Cox
Regresión distribucional: GAM para localización, escala y forma (GAMLSS).

Aplicaciones a datos biomédicos

Prerequisites

Conocimientos básicos de técnicas de regresión.
Conocimientos básicos de R

Targeted at

Alumnado de Master y doctorado en Estadística, y de otras titulaciones como Biología o Medicina.

Evaluation

El sistema de evaluación se comentará el primer día de clase

Computer class or student's laptop?

Student's laptop

Software requirements

Software libre: R versión R-4.0.5 o superior

Paquetes de R: mgcv, gamlss.