Introducción al análisis de Datos Composicionales
Título del curso
Introducción al análisis de Datos Composicionales.
Profesorado
- Maribel Ortego. Sección de Matemática Aplicada y Estadística del Departamento de Ingeniería Civil y Ambiental, Universitat Politècnica de Catalunya-BarcelonaTECH.
Maribel Ortego es Licenciada en Matemáticas y Diplomada en Estadística por la Universitat Autònoma de Barcelona (UAB) y Doctora por la Universitat Politècnica de Catalunya (UPC). Trabaja en problemas relacionados con el tratamiento de datos composicionales. Otras de sus áreas de interés son la modelización de sucesos de tipo extremo y la modelización de la dependencia entre variables mediante funciones cópula.
- Jesús Corral. Departamento de Estadística e Investigación Operativa, UPC.
Jesús Corral es Ingeniero de Caminos, Canales y Puertos por la Universitat Politècnica de Catalunya. Trabaja en la modelizacion de sucesos de tipo extremal, sobretodo en aplicaciones de Ingeniería Marítima. Su investigación actual aplica técnicas de tipo composicional a la modelización de esos fenómenos de tipo extremos.
- Juan José Egozcue. Profesor emérito. Sección de Matemática Aplicada y Estadística del Departamento de Ingeniería Civil y Ambiental, UPC.
Juan José Egozcue es Catedrático en la Universitat Politècnica de Catalunya. En la actualidad posee el reconocimiento de Profesor Emérito. Sus áreas de interés en investigación son diversas. Cabe destacar su trabajo en el desarrollo de las estructuras para la modelización de los datos composicionales, así como técnicas y herramientas para su mejor tratamiento e interpretación. Junto a V. Pawlowsky-Glahn, son el referente mundial actual en el área composicional.
Idioma del curso
Castellano.
Programación del curso
Del 26 al 28 de Junio de 10 a 14, El 29 de Junio de 10:00 a 13:00h.
Descripción
Los datos composicionales son vectores que muestran la importancia relativa de las partes de un todo. Ejemplos típicos son datos en porcentajes, en ppm, ppb, o similares, frecuentes en muchos campos de la ciencia, como las geociencias, ciencias ambientales, biología, medicina y ciencias sociales. El análisis estadístico clásico de este tipo de datos presenta múltiples problemas, entre ellos el de correlación espúrea. Como solución a dichos problemas, J. Aitchison introdujo el enfoque log-cociente en los años ochenta. Desde entonces, se ha progresado en la comprensión de la geometría del espacio muestral, el símplex de D partes. El curso tiene por objetivo introducir a los asistentes a los principios y métodos básicos del análisis de datos composicionales, a como aplicar los mismos con programario específico (CoDaPack y R), y como interpretar los resultados obtenidos. El curso combina clases teóricas con el análisis práctico de datos.
Programa del curso
- Día 1: Los datos composicionales; principios; equivalencia composicional; espacio muestral; geometría de Aitchison en el símplex. Práctica: Presentación de datos en el ternario (CoDaPack); correlación espúrea; iniciación a R-compositions; tratamiento de datos en el ternario.
- Día 2: Coordenadas composicionales (clr, ilr, SBP). Estadística elemental (variabilidad, centro, total variance). Distribución Normal en el símplex. Práctica: cálculo e interpretación de la matriz de variación y las coordenadas clr, ilr en R y CoDaPack.
-
Día 3: Análisis exploratorio (variation array, biplot). Práctica: Cálculo e interpretación de variation array y biplot.
-
Diseño de coordenadas. Regresión con respuesta composicional. Práctica: Cálculo e interpretación del CoDa-dendograma. Aplicación de regresión con respuesta composicional.
Evaluación
El alumnado realizará trabajo no presencial al final de cada sesión, a fin de consolidar los contenidos de la misma. La evaluación se basará en las entregas de estas tareas no presenciales.
Pre-requisitos recomendados
- Análisis estadístico univariado.
- Conocimientos básicos de estadística multivariante.
- Cursos introductorios de álgebra y cálculo.
- Experiencia con software standard: MS-Excel, SPSS, Minitab, R o similar.
Software utilizado
Se utiliza software libre:
-
CoDaPack 2.02.04 (Marc Comas: Marc.Comas@udg.edu) se utiliza en el curso y se complementa con MS-Excel.
-
compositions (en R) (Raimon Tolosana: r.tolosana@hzdr.de; Gerald van den Boogaart: boogaart @math.tu- freiberg.de).
-
rob-Compositions (en R) (Matthias Templ: Matthias.Templ@gmail.com).
-
zCompositions (en R) (Josep Antoni Mart´ın-Fern´andez: josepantoni.martin@udg.edu; Javier Palarea-Albaladejo: javier@bioss.sari.ac.uk).
Material suplementario
Material descargable de http://www.compositionaldata.com
- Apuntes del curso (Lecture notes - en inglés).
-
CoDaPack 2.02.04.
Aula
Próximamente.
Share: