Learning from Data: Una aproximación basada en R


Título del Curso

Learning from Data. Una aproximación basada en R.


Profesorado

Esteban Vegas, Ferran Reverter. Departament de Genètica, Microbiologia i Estadística, Universitat de Barcelona. evegas@ub.edu, freverter@ub.edu.

Esteban Vegas Lozano es doctor en Biología en el programa de Probabilidades y Estadística por la Universitat de Barcelona (UB). Trabaja como profesor titular del Departament d'Estadística de la UB. El trabajo de investigación se centra en visualización, análisis e integración de diversas fuentes de datos ómicas usando técnicas multivariantes y de machine learning.

Ferran Reverter, investigador postdoc (Grup: Computational Biology of RNA Processing, Laboratori: R. Guigó) al Centre de Recerca Genòmica i Professor Associat de la Secció d'Estadística del Departament de Genètica, Microbiologia i Estadística de la UB. Recerca en l'àmbit de la visualització i interpretació dels models estadístics basats en distàncies i, en particular, en funcions de nucli (kernel methods). Acreditació de professor lector y acreditació de “Recerca” per l’Agència per la Qualitat del Sistema Universitari de Catalunya. Professor del Curs de Machine Learning en el Summer School del MESIO UPC-UB (anys 2013 i 2014).


Idioma del curso

Castellano.


Programación del curso

Del 4 al 8 de Julio, de 15 a 18h.


Descripción

En este curso se presentarán algunas de las metodologías del Machine Learning (ML) usadas en el aprendizaje estadístico supervisado. El curso se iniciará con una sesión introductoria de los conceptos generales (curse of dimensionality, regularización, métodos kernel, modelos sparse, cross validación…). A continuación, se dedicarán tres sesiones al aprendizaje supervisado centrándonos en las metodologías de los SVM, LASSO y Random Forest, respectivamente. En la última sesión del curso los estudiantes resolverán un caso práctico combinando las diversas técnicas desarrolladas en las sesiones anteriores.

 

Programa del curso

Sesión 1: Introducción al Machine Learning.

Sesión 2: SVM. Métodos Kernel.

Sesión 3: LASSO.

Sesión 4: Random Forest.

Sesión 5: Resolución de un caso práctico.

 

Metodología

El curso es eminentemente práctico, al principio de cada sesión se expondrá el método ML y a continuación, el alumno aplicará y desarrollará esta técnica usando R con unos datos. De tal manera que el alumno se familiarice con la técnica en el entorno R.


Evaluación

El alumnado deberá elegir una de las dos opciones siguientes:

a) El análisis de un conjunto de datos de su interés que requiera el uso de técnicas presentadas en el curso.

b) La resolución completa del caso práctico presentado en la última sesión.


Aula

100