Big Data: Desafíos para la estadística

Título del curso: Big Data: Desafíos para la estadística

Impartido por: Pedro Delicado, Dept. Estadística i Investigació Operativa, UPC.


Pedro Delicado es licenciado en Matemáticas (U. Complutense de Madrid, 1990) y doctor en Economía (U. Carlos III de Madrid, 1995). Profesor de la Universitat Pompeu Fabra (1995-2000) y actualmente de la UPC. Su docencia se ha centrado principalmente en probabilidad, estadística matemática y estadística no paramétrica. Sus principales temas de investigación son estadística no paramétrica, análisis de datos funcionales, reducción de la dimensionalidad y estadística espacial, con aplicaciones en demografía y análisis de datos electorales. Autor de más de 30 artículos científicos, ha (co-)dirigido 4 tesis doctorales y ha sido investigador principal de 4 proyectos de investigación competitivos. Vicedecano (Jefe de Estudios de Estadística) de la Facultad de Matemàtiques i Estadística (UPC) entre 2009 i 2012. En 2010 obtuvo las acreditaciones de Catedrático de Universidad de la ANECA y de Recerca Avançada de la AQU.


Idioma
del curso: Español

Calendario y horarios: 4, 7 y 8 de julio; tardes de 15 a 20 h


Lugar: aula 002 y PC2 (dia 07/07/2014 aula PC1)

Tipo de actividad i carga lectiva: Curso de 15 horas.

Descripción:

 

En este curso se analiza el impacto que el reciente auge de los Big Data tiene en la Estadística. Se intentará dar respuestas a preguntas como las siguientes: ¿En qué se diferencian los Big Data de los conjuntos de datos tradicionales? ¿Qué implicaciones tienen estas diferencias en la forma de hacer Estadística con Big Data? ¿Qué puede aportar la Estadística al análisis de Big Data y por qué estas aportaciones tienen un valor diferencial? Se hará un recorrido por trabajos (artículos científicos, software) recientes en el campo de la Estadística dedicados al análisis de Big Data.


Programa:


  • Características de los Big Data: Volumen, Velocidad, Variedad.
  • Métodos estadísticos tradicionales adaptados  a Big Data. Ejemplos: Regresión, Reducción de la dimensión, bootstrap.
  • Aportaciones del muestreo estadístico al análisis de Big Data.
  • Estadística para datos no estructurados. Ejemplos: Análisis de datos textuales, estadística basada en distancias.
  • Aportaciones de la Estadística al análisis de datos en tiempo real. Ejemplos: control estadístico de procesos, inferencia secuencial.
  • Herramientas de R para Big Data.



Metodología: Se combinarán sesiones expositivas y prácticas.

Evaluación:


El alumnado deberá realizar uno de los dos trabajos siguientes:

  • El análisis de un conjunto de Big Data real.
  • El estudio en profundidad de un artículo científico sobre Big Data.