Data Science con R: paquetes Tidyverse (June 18 to 22)

Prof. J. Corral (Project manager at Datancia y UPC) y K. Langohr (UPC), Language: Castellano. AFTERNOON: 3.00 to 6.00 pm.

Título del Curso

Data Science con R: el conjunto de paquetes Tidyverse

 

Profesorado

Jesús Corral, jesus.corral@upc.edu, y Klaus Langohr, klaus.langohr@upc.edu

Jesús Corral es ingeniero de caminos, canales y puertos por la Universitat Politècnica de Catalunya (UPC) y máster en estadística e investigación operativa (MESIO, UPC-UB). Trabaja como consultor en la empresa de ingeniería Optim Asipu y como profesor asociado en el Departamento de Estadística e Investigación Operativa de la UPC.

Klaus Langohr es Licenciado en Estadística por la Universidad de Dortmund (Alemania) y Doctor por la Universitat Politècnica de Catalunya (UPC). Trabaja como profesor en el Departamento de Estadística e Investigación Operativa de la UPC y colabora con el Programa de Investigación en Neurociencias del Instituto Hospital del Mar de Investigaciones Médicas.

 

Idioma del curso

Castellano 

 

Programación del curso

Del 18 al 22 de Junio, de 15:00 a 18:00h.

 

Descripción

Tidyverse es el nombre que se ha dado al conjunto de paquetes desarrollados o apoyados por Hadley Wickham para manipulación y ordenación de datos. Todos ellos están diseñados para trabajar juntos y comparten una misma filosofía, que se puede consultar en “The tidy tools manifesto”. Los cuatro principios básicos en los que se basa son:

  • Reutilizar las estructuras de datos
  • Resolver problemas complejos combinando varias piezas sencillas
  • Utilizar la programación funcional
  • Diseñar para humanos

Los paquetes incluidos en el Tidyverse tienen como objetivo cubrir todas las fases del análisis de datos dentro de R: importar datos, ponerlos en formato ordenado (tidy), buscar relaciones entre ellos (mediante su transformación, visualización y creación de modelos) y comunicar los resultados. Además de los paquetes principales que realizan estas funciones, al instalar el Tidyverse también se proporcionan otros que ayudan a trabajar con fechas, cadenas de caracteres o factores siguiendo los mismos principios.

 

Objetivos

El objetivo principal es presentar a los estudiantes una metodología para que sean capaces de gestionar y analizar datos utilizando los paquetes incluidos en el Tidyverse. Durante el curso se va a visualizar, transformar y modelar varios conjuntos de datos en R y se aprenderá a trabajar con diferentes formatos de datos desordenados.

 

Programa del curso

    • Introducción a los paquetes de Tidyverse
    • Importar datos con readr
    • Tidy Data con tidyr
    • Visualización de datos con ggplot2
    • Transformación de datos con dplyr
    • Tipos de datos: lógicos, strings, factores y fechas (stringr, forcats y lubridate)
    • Modelos estadísticos (modelr, broom) e iteración (purrr)

     

    Prerrequisitos

    Los participantes deben de tener conocimientos básicos de R, ya que no se trata de un curso de introducción a R.

      

    Evaluación

    A lo largo del curso, los estudiantes tendrán acceso gratuito a varios contenidos de Datacamp. Se propondrán una serie de problemas de esta plataforma para poner en práctica los paquetes y las técnicas presentadas en el curso. La evaluación se basará en estos problemas.

     

    Aula

    PC2