Data Science con R: Tidyverse

 

Título del curso

Data Science con R: Tidyverse.

 

Profesorado

Jesús Corral, , y Klaus Langohr,

Jesús Corral es ingeniero de caminos, canales y puertos por la Universitat Politècnica de Catalunya (UPC) y máster en estadística e investigación operativa (MESIO, UPC-UB). Trabaja como consultor en la empresa de ingeniería Optim Asipu y como profesor asociado en el Departamento de Estadística e Investigación Operativa de la UPC.

Klaus Langohr es Licenciado en Estadística por la Universidad de Dortmund (Alemania) y Doctor por la Universitat Politècnica de Catalunya (UPC). Trabaja como profesor en el Departamento de Estadística e Investigación Operativa de la UPC y colabora con el Programa de Investigación en Neurociencias del Instituto Hospital del Mar de Investigaciones Médicas.


Idioma del curso

Castellano.


Programación del curso

Grupo 1:Del 3 al 7 de Julio de 10 a 13.

Grupo 2:Del 3 al 7 de Julio de 15 a 18.


Descripción

Tidyverse es el nombre que se ha dado al conjunto de paquetes desarrollados o apoyados por Hadley Wickham para manipulación y ordenación de datos. Todos ellos están diseñados para trabajar juntos y comparten una misma filosofía, que se puede consultar en “The tidy tools manifesto”. Los cuatro principios básicos en los que se basa son:

  • Reutilizar las estructuras de datos
  • Resolver problemas complejos combinando varias piezas sencillas
  • Utilizar la programación funcional
  • Diseñar para humanos

Los paquetes incluidos en el Tidyverse tienen como objetivo cubrir todas las fases del análisis de datos dentro de R: importar datos, ponerlos en formato ordenado (tidy), buscar relaciones entre ellos (mediante su transformación, visualización y creación de modelos) y comunicar los resultados. Además de los paquetes principales que realizan estas funciones, al instalar el Tidyverse también se proporcionan otros que ayudan a trabajar con fechas, cadenas de caracteres o factores siguiendo los mismos principios.

 

Objetivos

El objetivo principal es presentar a los estudiantes una metodología para que sean capaces de gestionar y analizar datos utilizando los paquetes incluidos en el Tidyverse. Durante el curso se va a visualizar, transformar y modelar varios conjuntos de datos en R y se aprenderá a trabajar con diferentes formatos de datos desordenados.


Programa del curso

  • Introducción a los paquetes de Tidyverse
  • Importar datos con readr
  • Tidy Data con tidyr
  • Visualización de datos con ggplot2
  • Transformación de datos con dplyr
  • Tipos de datos: lógicos, strings, factores y fechas (stringr, forcats y lubridate)
  • Modelos estadísticos (modelr, broom) e iteración (purrr)


Evaluación

A lo largo del curso, los estudiantes tendrán acceso gratuito a varios contenidos de Datacamp. Se propondrán una serie de problemas de esta plataforma para poner en práctica los paquetes y las técnicas presentadas en el curso.


Prerrequisitos

Los participantes deben de tener conocimientos básicos de R, ya que no se trata de un curso de introducción a R.


Aula

Grupo 1: PC2

Grupo 2: 100