Data Science con R: paquetes Tidyverse - July 1st to 5th

Date:

July 1st to 5th. Morning, 9:00 AM to 12:00 PM

Classroom:

PC2

Instructors

Jesús Corral

Ingeniero de caminos, canales y puertos por la Universitat Politècnica de Catalunya (UPC) y máster en estadística e investigación operativa (MESIO, UPC-UB). Trabaja como Project manager en Datancia y como profesor asociado en el Departamento de Estadística e Investigación Operativa de la UPC.

Klaus Langohr

Licenciado en Estadística por la Universidad de Dortmund (Alemania) y Doctor por la Universitat Politècnica de Catalunya (UPC). E profesor agregado en el Departamento de Estadística e Investigación Operativa de la UPC y colabora con el Programa de Investigación en Neurociencias del Instituto Hospital del Mar de Investigaciones Médicas.

Language

Castellano

Description

Tidyverse es el nombre que se ha dado al conjunto de paquetes desarrollados o apoyados por Hadley Wickham para manipulación y ordenación de datos. Todos ellos están diseñados para trabajar juntos y comparten una misma filosofía, que se puede consultar en "The tidy tools manifesto". Los cuatro principios básicos en los que se basa son:

  • Reutilizar las estructuras de datos
  • Resolver problemas complejos combinando varias piezas sencillas
  • Utilizar la programación funcional
  • Diseñar para humanos

Los paquetes incluidos en el Tidyverse tienen como objetivo cubrir todas las fases del análisis de datos dentro de R: importar datos, ponerlos en formato ordenado (tidy), buscar relaciones entre ellos (mediante su transformación, visualización y creación de modelos) y comunicar los resultados. Además de los paquetes principales que realizan estas funciones, al instalar el Tidyverse también se proporcionan otros que ayudan a trabajar con fechas, cadenas de caracteres o factores siguiendo los mismos principios.

Course goals

El objetivo principal es presentar a los estudiantes una metodología para que sean capaces de gestionar y analizar datos utilizando los paquetes incluidos en el Tidyverse. Durante el curso se van a visualizar, transformar y modelar varios conjuntos de datos en R y se aprenderá a trabajar con diferentes formatos de datos desordenados.

Course contents

  • Introducción a los paquetes de Tidyverse
  • Importar datos con readr
  • Tidy Data con tidyr
  • Visualización de datos con ggplot2
  • Transformación de datos con dplyr
  • Tipos de datos: lógicos, strings, factores y fechas (paquetes stringr, forcats y lubridate)
  • Iteración (purrr)
  • Lazy evaluation

Prerequisites

Los participantes deben de tener conocimientos básicos de R, ya que no se trata de un curso de introducción a R.

Targeted at

Estudiantes y profesionales que usan R de forma regular y que quieren ampliar sus conocimientos de este software.

Evaluation

A lo largo del curso, los estudiantes tendrán acceso gratuito a varios contenidos de Datacamp. Se propondrán una serie de problemas de esta plataforma para poner en práctica los paquetes y las técnicas presentadas en el curso. La evaluación se basará en estos problemas.

Computer class or student's laptop?

Student's laptop

Software requirements

R, RStudio