Data Science con R: Tidyverse
Título del curso
Data Science con R: Tidyverse.
Profesorado
Jesús Corral, jesus.corral@upc.edu, y Klaus Langohr, klaus.langohr@upc.edu
Jesús Corral es ingeniero de caminos, canales y puertos por la Universitat Politècnica de Catalunya (UPC) y máster en estadística e investigación operativa (MESIO, UPC-UB). Trabaja como consultor en la empresa de ingeniería Optim Asipu y como profesor asociado en el Departamento de Estadística e Investigación Operativa de la UPC.
Klaus Langohr es Licenciado en Estadística por la Universidad de Dortmund (Alemania) y Doctor por la Universitat Politècnica de Catalunya (UPC). Trabaja como profesor en el Departamento de Estadística e Investigación Operativa de la UPC y colabora con el Programa de Investigación en Neurociencias del Instituto Hospital del Mar de Investigaciones Médicas.
Idioma del curso
Castellano.
Programación del curso
Grupo 1:Del 3 al 7 de Julio de 10 a 13.
Grupo 2:Del 3 al 7 de Julio de 15 a 18.
Descripción
Tidyverse es el nombre que se ha dado al conjunto de paquetes desarrollados o apoyados por Hadley Wickham para manipulación y ordenación de datos. Todos ellos están diseñados para trabajar juntos y comparten una misma filosofía, que se puede consultar en “The tidy tools manifesto”. Los cuatro principios básicos en los que se basa son:
- Reutilizar las estructuras de datos
- Resolver problemas complejos combinando varias piezas sencillas
- Utilizar la programación funcional
- Diseñar para humanos
Los paquetes incluidos en el Tidyverse tienen como objetivo cubrir todas las fases del análisis de datos dentro de R: importar datos, ponerlos en formato ordenado (tidy), buscar relaciones entre ellos (mediante su transformación, visualización y creación de modelos) y comunicar los resultados. Además de los paquetes principales que realizan estas funciones, al instalar el Tidyverse también se proporcionan otros que ayudan a trabajar con fechas, cadenas de caracteres o factores siguiendo los mismos principios.
Objetivos
El objetivo principal es presentar a los estudiantes una metodología para que sean capaces de gestionar y analizar datos utilizando los paquetes incluidos en el Tidyverse. Durante el curso se va a visualizar, transformar y modelar varios conjuntos de datos en R y se aprenderá a trabajar con diferentes formatos de datos desordenados.
Programa del curso
- Introducción a los paquetes de Tidyverse
- Importar datos con readr
- Tidy Data con tidyr
- Visualización de datos con ggplot2
- Transformación de datos con dplyr
- Tipos de datos: lógicos, strings, factores y fechas (stringr, forcats y lubridate)
- Modelos estadísticos (modelr, broom) e iteración (purrr)
Evaluación
A lo largo del curso, los estudiantes tendrán acceso gratuito a varios contenidos de Datacamp. Se propondrán una serie de problemas de esta plataforma para poner en práctica los paquetes y las técnicas presentadas en el curso.
Prerrequisitos
Los participantes deben de tener conocimientos básicos de R, ya que no se trata de un curso de introducción a R.
Aula
Grupo 1: PC2
Grupo 2: 100
Share: