El objetivo de este desafío es analizar los datos que leíste en el primer desafío utilizando los verbos de dplyr
.
Usá el proyecto que ya creaste y abrilo desde el explorador de archivos (haciendo doble click en el archivo .Rproj) o desde a interfaz de RStudio. Allí deberías tener tu archivo .Rmd donde ya leíste y describiste los datos. Corré el código para cargar esa base de datos en memoria y no te olvides de los paquetes necesarios!
Es posible que necesites alguna nueva variable, por ejemplo la suma entre otras dos columnas para calcular un total o la diferencia entre otras dos. La clave será usar la función mutate()
(como viste en esta sección) y ya que estamos aplicá otro verbo de {dplyr} para seleccionar esas nuevas columnas y mostrarlas (fijate acá si necesitás refrescar la memoria).
Hacé cada operación en un chunk separado explicando en el texto qué hace cada paso, por qué y qué esperás encontrar.
Ahora calculá un promedio o determiná el valor máximo o mínimo de alguna columna usando summarise()
. Si tu base de datos tiene alguna variable con categorías, también probá hacer los mismos cálculos pero agrupando las observaciones (viste esto en esta sección).
Podés analizar los datos tanto como se te ocurra, la idea es que te familiarices con los verbos de {dplyr} al mismo tiempo que sacas información de la base de datos que estás utilizando.