Budeme se věnovat zejména analýze dat "tidy" přístupem - tedy pomocí knihoven shrnutých do balíku tidyverse. Během všech částí projdeme kompletně celou oblast manipulace s daty a vizualizace - od úplných začátků po pokročilé metody. Na konci seminářů sami uvidíte, kolik práce si zjednodušit jednoduchými operacemi v R oproti spreadsheet nástrojům, jako například Excel.
Většina kurzů učí R klasickým způsobem. Moderní způsob pomocí balíku tidyverse je mnohem jednodušší pro začátečníky, jelikož nevyžaduje takové znalosti datových struktur v jazyce R. Navíc lze pomocí něj vytvářet analýzy a grafy mnohem snadněji s mnohem čitelnějším kódem. Proto se v tomto semináři zaměřujeme zejména na skupinu knihoven, které patří do tohoto balíku: dplyr, tidyr, purrr, ggplot2, ...
Jednotlivé části semináře na sebe obsahově navazují. Doporučujeme proto, aby se zájemci přihlásili na všechny semináře zároveň, není to však podmínkou.
Pro koho je seminář určen:
✔ Datoví analytici, jejichž každodenním chlebem je Excel a/nebo SQL.
✔ Studenti, kteří zpracovávají data pro svoji bakalářskou, nebo diplomovou práci.
✔ Všichni, kdo chtějí změnit svoje zaměření na datovou analytiku, nebo data science.
✔ Lidé bez zkušeností s jazykem R, kteří mají nějakou zkušenost s některým z nástrojů pro práci s daty: Excel, SQL, nebo Python.
✔ Mírně a středně pokročilí v R, kteří dosud nevyužívali knihovnu tidyverse.
❗Část II :
➖ Agregování skupinových dat (dplyr)
➖ Vizualizace skupinových dat (ggplot2)
➖ Funkcionální programování (purrr)
➖ Načítání dat z SQL (dbplyr)
Těšíme se na Vás!