Jazyky pre dátovú analytiku

Cieľ predmetu

Získanie znalostí a praktických zručností pri analýze a návrhu algoritmického riešenia definovaných typových úloh analýzy dát v rámci štatistického nástroja R a jazyka Python, ich rozšírení a balíkov. Cieľom je ovládať základy jazykov R a Python, ich dátových typov a prvkov jazyka, základy systému R a vývojárskeho nástroja RStudio, vybraného vývojového prostredia Python (napr. JupyterLab), vedieť spracovávať vstupné dáta, produkovať výstupy v podobe vhodných vizualizácií a naučiť sa pracovať s rozšíreniami ako Rshiny, Rmarkdown, Jupyter Notebook a ďalšie. Absolvent by mal byť pripravený využiť nadobudnuté znalosti základov R a Python pri pokračovaní v štúdiu na ďalších predmetoch venovaných analýze dát.

Garant predmetu

doc. Ing. Peter Butka, PhD. – prednášky

Ďalší vyučujúci

Ing. Viera Maslej Krešňáková – cvičenia

Ďalšie informácie k predmetu

Predmet je vyučovaný v programe Hospodárska informatika, 2.ročník Bc štúdia, letný semester.

Aktuálne informácie k organizácii predmetu, prezentácie prednášok a materiály k cvičeniam sú sprístupňované v systéme Moodle, predmet (kurz) Simulačné systémy v HI, prihlásenie do kurzu sa realizuje na prvom cvičení, prípadne mimo predmetu je možné s požiadavkou kontaktovať garanta predmetu.

Linka na stránku materiálov k prednáškam a cvičeniam

Rozsah

1h prednášky (realizované v dvojhodinových jednotkách raz za cca 2 týždne) + 2h cvičenia

Hodnotenie

100 bodov(%), z toho 60 skúška (min. 31 pre úspešné absolvovanie skúšky) a 40 zápočet (min. 21 na zápočet). Skúška pozostáva z riešenia úloh v jazykoch R a Python (obe časti po 30 bodov, pričom z každej časti je potrebné získať aspoň 15 bodov), celkovo je možné za skúšku dosiahnuť 60 bodov.

- v prípade, že dosiahnutý súčet bodov z predmetu po úspešnej skúške (za skúšku aspoň 31 bodov) je na hornej hranici známky tak, že chýba na získanie lepšej známky 1, nanajvýš však 3 body, študent môže požiadať o  doskúšanie -  za túto časť je možné získať maximálne 3 body

– v prípade neúspešnej skúšky (menej ako 31), pri dosiahnutí aspoň 28 bodov (čiže 28-30 za skúšku), takisto je možnosť absolvovať doskúšanie pre zmenu na 31 bodov za skúšku

Podmienky zápočtu

- maximálne 3 vymeškané cvičenia
- úspešné absolvovanie 2 písomiek (práca na úlohách v  jazykoch R a Python, každá za 20 bodov)
- celkovo je potrebné dosiahnuť 21 bodov 

Osnova predmetu

- Základné prvky štatistického systému (nástroja) R a jazyka Python
- Základy jazyka R a Python - dátové typy, funkcie, operátory, premenné, vektory, matice, príkazy pre vetvenie programu, cykly
- Načítanie dát v R a jazyku Python, predspracovanie dát, čistenie a transformácie dát
- Využitie existujúcich balíkov (funkcií) a návrh vlastných funkcií
- Vizualizácia dát v R a v jazyku Python
- Použitie Rmarkdown a Jupyter notebook pre reproducibilitu experimentov a reportovanie výsledkov analýzy dát
- Použitie Rshiny pre vytváranie web rozhrania dátovo-analytických aplikácií

Literatúra

- Chambers, J.M: Software for Data Analysis: Programming with R. Springer, New York, 2008.
- Knell, R.J.: Introductory R: A Beginner's Guide to Data Visualisation and Analysis using R, 2013.
- Xie, Y.: Dynamic Documents with R and knitr. Chapman & Hall/CRC, 2013.
- McKinney, W.: Python For Data Analysis, 2nd edition. O'Reilly Media, 2017.
- Ceder, N.: The Quick Python Book, Third Edition. Manning Publications, 2018.

Softvér

R - https://www.r-project.org/

RStudio - https://www.rstudio.com/

Python - https://www.python.org/

Jupyter - https://jupyter.org/