Celem kursu jest zaznajomienie studentów z zaawansowanymi metodami przetwarzania danych oraz ich wykorzystaniem podczas prowadzenia projektów typu Data Science.
Kurs składa się z trzech części: wykładu, laboratorium i projektu.
Wykłady i laboratoria są powiązane ze sobą tematycznie w formie modułów. Moduły dotyczą modelu tabelarycznego dla hurtowni danych oraz szeroko rozumianych zagadnień przetwarzania danych w środowisku rozproszonym Hadoop.
Projekt jest poświęcony narzędziom i metodykom prowadzenia projektów typu Data Science i jest prowadzony w formie projektu grupowego.