Warsztat badacza danych

2021L

Kod przedmiotu17S2-WBD
Punkty ECTS 3
Typ zajęć Ćwiczenia laboratoryjne
Wykład
Przedmioty wprowadzająceWstęp do programowania
Wymagania wstępneUmiejętność programowania w python
Opis ćwiczeń
Opis wykładów. Wprowadzenie. Etapy badania danych. 2. Rodzaje modelowania. Dane w nauce o danych. 3. Statystyczne i matematyczne podstawy Data Science. 4. Redukcja wielowymiarowości: PCA, LDA 5. Rodzaje regresji w Data Science 6. Koncepcje oceny modelu - Klasyfikacja 7. Koncepcje oceny modelu - regresja 8. Kolokwium 1 9. Wektorowe maszyny wspomagające (SVM) 10. Twierdzenie Bayesa w nauce o danych 11. Sztuczne sieci neuronowe - charakterystyka 12. Sztuczne sieci neuronowe - rodzaje algorytmów i zastosowanie 13. Drzewa decyzyjne 14. Lasy losowe 15. Kolokwium ,ĆWICZENIA LABORATORYJNE:1. Wprowadzenie. Przygotowanie danych do analiz D.S. czyszczenie, zmiany formatu, standaryzacja. 2-9. Pakiety Pythona: pandas, NumPy, Matplotlib, SciPy, Scikit-learn. Przykłady na platformie Jupiter Notebook lub Spyder zastosowania w/w pakietów do analizy i wizualizacji danych w PCA, klasyfikacji i regresji w drzewach i losowych lasach, SVM, Naive Bayes. 9-11. Pakiety R: podstawowe pakiety data mining, analiza SVM. 12-15. Pakiety MATLAB: podstawowe pakiety ANN. (Ćwiczenia z pakietami Pythona i R polegałaby na pisaniu kodu z gotowych skryptów – z wyjaśnieniami, komentarzami dla każdego kroku i użytych znaków, czy modułów. Tego typu metoda uczenia tzw. top-down miałoby na celu również oswojenie z kodami języków Python i R przed systematycznym ich nauczaniem)
Cel kształceniaCelem przedmiotu jest zapoznanie studenta z aktualnie używanymi powszechnie narzędziami Data Science oraz nauczenie umiejętności wyboru narzędzia do celu badania danych oraz wstępnego posługiwania się wybranymi programami komputerowymi dedykowanymi zaawansowanym technikom analizy danych.
Literatura podstawowa1) Albon C., Uczenie maszynowe w Pythonie. Receptury. , O’Reilly/Helion., 2019 2) Boschetti A., Massaron L., Python. Podstawy nauki o danych. , Packt/Helion, 2016 3) Geron A., Uczenie maszynowe z uzyciem Scit-Learn I TensorFlow, O’Reilly/Helion, - 4) Grus J., Data Science od podstaw. Analiza danych w Pythonie. , O’Reilly/Helion, 2018 5) McKinney W., Python w analizie danych. , O’Reilly/Helion, 2018 6) Mrozek B., Mrozek Z., MATLAB i Simulink. Poradnik użytkownika. , Helion, 2018 7) Wickham H, Grolemund G., Język R. Kompletny zestaw narzędzi dla analityków danych., O’Reilly/Helion, 2018
Literatura uzupełniająca
UwagiBrak