Kursy MOOC (Massive Open Online Courses) są jedną z najlepszych rzeczy jakie spotkały Internet. Pozwalają bezpłatnie (albo stosunkowo tanio) nabyć umiejętności w przystępny sposób. Postaram się przybliżyć te kursy, przez które miałem okazję przebrnąć.
W mojej przygodzie miałem przyjemność bycia uczestnikiem kursów głównie na 2 platformach: coursera oraz edX. Poza pojedynczymi kursami z jakiegoś zagadnienia oferują one grupy kursów obejmujące jakiś szerszy zakres (w courserze nazywa się to Specialization w edX – MicroMasters).
Na pierwszy ogień idą 2 specjalizacje z Data Science
Data Science Specialization – [link]
Nie mógłbym nie zacząć od specjalizacji, od której w zasadzie zaczęła się moja poważna przygoda z DS.
Składa się z 10 kursów i obejmuje bardzo duży zakres materiału (proces pozyskiwania danych, statystka, regresja). Jest prowadzona w R, na szczególne polecenie zasługują R Programming oraz Getting and Cleaning Data – stanowią bardzo dobre wprowadzenie do R. Jest bardzo dobrze (miejscami wręcz łopatologicznie) prowadzona, ale wymaga dużo pracy samodzielnej. Do większości kursów są opracowane bardzo dobre materiały, które w formie papierowej często służą mi do dziś – choćby ta książka [pdf].
Jej dużym minusem jest to, że jej tempo nie jest ustabilizowane – momentami strasznie się dłuży, . Pierwszy kurs dla osób mających jakąkolwiek styczność z IT jest zbędny. Koło 7-8 kursu zaczyna się mieć wrażenie przeciągniętego. Minusem było (przynajmniej w zeszłych edycjach) zastosowanie Peer Review (oceny prac domowych przez innych studentów) – mechanizm nie wydawał się dopracowany, wyglądało to tak, jakby niektórzy użytkownicy nawet nie odpalali u siebie kodów – ale robiłem je parę lat temu i pewnie do tego czasu już to znacznie poprawili.
Moja ocena: Z perspektywy czasu mam do niej bardzo duży szacunek. Jest bardzo dobra dla osób, które mają sporo czasu i chcą dobrze zgłębić tajniki analizy danych w R, ale raczej nie tyle pod kątem biznesowym co zastosowań naukowych.
Applied Data Science with Python Specialization – [link]
Ta specjalizacja zajmuje się przetwarzaniem danych w języku Python.
Jej dużym plusem jest to, że nie jest tak przegadana jak wyżej wspomniana. Zawiera 5 kursów (python w Data Science, reprezentacja danych, Machine Learning, Text Mining, analiza sieci społecznościowych) i sprawia wrażenie dobrze rozplanowanej. Jej bardzo dużym plusem są wplatane tu i ówdzie ciekawostki – to tam poznałem kanał Data Skeptic – dataskeptic.com
Bardzo dobre wprowadzenie do pythona w DS stanowi pierwszy kurs – prowadzący skupia się na bibliotece pandas i na tym co jest w niej najważniejsze. Bardzo dużym plusem jest też forma prowadzenia kursu – dostępne są arkusze jupyterowe, dzięki czemu można robić ćwiczenia nawet będąc na uczelnianym bądź „pracowym” komputerze.
Małym minusem (dla mnie) jest drugi kurs (reprezentacja danych) – jest on nieco mniej merytoryczny i w dużej części zajmuje się samą otoczką reprezentacji danych niż konkretnymi przykładami. Także zagadnienia Machine Learningu są potraktowane nieco po macoszemu.