Kursy i Materiały do nauki Machine Learning i data engineering

Praca data scientist czy machine learning engineer’a jest teraz na topie. Osoby o umiejętnościach zwiazanych z gromadzeniem, przetwarzaniem i wyciąganiem informacji z danych są mocno poszukiwane na rynku a trend ten będzie jeszcze rósł w kolejnych latach. Stąd coraz więcej osób pragnie zgłębiać ten temat i systematycznie uczy się. W odpowiedzi na to zapotrzebowanie przygotowałem uaktualnianą listę materiałów, które uważam za wartościowe. Chciałem w jednym miejscu zebrać i ułożyć materiały w jedną ścieżkę od fundamentów, poprzez deep learning, przez specjalizację, po tematy data engineering. Materiały są podzielone pod względem tematyki (obrazy, NLP itp) oraz stopnia zaawansowania (początkujący, średniozaawansowany, expert).

Updates:

  • 23.01.2023 – dodano Made with ML, oraz HF na AWS Sagemaker

Spis Treści:

Kursy i materiały: fundamenty ML

Jeżeli jesteś początkujący zacznij od tego, bez tej wiedzy za daleko nie pojedziesz. Głebokie sieci neuronowe są kuszące, ale w praktyce często podstawowe algorytmy spisują się wystarczająco dobrze. Z drugiej strony znajomość metryk i konceptów takich jak regularyzacja, jest niezbędna także w Deep Learningu.

  • DeepLearning.ai Machine Learning Specialization at Coursera– kultowy już kurs na Coursera, składający się z 3 działów, pierwotnie prowadzony na Stanford przez Andrew NG (odświeżony w 2022). Dosyć szczegółowy, ale za to dający duże intuicje i solidne fundamenty. Omawia właściwie wszystkie  aspekty i problemy w ML: regresję, klasyfikację binarną i wieloklasową, klustering, redukcja wymiaru, systemy rekomendacji itp. Z algorytmów, znajdziecie w nim wytłumaczenie jak się działają: drzewa binarne, regresja logistyczna, SVM, sieci neuronowe od perceptronu poprzez multi layer neural networks itd.  Z mojego doświadczenia certyfikat ukończenia jest szanowany i uznawany przez większość firm zajmujących się ML, więc warto się nim pochwalić na Linkedin 🙂
    Po nim warto zrobić  Deep Learning Specialization(niżej)
    Poziom: początkujący+
    Frameworki: Tensorflow, scikit-learn
    Ocena: 5/5
  • Google Machine Learning Crash Course – darmowy, dobrze wprowadzający do podstaw uczenia maszynowego, dowiesz się i zrozumiesz podstawowe pojęcia istotne podczas treningu sieci NN co to jest loss function, generalizacja, sparsity itp. Zawiera dobre podstawy problemów w ML: klasyfikacja, regresja. Wytrenujesz sieć neuronową dla kilku problemów.
    Poziom: początkujący.
    Framework: Tensorflow
    Ocena: 4/5

Kursy i materiały do DeepLearning

  • DeepLearning.ai Deep Learning Specialization at Coursera – cała specjalizacja na coursera o deeplearningu składająca się z 5 części. Zawiera dobre wprowadzenie do sieci neuronowych w Tensorflow, do sieci konwolucyjnych (CNN), do modeli sekwencyjnych (RNN, LSTM, oraz Transformers). W ramach kursu zrealizujesz projekty przetwarzające obrazy, wideo, tekst, dźwięk więc daje solidne podstawy do rozwijania się kierunku kolejnych specjalizacji jak Computer Vision (CV) czy Natural Language Processing (NLP). Dużym plusem  jest część poświęcona temu jak projekty ML powinny być zarządzane wraz  z dobrymi praktykami jak wdrażać systemy ML w organizacji.
    Poziom: początkujący+/średniozaawansowany
    Frameworki: Tensorflow, scikit-learn
    Ocena: 5/5
  • Dive into Deep Learning – kompleksowy i darmowy kurs, zawierający fundamenty deep learningu. Przechodzi przez wszystkie aspekty technik uczenia, reglaryzacji, propagacji wstecznej itp. Omawiane są w nim modele do CV, NLP, systemów rekomendacji oraz sieci GAN. Ogromną zaletą tego kursu jest to że zawiera Jupyter Notebooki do ściągnięcia lub uruchomienia w Google Colab lub AWS Sage Maker Studio. W celu polecenia mogę dodać że stanowi podstawę  programową na większości uniwersytetów na świecie
    Poziom: średniozaawansowany
    Frameworki: Tensorflow/Pytorch/MXNet (do wyboru)
    Ocena: 5/5

Prowadzenie projektu ML i budowanie rozwiązań z ML

  • Full Stack Deep Learning – warto zrobić na koniec, gdyż skupia się na wdrożeniu modeli i ich utrzymaniu, omawia kwestie prowadzenia projektu ML i zarządzania zespołem.
    Poziom: średniozaawansowany
    Frameworki: Pytorch + Pytorch Lightning
    Ocena: 5/5
  • Made with ML – omawia całość tworzenia projektu ML, od strony analizy, budowy wizji produktu, roadmapy, narzędzi i poprzez trening i wdrożnenie
    Poziom: początkujący/średniozaawansowany

Kursy i materiały dla specjalizacji z NLP

  • Natural Language Processing Specialization DeepLearning.ai at Coursera – seria 4 kursów poświęcona stricte modelom i problemom z NLP. Jeżeli chcesz rozwiajać się w tej dziedzinie to musisz zrobić ten kurs. Wprowadzi Cię w podstawy oraz w zaawansowane techniki związane z modelami Transformers. Przygotujesz modele do klasyfikacji tekstu, jego parsowania na tłumaczeniu maszynowym kończąc.
    Poziom: średniozaawansowany
    Frameworki: Tensorflow
    Ocena: 5/5
  • CS224n: Natural Language Processing with Deep Learning  – dogłębny kurs o najnowocześniejszych metodach z NLP z głębokim wytłumaczeniem i licznymi praktycznymi przykładami. Polecam po zrobieniu kursu powyżej. Wykłady znajdziecie na Youtube tylko najczęściej z roku poprzedniego, obecna playlista jest z 2021 roku z semestru zimowego. 
    Poziom: średniozaawansowany+/zaawansowany
    Frameworki: Pytorch
    Ocena: 5/5
  • NLP kurs od HuggingFace – kurs omawiający jedną z lepszych i najczęściej wykorzystywanych biblotek w NLP. Znajdziesz w nim omówienie związane z przetwarzaniem danych tekstowych, wykorzystenie klasy Dataset, Toookenizer oraz to jak skorzystać z bibloteki gotowych modeli do różnych zadań z NLP: Named Entity Recognition (NER), PoS tagging, Question Answering, Machine translation.
    Poziom: średniozaawansowany
    Frameworki: Pytorch
    Ocena: 5/5

Machine learning i MLOPs – cloud AWS, Azure, GCP

  • Hugging Face on Amazon SageMaker – darmowy, omawia kwestie treningu oraz efektywnego wdrożenia modeli HF z wykorzystaniem AWS Sagemaker, są dołączone video oraz notebooki do samodzielnego przerobienia. Polecam dla tych co znają ML ale chcą poznać jak to robić nowoczesnie w chmurze

Data engineering i Machine Learning

Bez danych nie ma uczenia maszynowego, więc w trakcie Twojej nauki nie powinno zabraknąć wiedzy z zakresu data engineer’a. Z mojej strony polecam robić kurs, który od razu pokazuje, jak to robić u któregoś z dostawców chmury Google Cloud, AWS czy Azure.

  • Data Engineering, Big Data, and Machine Learning on GCP Specialization – cała specjalizacja składająca się z 5 kursów. Dobrze wprowadza w podstawy tworzenia systemów przetwarzających duże zbiory danych od ich składowania, przez ładowanie i transformacje (ETL), hurtownie danych i analitykę, kończąc na przetwarzaniu batchowym i strumieniowym. Poznacie także Vertex AI platformę od Google do treningu, serwowania i monitoringu modeli ML.
    Poziom: początkujący+
    Frameworki: Tensorflow
    Ocena: 5/5

PS. Niektóre linki to linki z afiliacji, dzięki czemu dostaję procent od zakupionego kursu i tym samym mogę te środki przeznaczyć na rozwój bloga i podcastu. Dzięki.

Ciekawe, wartościowe, podziel się proszę opinią!

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.