Praca data scientist czy machine learning engineer’a jest teraz na topie. Osoby o umiejętnościach zwiazanych z gromadzeniem, przetwarzaniem i wyciąganiem informacji z danych są mocno poszukiwane na rynku a trend ten będzie jeszcze rósł w kolejnych latach. Stąd coraz więcej osób pragnie zgłębiać ten temat i systematycznie uczy się. W odpowiedzi na to zapotrzebowanie przygotowałem uaktualnianą listę materiałów, które uważam za wartościowe. Chciałem w jednym miejscu zebrać i ułożyć materiały w jedną ścieżkę od fundamentów, poprzez deep learning, przez specjalizację, po tematy data engineering. Materiały są podzielone pod względem tematyki (obrazy, NLP itp) oraz stopnia zaawansowania (początkujący, średniozaawansowany, expert).
Spis Treści:
- Kursy i materiały: fundamenty ML
- Kursy i materiały do DeepLearning
- Prowadzenie projektu ML i budowanie rozwiązań z ML
- Kursy i materiały dla specjalizacji z NLP
- Machine learning i MLOPs – cloud AWS, Azure, GCP
- Data engineering i Machine Learning
Kursy i materiały: fundamenty ML
Jeżeli jesteś początkujący zacznij od tego, bez tej wiedzy za daleko nie pojedziesz. Głebokie sieci neuronowe są kuszące, ale w praktyce często podstawowe algorytmy spisują się wystarczająco dobrze. Z drugiej strony znajomość metryk i konceptów takich jak regularyzacja, jest niezbędna także w Deep Learningu.
- DeepLearning.ai Machine Learning Specialization at Coursera– kultowy już kurs na Coursera, składający się z 3 modułów:
- Nadzorowane uczenie maszynowe: Regresja i klasyfikacja
- Zaawansowane algorytmy uczenia się
- Uczenie nienadzorowane, rekomendacje, uczenie ze wzmocnieniem
Kurs dosyć szczegółowy, ale za to dający duże intuicje i solidne fundamenty. Omawia właściwie wszystkie aspekty i problemy w ML: regresję, klasyfikację, klustering, redukcja wymiaru, systemy rekomendacji itp. Z algorytmów, znajdziecie w nim wytłumaczenie jak się działają: drzewa binarne, regresja logistyczna, SVM, sieci neuronowe od perceptronu poprzez multi layer neural networks itd. Z mojego doświadczenia certyfikat ukończenia jest szanowany i uznawany przez większość firm zajmujących się ML, więc warto się nim pochwalić na Linkedin 🙂
Po nim warto zrobić Deep Learning Specialization(niżej)
Poziom: początkujący+
Frameworki: Tensorflow, scikit-learn
Ocena: 5/5
Kursy i materiały do DeepLearning
- DeepLearning.ai Deep Learning Specialization at Coursera – cała specjalizacja na coursera o deeplearningu składająca się z 5 części. Zawiera dobre wprowadzenie do sieci neuronowych w Tensorflow, do sieci konwolucyjnych (CNN), do modeli sekwencyjnych (RNN, LSTM, oraz Transformers). W ramach kursu zrealizujesz projekty przetwarzające obrazy, wideo, tekst, dźwięk więc daje solidne podstawy do rozwijania się kierunku kolejnych specjalizacji jak Computer Vision (CV) czy Natural Language Processing (NLP). Dużym plusem jest część poświęcona temu jak projekty ML powinny być zarządzane wraz z dobrymi praktykami jak wdrażać systemy ML w organizacji.
Poziom: początkujący+/średniozaawansowany
Frameworki: Tensorflow, scikit-learn
Ocena: 5/5 - Dive into Deep Learning – kompleksowy i darmowy kurs, zawierający fundamenty deep learningu. Przechodzi przez wszystkie aspekty technik uczenia, reglaryzacji, propagacji wstecznej itp. Omawiane są w nim modele do CV, NLP, systemów rekomendacji oraz sieci GAN. Ogromną zaletą tego kursu jest to że zawiera Jupyter Notebooki do ściągnięcia lub uruchomienia w Google Colab lub AWS Sage Maker Studio. W celu polecenia mogę dodać że stanowi podstawę programową na większości uniwersytetów na świecie
Poziom: średniozaawansowany
Frameworki: Tensorflow/Pytorch/MXNet (do wyboru)
Ocena: 5/5
Kursy i materiały dla specjalizacji z NLP
- Natural Language Processing Specialization DeepLearning.ai at Coursera – seria 4 kursów poświęcona stricte modelom i problemom z NLP. Jeżeli chcesz rozwiajać się w tej dziedzinie to musisz zrobić ten kurs. Wprowadzi Cię w podstawy oraz w zaawansowane techniki związane z modelami Transformers. Przygotujesz modele do klasyfikacji tekstu, jego parsowania na tłumaczeniu maszynowym kończąc. Certyfikat od DeepLearning.ai jest szanowany przez pracodawców więc polecam wytrwanie do końca.
Poziom: średniozaawansowany
Frameworki: Tensorflow
Ocena: 5/5 - CS224n: Natural Language Processing with Deep Learning – seria wykładów o najnowocześniejszych metodach z NLP z głębokim wytłumaczeniem i licznymi praktycznymi przykładami. Wszystkie wykłady są opublikowane na YT
Poziom: średniozaawansowany+/zaawansowany
Frameworki: Pytorch
Ocena: 5/5 - NLP kurs od HuggingFace – lista wpisów ułożonych w kurs omawiający jedną z lepszych i najczęściej wykorzystywanych biblotek w NLP. Znajdziesz w nim omówienie związane z przetwarzaniem danych tekstowych, wykorzystenie klasy Dataset, Toookenizer oraz to jak skorzystać z bibloteki gotowych modeli do różnych zadań z NLP: Named Entity Recognition (NER), PoS tagging, Question Answering, Machine translation.
Poziom: średniozaawansowany
Frameworki: Pytorch
Ocena: 5/5
Machine learning i MLOPs – cloud AWS, Azure, GCP
- AWS Certified Machine Learning Specialty 2024 – kurs przedstawiający w zwięzły i efektywny sposób zagadnienia wymagane do zdania egzaminu AWS Certified ML. Przechodzi po kolei po tematach związanych z dostarczeniem danych, ich analizą i przetwarzaniem z wykorzystaniem usłgu AWS (S3, kinessis, Glue, Step function itp). Następnie omawia ogólną niezbędną wiedzę ML aby na koniec przejść do SageMaker oraz trenowania i ewaluacji różnej maści modeli. Polecam dla osoby która ma wiedzę ML ale brakuje jej zaznajomienia z usługami AWS. Daje dobry pogląd co do czego służy i pozwala zacząć pracować z tymi usługami. Nie jest to deep dive, więc nie spodziewajcie się że po przerobieniu kursu wszystko będziecie wiedzieć, ale daje solidne podstawy aby później pójść bardziej szczegółowo.
- Hugging Face on Amazon SageMaker – darmowy, omawia kwestie treningu oraz efektywnego wdrożenia modeli HF z wykorzystaniem AWS Sagemaker, są dołączone video oraz notebooki do samodzielnego przerobienia. Polecam dla tych co znają ML ale chcą poznać jak to robić nowoczesnie w chmurze
Data engineering i Machine Learning
Bez danych nie ma uczenia maszynowego, więc w trakcie Twojej nauki nie powinno zabraknąć wiedzy z zakresu data engineer’a. Z mojej strony polecam robić kurs, który od razu pokazuje, jak to robić u któregoś z dostawców chmury Google Cloud, AWS czy Azure.
- Data Engineering, Big Data, and Machine Learning on GCP Specialization – cała specjalizacja składająca się z 5 kursów. Dobrze wprowadza w podstawy tworzenia systemów przetwarzających duże zbiory danych od ich składowania, przez ładowanie i transformacje (ETL), hurtownie danych i analitykę, kończąc na przetwarzaniu batchowym i strumieniowym. Poznacie także Vertex AI platformę od Google do treningu, serwowania i monitoringu modeli ML.
Poziom: początkujący+
Frameworki: Tensorflow
Ocena: 5/5
PS. Niektóre linki to linki z afiliacji, dzięki czemu dostaję procent od zakupionego kursu i tym samym mogę te środki przeznaczyć na rozwój bloga i podcastu. Dzięki.