AI research Blog

Dziś szybka aktualizacja i informacja że uruchomiłem także wersję anglojęzyczną bloga, głównie do dzielenia się moimy spostrzeżeniami odnoście badań, eksperymentów oraz projektów AI.
Zależało mi na szerszej społeczności oraz feedbacku odnośnie tego nad czym pracuje.

Więc zapraszam na https://ai.ksopyla.com/ po jakimś czasie wpisy będę też publikował na swoim Krzysztof’s Substack | Substack

Krzywa ROC jak ją wykreślić i zinterpretować

Krzywa ROC (Receiver Operating Characteristic) pozwala na graficzną wizualizację jakości klasyfikatora przy zmieniającym się poziomie odcięcia dla klas. W tym tutorialu pokażę Ci sposób jej wyznaczania oraz przedstawię intuicję jak ją wykorzystać do interpretacji twojego modelu.

Continue reading →

Krzywa Precision-Recall jak ją wykreślić i zinterpretować

Jak narysować i zinterpretować krzywą precision-recall dla klasyfikatora. W artykule pokażę Ci krok po kroku sposób jej wyznaczania teoretycznie oraz praktycznie w scikit-learn. Ponadto, dowiesz się jak ją interpretować, kiedy stosować oraz jak na jej podstawie porównać dwa modele.

Continue reading →

Precision, recall i F1 – miary oceny klasyfikatora

Tutorial o tym, jak mierzyć jakość klasyfikatora i dlaczego zwykła dokładność (ang. accuracy) to często za mało. Wyjaśniam intuicję i na przykładach pokazuję o co chodzi w: precision, recall oraz F1

Continue reading →

Modele regresji liniowej szybko i łatwo z scikit learn

Rozmawiająć z osobami, które zawodowo wykorzystują metody analizy danych byłem zaskoczony jak wiele modeli predykcyjnych opartych jest na regresji liniowej. Jest to jedna z podstawowych technik w arsenale analityka, stosukowo prosta w implementacji oraz zrozumieniu, a jednak niezwykle efektywna i użyteczna. Dzięki bibliotece scikit-learn jesteśmy w stanie w kilku wierszach kodu python’a zaimplementować jej podstawowe rodzaje.

Continue reading →

Przetwarzanie obrazu z wykorzystaniem splotu funkcji

W tym wpisie szczegółowo wyjaśniam działanie funkcji splotu, matematycznej operacji która znakomicie przydaje się w przetwarzaniu obrazów. Ponadto jest jednym z głównych bloków w sieciach konwolucyjnych.

Continue reading →

Python Seaborn wizualizacja danych na sterydach

W świecie Python’a standardem w wizualizacji danych jest biblioteka matplotlib. Ma ona naprawdę ogromne możliwości, jednak stworzenie niestandardowych wykresów wymaga umiejętności co najmniej na poziomie ninja. Z odsieczą przychodzi nam seaborn – statistical data visualization library.

Continue reading →

Grid vs Random search w scikit-learn – co powinieneś wiedzieć o doborze parametrów?

Co ma decydujący wpływ na efektywność w procesie klasyfikacji? Od razu nasuwa się odpowiedź algorytm, ale pamiętajmy nawet najlepszy/najmodniejszy algorytm nie zadziała bez skrupulatnie dobranych parametrów. Jak je dobierać, na co zwrócić uwagę oraz czy losowe przeszukiwanie przestrzeni jest lepsze od podejścia ~~uczesanego~~ wyczerpującego?

Continue reading →