About Data

Piszę o uczeniu maszynowym i analizie danych.

  • Strona główna
  • Felietony
  • Historyje
  • Projekty
  • O mnie

Python ngram tokenizer z wykorzystaniem generatorów

posted in Data science, Python on 15 sierpnia, 2020 by ksopyla 0 Comments
tokenizowany tekst, porwana gazeta

Jak w czystym Python’ie dokonać tokenizacji tekstu na ngramy oraz jak wygenerować słownik z wszystkimi możliwymi ngramami.

Continue reading →

Instalacja NVidia CUDA 10, 11 na ubuntu 18.04

posted in Machine learning, Python on 11 marca, 2020 by ksopyla 9 komentarzy

Mnie też to przeraża, upgrade sterowników do CUDA jest tym, co powoduje dreszcze u każdego inżyniera uczenia maszynowego. Stąd skompilowałem instrukcję jak zainstalować CUDA na Ubuntu 18.04 wraz z CuDNN z wykorzystaniem apt . Procedura jest prosta przetestowane i działa (przynajmniej u mnie)

Continue reading →

Krzywa Precision-Recall jak ją wykreślić i zinterpretować

posted in Data science, Machine learning on 19 listopada, 2019 by ksopyla 3 komentarze

Jak narysować i zinterpretować krzywą precision-recall dla klasyfikatora. W artykule pokażę Ci krok po kroku sposób jej wyznaczania teoretycznie oraz praktycznie w scikit-learn. Dowiesz się jak ją interpretować, kiedy stosować oraz jak na jej podstawie porównać dwa modele.

Continue reading →

Precision, recall i F1 – miary oceny klasyfikatora

posted in Data science, Machine learning on 11 listopada, 2019 by ksopyla 7 komentarzy

Tutorial o tym, jak mierzyć jakość klasyfikatora i dlaczego zwykła dokładność (ang. accuracy) to często za mało. Wyjaśniam intuicję i na przykładach pokazuję o co chodzi w: precision, recall oraz F1

Continue reading →

Sieć LSTM do analizy sentymentu recenzji filmowych z IMDB

posted in Machine learning, Pytorch on 18 maja, 2019 by ksopyla 0 Comments

Tworzymy rekurencyjną sieć LSTM do analizy wydźwięku recenzji filmowych. Nie jest to jednak typowy przykład o sentiment analysis postanowiłem go rozbudować i wykorzystać bardziej zaawansowaną technikę zwaną “Truncated Backpropagation through Time”.

Continue reading →

Implemetanacja Pandas DataFrame Dataset w TorchText

posted in Machine learning, Pytorch on 9 kwietnia, 2019 by ksopyla 0 Comments

Dziś techniczny wpis o tym, jak podawać dane do sieci w Pytorch przy pomocy Pandas DataFrame z wykorzystaniem biblioteki TorchText. Z wpisu dowiesz się jak zaimplementować swój własny DataSet oraz jak wpleść ramki z Pandas w proces nauki sieci.

Continue reading →

Przetwarzasz teksty, robisz NLP, TorchText Ci pomoże!

posted in Machine learning, Pytorch on 25 marca, 2019 by ksopyla 3 komentarze

Biblioteka, która wybawiła mnie przy wielu żmudnych zadaniach związanych z przetwarzaniem tekstu w Pytorch. TorchText zdecydowanie upraszcza wczytywanie i przygotowanie danych tekstowych do podania do sieci neuronowej.

Continue reading →

Sieć rekurencyjna LSTM do zliczania znaków – wprowadzenie

posted in Machine learning, Pytorch on 12 marca, 2019 by ksopyla 3 komentarze

Sieci rekurencyjne zdolne są do rozpoznawania zależności wynikających z połączenia i częstości występowania symboli. W tym tutorialu stworzymy sieć LSTM, która będzie stanowiła dobre wprowadzenie do bardziej skomplikowanych modeli.

Continue reading →

Sieć konwolucyjna w Pytorch – klasyfikacja obrazów CIFAR-10

posted in Machine learning, Pytorch on 26 lutego, 2019 by ksopyla 2 komentarze

Tutorial ten pomoże Ci zbudować konwolucyjną sieć neuronową (Convolutional Neural Network) do klasyfikacji obrazów ze zbioru CIFAR-10. Krok po kroku pokazuję jak połączyć warstwy konwolucyjne oraz jaki wpływ na rozmiary obrazu mają “stride” i rozmiar jądra konwolucji.

Continue reading →

Wielowarstwowa sieć neuronowa w Pytorch – klasyfikacja CIFAR-10

posted in Machine learning, Pytorch on 15 lutego, 2019 by ksopyla 3 komentarze

Krok po kroku opisuję najważniejsze etapy tworzenia wielowarstwowej sieci neuronowej do klasyfikacji obrazów ze zbioru CIFAR-10. Skupimy się na wczytywaniu danych oraz omówimy jeden z głównych elementów, czyli klasę nn.Module reprezentującą sieć neuronową.

Continue reading →
← Older posts

Follow me!

  • Instagram
  • LinkedIn
  • Facebook

Powiadomić Cię o nowych wpisach?

Join 73 other subscribers

Popularne wpisy

  • Precision, recall i F1 – miary oceny klasyfikatora posted on listopada 11, 2019
  • Modele regresji liniowej szybko i łatwo z scikit learn posted on listopada 11, 2016
  • tadzmahal splot Przetwarzanie obrazu z wykorzystaniem splotu funkcji posted on sierpnia 6, 2016
  • python seaborn gallery Python Seaborn wizualizacja danych na sterydach posted on listopada 29, 2016
  • Sieć rekurencyjna LSTM do zliczania znaków – wprowadzenie posted on marca 12, 2019
  • Co wybrać Pytorch czy Tensorflow Dlaczego porzuciłem Tensorflow na rzecz Pytorch posted on stycznia 27, 2019
  • gdp_capita_europe_wordbank_pandas Python pandas i wizualizacja danych PKB z World Bank posted on grudnia 12, 2016

Komentarze

  • ksopyla o Bunkier
  • ArtRac o Bunkier
  • Rozpoznawanie obrazów z CIFAR-10 z użyciem Keras – Majcher.NET o Przetwarzanie obrazu z wykorzystaniem splotu funkcji
  • ksopyla o Instalacja NVidia CUDA 10, 11 na ubuntu 18.04
  • ksopyla o Big Data na dysku, czyli jak przetwarzać pliki HDF5 w python

Społeczność - About Data

Facebook
Copyrights 2019 by Krzysztof Sopyła