Sieć konwolucyjna w Tensorflow do klasyfikacji cyfr z MNIST

Trzeci wpis z serii związanej tworzeniem sieci neuronowych w Tensorflow, tym razem budujemy sieć konwolucyjną do klasyfikacji cyfr z MNIST. Omawiam idee operacji konwolucji dla sieci neuronowych oraz jak ją poprawnie zaimplementować w Tensorflow. W stosunku do poprzednich wpisów z serii sieć ta osiąga najlepszą dokładność klasyfikacji równą 0.9880.

Continue reading

Wielowarstwowa sieć neuronowa w Tensorflow do klasyfikacji cyfr z MNIST

W wpisie tym zbudujemy 5-warstwową w pełni połączoną (fully-connected) sieć neuronową klasyfikującą cyfry z zbioru MNIST. W tym celu wykorzystamy Tensorflow oraz wprowadzimy nowe techniki pozwalające na uczenie głębszego modelu takie jak np. funkcje aktywacji: relu, elu, dropout oraz algorytm optymalizacyjny Adam.

Continue reading

Przetwarzanie obrazu z wykorzystaniem splotu funkcji

Osobom interesującym się sieciami neuronowymi pewnie nie jest obce pojęcie Convolutional Neural Network – konwolucyjnej sieci neuronowej (tak wiem po Polsku nie brzmi to tak ładnie). Głównym elementem tych sieci jest warstwa wykorzystująca matematyczną operację zwaną konwolucją lub splotem.  W tym poście przedstawiam matematyczne podstawy oraz prezentuję mój sposób rozumienia tej operacji.

Continue reading