W ostatni weekend miałem okazję wziąć udział w konferencji PyCon PL 2017 w Rawie Mazowieckiej. Z tego wpisu dowiesz się jakie są moje wrażenia i co mi się nie podobało.
Author Archives → ksopyla
Ankieta Data Science 2017
Już od jakiegoś czasu jestem zaangażowany w różne społeczności związane z Data Science i coraz częściej odkrywam kolejne miejsca w których są ludzie piszący, mówiący i oddychający machine learning w Polsce. Przygotowałem ankietę, której zadaniem jest zbadanie naszej Polskiej społeczności, jeżeli jesteś lub chcesz być jej częścią to proszę o uzupełnienie.
Wielowarstwowa sieć neuronowa w Tensorflow do klasyfikacji cyfr z MNIST
We wpisie tym zbudujemy 5-warstwową w pełni połączoną (fully-connected) sieć neuronową klasyfikującą cyfry ze zbioru MNIST. W tym celu wykorzystamy Tensorflow oraz wprowadzimy nowe techniki pozwalające na uczenie głębszego modelu takie jak np. funkcje aktywacji: relu, elu, dropout oraz algorytm optymalizacyjny Adam.
Continue readingLosie naku…j – moja motywacja do robienia startupu
W życiu są chwile kiedy masz wrażenie, że nic nie idzie, że w którą stronę byś nie spojrzał to masz pod górkę. Co w tedy robisz? Czy załamujesz się, biadolisz, narzekasz, wszystkim dookoła opowiadasz jak masz ciężko? Bo ja mimowolnie tak, to jest tak zakorzenione w nas, że chcemy się podzielić naszą niedolą, znam mało osób, które przełamują ten stereotyp. Na szczęście zdarzają się dni, gdy w obliczu tych niepowodzeń mówisz „losie nakurwiaj, a ja i tak będę robił swoje”.
Jednowarstwowa sieć neuronowa w Tensorflow do klasyfikacji cyfr z MNIST
Rozpoznawanie cyfr MNIST jest jednym z najbardziej popularnych problemów w świecie uczenia maszynowego. Chciałbym wam krok po kroku pokazać jak zbudować wielowarstwową sztuczną sieć neuronową, która będzie rozpoznawać ręcznie pisane cyfry z dokładnością ponad 98%.
Continue readingInstalacja środowiska do Tensorflow z GPU w Python 3 i virtualenv
Jak przygotować środowisko do Tensorflow, jak poprawnie zainstalować niezbędne biblioteki: CUDA, cuDNN oraz jak najlepiej zorganizować sobie strukturę folderów.
Must read – lista publikacji o sieciach konwolucyjnych 2016
Do wpisu zmotywowało mnie kilka osób z Instagram’a oraz Facebook’a, pytając o moją listę publikacji, które przeczytałem, czytam lub mam zamiar przeczytać. Chciałbym się z Wami podzielić tylko tymi, które przeczytałem w 2016 roku i które uważam za istotne i dobrze napisane.
Optymalizacja życia
Ostatnio coraz częściej łapię się na tym, że kontrolowanie swojego życia w dłuższej perspektywie nie działa. Planowanie i kurczowe trzymanie się ustalonego planu działań nie przynosi założonych rezultatów, odnoszę wrażenie że coś się jednak po drodze traci.
Big Data na dysku, czyli jak przetwarzać pliki HDF5 w python
Czy nie macie problemu z przetwarzaniem ogromnego pliku z danymi, albo macie ogrom danych z czujników i nie wiecie jak je zapisać aby łatwo można było później je przetwarzać? Bo ja mam, znaczy miałem odkąd poznałem HDF5.
Biorąc się za jakąkolwiek robotę związaną z analizą danych mamy prosty workflow. Odczytujemy dane, wczytujemy je do pamięci następnie uruchamiamy stosowne algorytmy, dobieramy parametry i zbieramy wyniki. Jednak już na początku tego etapu możemy napotkać problemy. Co zrobić w sytuacji gdy mamy do wczytania ogromny plik, lub gdy mamy miliony małych plików? Jak to zmieścić w RAM’ie naszej maszyny? Odpowiedź jest prosta, wczytywać i przetwarzać dane partiami. Jednak takie podejście wymaga napisania dodatkowego kodu, jeżeli chcemy to zrobić ładnie i łatwo to z pomocą może nam przyjść HDF5.
Continue readingPython pandas i wizualizacja danych PKB z World Bank
Jak wygenerować wykresy wprost z biblioteki Pandas? Dziś postaram się wam przybliżyć pracę z Pandas na przykładzie wizualizacji PKB z danych z banku światowego. Jak na dłoni zobaczymy czy uda nam się kiedyś dogonić Niemcy i czemu pomimo wyższego PKB niż Czechy żyje nam się relatywnie biedniej.
Continue reading