DSP2017: Trenowanie modelu- raport 3

Po dłuższej przerwie od raportów, w końcu piszę kolejny – dzisiaj o przebiegu procesu trenowania modelu w moim projekcie, który jak całość dziedziny uczenia maszynowego został przeprowadzony z wykorzystaniem Pythona, i bibliotek Pandas oraz scikit-learn. Rodzaj uczenia… Przed przystąpieniem do wyboru algorytmu uczącego trzeba określić pewne ramy dla swojego projektu. Tak jak pisałem wcześniej, na […]

DSP2017: Wprowadzenie do biblioteki Pandas w kontekście przygotowania modelu

Biblioteka Pandas jest open-source’owym narzędziem do analizy danych przeznaczonym dla Pythona. Udostępnia wszystkie niezbędne operacje potrzebne do pracy z modelem w uczeniu maszynowym. Poniżej opiszę kilka podstawowych funkcji i struktur danych, które można wykorzystać w kontekście przygotowania modelu. Wczytywanie danych: Pandas posiada mnóstwo metod służących do wczytywania danych z różnych źródeł. Nazwy tych metod zwykle wyglądają […]

Relacja z konferencji 4developers 2017

4developers częściej jest przedstawiane jako festiwal programistyczny niż konferencja. Dlaczego? Wszystko się wyjaśni gdy spojrzymy sobie na ten event w liczbach. 13 ścieżek tematycznych plus warsztaty, ponad 100 wykładów no i ~1500 uczestników. Może przytłaczać rozmachem.  Na stronie konferencji możemy przeczytać, że na róży wiatrów organizatorów widnieją cztery kierunki: Idea, interdyscyplinarność, aktywność i społeczność (być może […]

Machine Learning Workflow cz 2 – trenowanie modelu

Na start przypomnijmy sobie podstawowe kroki w przebiegu pracy uczenia maszynowego: Przygotowanie modelu. Trenowanie modelu. Testowanie modelu. Dzisiaj zajmiemy się punktem drugim Załóżmy, że sam model mamy przygotowany – wiemy czego szukamy, dane są wyselekcjonowane i wyczyszczone – co dalej? Mamy do rozpatrzenia dwie kwestie: wybór algorytmu uczącego i zastosowanie tego algorytmu do wytrenowania modelu. […]

Code Smells: Pole tymczasowe

Kolejnym, może rzadziej spotykanym przykładem degeneracji kodu jest pole tymczasowe (ang. temporary field). Spotykamy się z nim wówczas gdy w obrębie klasy istnieje pole, które jest wykorzystywane tylko przy pewnych warunkach lub okolicznościach. Gdy te warunki nie są spełnione pole ma, przez cały cykl życia klasy, wartość domyślną. Popatrzmy na banalny przykład:

  Podstawowym problemem […]

DSP2017: Przygotowanie modelu – raport 2

Przyszedł czas na trochę bardziej konkretną pracę z danymi. Ostatnio pisałem, o przygotowaniu modelu – dzisiaj też będzie o tym ale w kontekście pracy nad moim projektem. Gwoli przypomnienia – dane nad którymi pracuję pochodzą ze strony kaggle.com, a dokładnie stąd. Są one w formacie csv, i do ich pierwszej obróbki (czyli zanim zostaną wczytane do […]

Machine Learning Workflow cz 1 – przygotowanie modelu

Jakiś czas temu pisałem o tym jak wygląda workflow w uczeniu maszynowym. Pozwolę to sobie tutaj przypomnieć: Pozyskanie danych Zadanie pytania na które chcemy znać odpowiedź w oparciu o zebrane dane (chyba najtrudniejsza część procesu) Przygotowanie danych (wczytanie je do pamięci, wyczyszczenie, doprowadzenie do postaci łatwej do zinterpretowania przez komputer – jednym słowem przetworzenie) Wybór […]

DSP2017: Pierwsze kroki w projekcie – raport 1

Krótko o tematyce projektu Jak pisałem ostatnio, dzisiaj będzie pierwsza notka raportowa o projekcie i kilka informacji dodatkowych. Najważniejszą i chyba najtrudniejszą kwestię stanowiła decyzja dotycząca wyboru danych, czyli praktycznie całego tematu wokół którego będzie kręcił się projekt. Zależało mi na tym by to o czym piszę było interesujące dla zwykłego ludka, więc odrzuciłem pomysły […]

Machine Learning – z czym to się je?

Jak pisałem w swego rodzaju wstępniaku do DSP2017 mój projekt będzie dotyczył uczenia maszynowego (by być uczciwym dodam, że podstaw :)). Podejrzewam, że większość osób związanych z programowaniem spotkało się już z tym terminem, nie wszyscy jednak muszą wiedzieć o czym dokładnie mowa i to przede wszystkim dla nich jest ten wpis. Czym więc jest […]

Relacja z konferencji WROC# 2017

Wroc# jest, obok .NET DeveloperDays jednym z najciekawszych kąsków na mapie programistycznych eventów w Polsce, przeznaczonych dla dotnetowców. W tym roku konferencja odbyła się 3 marca, oczywiście we Wrocławiu – na Stadionie Miejskim. Wroc# jest organizowany przez firmę Objectivity od trzech lat. Do tej pory byl to event bezpłatny, w tym roku zdecydowano się na ciekawy […]