Switch branches/tags
Nothing to show
Find file History
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
..
Failed to load latest commit information.
elastic
IMG_0588.JPG
IMG_5099.JPG
IMG_5102.JPG
IMG_5103.JPG
IMG_5104.JPG
IMG_5105.JPG
README.md
przygotujDanePodPivot.R
szablonPivot.Rmd

README.md

SER 15 + GWP: elastic i pivotTable w R

Ostani SER przed zimowymi feriami.

Dwie prezentacje pracowników działu IT R&D Grupy Wirtualna Polska.


##1 prezentacja: pivotTable w R / live-coding

Prelegent:

Karol Kubicki - data artist czerpiący inspirację z problemów rekomendacji artykułów na stronach głównych WP.PL i O2.PL. Tajniki rzeźby umysłu zgłębiał na Uniwersytecie Jagiellońskim na kierunku matematyka. Przez rok wykonywał wielkie i znane w świecie data science 4D (Data Processing, Data Quality, Data Analysis) w firmie SAS, po czym na fali inspiracji przeniósł się do Grupy WP. W procesie twórczym wykorzystuje takie narzędzia jak Hive, Python, czy Bash, ale dłutem, które nadaje nie tylko główny kształt, ale i wyraz jego dziełom jest oczywiście R.

Opis prelekcji:

Tabele przestawne są jednym z najwygodnieszych narzędzi do eksploracji danych. W R można je tworzyć za pomocą pakietu rpivotTable. Opowiem o tym jak go używać, jakie są jego silne strony i ograniczenia. Ponadto pokaże jak przechowywać informacje o stanie aplikacji shiny w URLu, co istotnie polepsza użyteczność pivot-a przy dzieleniu się wynikami.


##2 prezentacja: elastic w R

Prelegent:

Paweł Cejrowski - data craftsman, zafascynowany wyzwaniami ogromnych wolumenów danych. Absolwent matematyki finansowej na Politechnice Gdańskiej. Obecnie rozwija programistyczne rzemiosło na studiach informatycznych na wydziale ETI tejże uczelni. Ropoczynał swoją zawodową karierę pomagając w usprawnianiu hurtowni danych jednego z banków, by po krótkiej przygodzie z projektami klasy enterprise dołączyć do zespołu R&D Grupy Wirtualna Polska. Na co dzień pisze w Scali, dostarczając systemy czasu rzeczywistego odpowiedzialne za optymalizację treści wyświetlanych na stronach WP. W czasie wolnym rozwija zainteresowanie zwinnymi metodykami wytwarzania oprogramowania oraz austriacką szkołą ekonomii.

Opis prelekcji:

Elasticsearch jest rozproszoną i wysoce niezawodną wyszukiwarką zorientowaną na przechowywanie dokumentów. Pozwala na przetwarzanie danych w czasie rzeczywistym, zachowując przy tym prostotę skalowalności i wysoką wydajność. W prezentacji przedstawione zostanie wykorzystanie tego narzędzia oraz jego integracja z R przy pomocy pakietu 'elastic'.