Find file History
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
..
Failed to load latest commit information.
data
README.md
SER XIX - xgboost - pdf.pdf
SER19_Bochnia_R_SQL.pdf
plot_multiple_trees.R
xgboost.R

README.md

Na czerwcowym wydarzeniu widzimy się po raz ostatni przed wakacjami. Swoją obecnością zaszczycą nas prelegenci z PwC z działu Data Analytics: Mateusz Łuczko oraz Piotr Bochnia. Obaj to absolwenci Matematyki na MIMUW. Na co dzień Data Crunchers zajmujący się uczeniem maszynowym. Opowiedzą o kilku zabawkach i udogodnieniach w pracy z danymi.

Mateusz Łuczko

Bio:

Z wykształcenia matematyk i ekonomista. Z zamiłowania statystyk lubiący pogrzebać przy danych. Obecnie data scientist w zespole Data Analytics w PwC, wcześniej pracował w zespole zarządzania ryzykiem ubezpieczeniowym w PZU. Współtworzył rozwiązania analityczne dla sektora ubezpieczeniowego, bankowego oraz retailowego, upatrując w szczególności w tym pierwszym potencjał implementacji zaawansowanych modeli predykcyjnych. Prywatnie fan freestyle football’u i dobrej kuchni (jak ktoś zrobi).

Opis prelekcji: XGBoost, czyli AK-47 w arsenale modeli machine learningowych

Drzewa decyzyjne były od zawsze atrakcyjną alternatywą dla różnego rodzaju modeli liniowych. Jednym z bardziej zaawansowanych przykładów ich użycia są modele GBRT/GBDT (Gradient Boosted Regression/Decision Trees), których implementacja w bibliotece XGBoost zyskała sobie ogromną popularność pośród data scientistów. Co było przyczyną tego faktu, jak użyć jej w zastosowaniach R-owych i czy da się to wszystko wytłumaczyć rodzicom – na te i inne pytania poszukam odpowiedzi podczas prezentacji.

Piotr Bochnia

Bio:

Data scientist w przebraniu konsultanta. Na co dzień w zespole PwC Data Analytics rozwiązuje problemy klientów, głównie z sektora bankowego i retailowego, dostarczając im rozwiązania mocno oparte o dane. Aktywny na wszystkich odcinkach frontu: począwszy od zrozumienia strony biznesowej, poprzez rzeźbienie w danych, budowę modeli aż po ich implementację w finalnych produktach dla klientów. Absolwent matematyki na MIM UW oraz metod ilościowych na SGH.

Opis prelekcji: Być bliżej danych, czyli R + Microsoft SQL Server 2016

SQL Server Microsoftu, jako popularny system bazodanowy, stanowi często źródło danych, na których chcemy przeprowadzać analizy i trenować modele przy wykorzystaniu R. Wersja 2016 narzędzia oferuje nam ciekawą integrację R i silnika bazodanowego pod postacią SQL Server R Services. Podczas prezentacji pokażę wybrane nowe funkcjonalności, a także postaram się odpowiedzieć na pytanie, w jaki sposób umożliwiają one efektywne wykorzystanie mocnych stron obydwu narzędzi oraz kiedy warto rozważyć ich wykorzystanie