# Julia для Data Science

* Данные
* Обработка данных
* **Визуализация**

### Визуализация данных: создание красивых графиков в Julia просто
В дальнейшем мы увидим некоторые инструменты, которые Джулия предоставляет для получения высококачественных данных для ваших данных.

## Часть 1: математика на наших графиках

In [None]:
import Pkg
Pkg.add("LaTeXStrings")
Pkg.add("Plots")

In [None]:
Pkg.add("PyPlot")

In [None]:
using LaTeXStrings
using Plots
pyplot()
x = 1:0.2:4

Давайте объявим некоторые переменные, которые хранят функции, которые мы хотим построить, написанные в LaTex

In [None]:
x2 = L"x^{2}"
logx = L"log(x)"
sqrtx = L"\sqrt{x}"

Создайте три функции и подготовьте их все!

In [None]:
y1 = sqrt.(x)
y2 = log.(x)
y3 = x.^2

In [None]:
f1 = plot(x,y1,legend = false)
plot!(f1, x,y2) # "plot!" means "plot on the same canvas we just plotted on"
plot!(f1, x,y3)
title!("Plot $x2 vs. $logx vs. $sqrtx")

Теперь мы можем аннотировать каждую из этих кривых, используя текстовые или TeX строки.

In [None]:
annotate!(f1,[(x[6],y1[6],text(sqrtx,16,:center)),
          (x[11],y2[11],text(logx,:right,16)),
          (x[6],y3[6],text(x2,16))])

Yay! Теперь вы можете убедить маленького ребенка, что $x ^ 2$ растет намного быстрее, чем $\sqrt x$

## Часть 2: Статосюжеты.

2D гистограммы действительно просты!

In [None]:
n = 1000
set1 = randn(n)
set2 = randn(n)
histogram2d(set1,set2,nbins=20,colorbar=true)

In [None]:
using DataFrames
using CSV

**Давайте вернемся к нашему набору данных домов и узнаем еще больше о них!**

In [None]:
houses = CSV.read("houses.csv")

In [None]:
typeof(houses)

In [None]:
filter_houses = houses[houses[!,:sq__ft].>0,:]
x = filter_houses[!,:sq__ft]
y = filter_houses[!,:price]

In [None]:
gh = histogram2d(x,y,nbins=20,colorbar=true)
xaxis!(gh,"square feet")
yaxis!(gh,"price")

Интересно!

Большинство проданных домов находятся в диапазоне 1000-1500, и они стоят около 150000 долларов

*Давайте посмотрим больше графиков статистики.*

Мы можем убедить себя, что случайные искажения действительно очень похожи.

Давайте сделаем это через **box** и **violin**.

https://github.com/JuliaPlots/StatsPlots.jl

In [None]:
]add StatsPlots

In [None]:
using StatsPlots

In [None]:
y = rand(10000,6); # generate 6 random samples of size 1000 each

In [None]:
f2 = violin( ["Series 1", "Series 2", "Series 3", "Series 4", "Series 5"], y,leg=false,color=:red)

In [None]:
boxplot!(["Series 1" "Series 2" "Series 3" "Series 4" "Series 5"],y,leg=false,color=:green)

Эти графики выглядят почти одинаково, поэтому у нас действительно одинаковое распределение.

Давайте изучим распределение цен в разных городах в наборе данных домов.

In [None]:
some_cities = ["SACRAMENTO","RANCHO CORDOVA","RIO LINDA","CITRUS HEIGHTS","NORTH HIGHLANDS","ANTELOPE","ELK GROVE","ELVERTA" ] # try picking pther cities!

fh = plot(xrotation=90)
for ucity in some_cities
    subs = filter_houses[filter_houses[!,:city].==ucity,:]
    city_prices = subs[!,:price]
    violin!(fh,[ucity],city_prices,leg=false)
end
display(fh)

## Part 3: Subplots это просто!

Вы можете создать свой собственный макет следующим образом.

In [None]:
mylayout = @layout([a{0.5h};[b{0.7w} c]])
plot(fh,f2,gh,layout=mylayout,legend=false)

# this layout:
# 1 
# 2 3

## Part 4: Bonus plot, XKCD kind of plots with PyPlot

Давайте загрузим `PyPlot` и создадим некоторые данные.

In [None]:
]add PyPlot

In [None]:
using Plots
pyplot()

In [None]:
x=[1:1:10]
y=ones(10)
for i=1:1:10 y[i] = pi + i*i end
PyPlot.xkcd()
plot(x,y,legend = false,
    xlabel="X-axis",
    ylabel="Y-axis",
    title="XKCD hand drawing"
    )


In [None]:
x = 1:100;
y = vcat(ones(Int,20),1:10,10*ones(70));

In [None]:
PyPlot.xkcd()
fig = PyPlot.figure()
ax = PyPlot.axes()
p = PyPlot.plot(x,y)
PyPlot.annotate("some \n caption",xy=[30;10],arrowprops=Dict("arrowstyle"=>"->"),xytext=[40;7])

Измените параметры графика:

In [None]:
PyPlot.xticks([])
PyPlot.yticks([])
PyPlot.xlabel("index")
PyPlot.ylabel("value")
PyPlot.title("our first xkcd plot")

ax[:spines]["top"][:set_color]("none") 
ax[:spines]["right"][:set_color]("none") 
ax[:spines]["left"][:set_color]("none") 
ax[:spines]["bottom"][:set_color]("none") 

fig[:canvas][:draw]()

И, наконец, отобразить фигуру!

In [None]:
display(fig)