In [None]:
function naive_multiplication(A,B)
C=zeros(Float64,size(A,1),size(B,2))
  for i=1:size(A,1)
    for j=1:size(B,2)
        for k=1:size(A,2)
            C[i,j]=C[i,j]+A[i,k]*B[k,j]
        end
    end
end
C
end


In [None]:
function better_multiplication( A,B )
C=zeros(Float64,size(A,1),size(B,2))
  for j=1:size(A,1)
    for k=1:size(B,2)
        for i=1:size(A,2)
            C[i,j]=C[i,j]+A[i,k]*B[k,j]
        end
    end
end
C
end

In [None]:
function blas_multiplication(A,B)
    A * B
end

### Zadania
 
1.Uruchomić 
   - naive_multiplication(A,B), 
   - better_multiplication(A,B) 
   - mnożenie BLAS w Julii (A*B) 

dla coraz większych macierzy i zmierzyć czasy. Narysować wykres zależyności czasu od rozmiaru macierzy wraz z słupkami błędów, tak jak na poprzednim laboratorium. Wszystkie trzy metody powinny być na jednym wykresie.


In [None]:
using DataFrames


function calc(frame, column)
    by(frame, :size, df-> DataFrame(avg_time=mean(df[column]), std_dev=std(df[column])))
end

using Gadfly
using Compose

function layer_calc(calc)
    layer(calc, 
            x=:size, 
            y=:avg_time, 
            ymin=calc[:avg_time] - calc[:std_dev], 
            ymax=calc[:avg_time] + calc[:std_dev],
            Geom.point, Geom.errorbar, Theme(default_color=colorant"orange"))
end 

function plot_title(title)
    compose(context(0, 0, 1w, 0.25inch),
                text(0.5, 1.0, title, hcenter, vbottom))
end

In [None]:
b_range = 0:50:500
range = vcat(b_range, b_range, b_range, b_range, b_range, b_range)
frame = DataFrame()
frame[:size] = [size for size in (range)]
frame[:naive] = [@elapsed naive_multiplication(rand(s, s), rand(s,s)) for s in range]
frame[:better] = [@elapsed better_multiplication(rand(s, s), ones(s, s)) for s in range]
frame[:blas] = [@elapsed blas_multiplication(ones(s, s), ones(s, s)) for s in range]

naive_calc = calc(frame, :naive)

better_calc = calc(frame, :better)

blas_calc = calc(frame, :blas)



In [None]:
julia_naive_plot = plot(layer_calc(naive_calc))
julia_better_plot = plot(layer_calc(better_calc))
julia_blas_plot = plot(layer_calc(blas_calc))

julia_plot = vstack(hstack(julia_naive_plot, julia_better_plot, julia_blas_plot))

2.Napisać w języku C:
    - naiwną metodę mnożenia macierzy (wersja 1) 
    - ulepszoną za pomocą zamiany pętli metodę mnożenia macierzy (wersja 2), pamiętając, że w C macierz przechowywana jest wierszami (row major order tzn A11,A12, ..., A1m, A21, A22,...,A2m, ..Anm), inaczej niż w Julii ! 
    - skorzystać z  możliwości BLAS dostępnego w GSL(wersja 3). 
    
Należy porównywać działanie tych trzech algorytmow bez włączonej opcji optymalizacji kompilatora. Przedstawić wyniki na jednym wykresie tak jak w p.1.(osobno niż p.1). (Dla chętnych) sprawdzić, co się dzieje, jak włączymy optymalizację kompilatora i dodać do wykresu.



In [None]:
naive_c_unopt = calc(readtable("matrices/naive_unoptimized.csv"), :result)
better_c_unopt = calc(readtable("matrices/better_unoptimized.csv"), :result)
blas_c_unopt = calc(readtable("matrices/blas_unoptimized.csv"), :result)


c_unopt_naive_plot = plot(layer_calc(naive_c_unopt))
c_unopt_better_plot = plot(layer_calc(better_c_unopt))
c_unopt_blas_plot = plot(layer_calc(blas_c_unopt))

c_unopt_plot = vstack(hstack(c_unopt_naive_plot, c_unopt_better_plot, c_unopt_blas_plot))

In [None]:
# compiled with -Ofast option
naive_c_opt = calc(readtable("matrices/naive.csv"), :result)
better_c_opt = calc(readtable("matrices/better.csv"), :result)
blas_c_opt = calc(readtable("matrices/blas.csv"), :result)


c_opt_naive_plot = plot(layer_calc(naive_c_opt))
c_opt_better_plot = plot(layer_calc(better_c_opt))
c_opt_blas_plot = plot(layer_calc(blas_c_opt))

c_opt_plot = vstack(hstack(c_opt_naive_plot, c_opt_better_plot, c_opt_blas_plot))

# the performance is improved by a factor of 1.5 - however not even close to Julia's performance. 
# some problem may be in the time units of my measurements, but AFAIK it doesn't seem to be the case

3.Użyć funkcji curve_fit  z pakietu  do aproxymacji   do znalezienia odpowiednich wielomianow, ktore najlepiej pasują do zależności czasowych kazdego z algorytmow. Stopień wielomianu powinien zgadzać się z teoretyczną złożonoscią. Dodać wykresy uzyskanych wielomianow do wczesniejszych  wykresów.

In [None]:
using CurveFit

function calc_fit(calc, degree=3)
    x = convert(Array{Float64, 1}, calc[:size])
    y = convert(Array{Float64, 1}, calc[:avg_time])
    poly_fit(x, y , degree) 
end

function poly(p)
    f(x) = sum([p[i]*(x^(i - 1)) for i in 1:length(p)])
end

naive_julia_fit = calc_fit(naive_calc)
better_julia_fit = calc_fit(better_calc)
blas_julia_fit = calc_fit(blas_calc)
naive_c_unopt_fit = calc_fit(naive_c_unopt)
better_c_unopt_fit = calc_fit(better_c_unopt)
blas_c_unopt_fit = calc_fit(blas_c_unopt)
naive_c_opt_fit = calc_fit(naive_c_opt)
better_c_opt_fit = calc_fit(better_c_opt)
blas_c_opt_fit = calc_fit(blas_c_opt)

naive_julia_fun = poly(naive_julia_fit)
better_julia_fun = poly(better_julia_fit)
blas_julia_fun = poly(blas_julia_fit)
naive_c_unopt_fun = poly(naive_c_unopt_fit)
better_c_unopt_fun = poly(better_c_unopt_fit)
blas_c_unopt_fun = poly(blas_c_unopt_fit)
naive_c_opt_fun = poly(naive_c_opt_fit)
better_c_opt_fun = poly(better_c_opt_fit)
blas_c_opt_fun = poly(blas_c_opt_fit)

In [None]:
julia_naive_plot = plot(layer_calc(naive_calc), layer(naive_julia_fun, 1, 500))
julia_better_plot = plot(layer_calc(better_calc), layer(better_julia_fun, 1, 500))
julia_blas_plot = plot(layer_calc(blas_calc), layer(blas_julia_fun, 1, 500))

julia_plot = vstack(hstack(julia_naive_plot, julia_better_plot, julia_blas_plot))

c_unopt_naive_plot = plot(layer_calc(naive_c_unopt), layer(naive_c_unopt_fun, 1, 500))
c_unopt_better_plot = plot(layer_calc(better_c_unopt), layer(better_c_unopt_fun, 1, 500))
c_unopt_blas_plot = plot(layer_calc(blas_c_unopt), layer(blas_c_unopt_fun, 1, 500))

c_unopt_plot = vstack(hstack(c_unopt_naive_plot, c_unopt_better_plot, c_unopt_blas_plot))

c_opt_naive_plot = plot(layer_calc(naive_c_opt), layer(naive_c_opt_fun, 1, 500))
c_opt_better_plot = plot(layer_calc(better_c_opt), layer(better_c_opt_fun, 1, 500))
c_opt_blas_plot = plot(layer_calc(blas_c_opt), layer(blas_c_opt_fun, 1, 500))

c_opt_plot = vstack(hstack(c_opt_naive_plot, c_opt_better_plot, c_opt_blas_plot))



4.Przedstawić wyniki dla języka Julia i C na wspólnym wykresie. Jaka metoda jest najszybsza? 


In [None]:
draw(SVG(20cm, 30cm), vstack(
        plot_title("Julia"), julia_plot, 
        plot_title("C unoptimized"), c_unopt_plot, 
        plot_title("C optimized"), c_opt_plot))