# Analiza wydajności metod mnożenia macierzy

W tym notebooku porównamy wydajność trzech różnych implementacji mnożenia macierzy:
1. Naiwna metoda (potrójne pętle w naturalnej kolejności)
2. Ulepszona metoda (ze zamienioną kolejnością pętli)
3. Implementacja z użyciem BLAS (poprzez GSL)

Dodatkowo porównamy wydajność z włączoną i wyłączoną optymalizacją kompilatora.

In [None]:
using DataFrames
using CSV
using Plots
using Statistics

## Wczytanie danych z pliku CSV

Najpierw wczytamy dane wygenerowane przez program w C:

In [None]:
# Wczytanie danych bez optymalizacji kompilatora
df_no_opt = CSV.read("results_no_opt.csv", DataFrame)
println("Dane bez optymalizacji:")
df_no_opt

In [None]:
# Wczytanie danych z optymalizacją kompilatora (dla chętnych)
# Odkomentuj poniższy kod, jeśli masz dane z optymalizacją

# df_opt = CSV.read("results_opt.csv", DataFrame)
# println("Dane z optymalizacją:")
# df_opt

## Wizualizacja wyników bez optymalizacji kompilatora

In [None]:
p1 = plot(df_no_opt.Rozmiar, df_no_opt.Naiwna, 
    label="Naiwna metoda", 
    xlabel="Rozmiar macierzy (n)", 
    ylabel="Czas wykonania [s]",
    title="Porównanie metod mnożenia macierzy (bez optymalizacji)",
    lw=2, marker=:circle, markersize=4)

plot!(p1, df_no_opt.Rozmiar, df_no_opt.Ulepszona, 
    label="Ulepszona metoda", 
    lw=2, marker=:square, markersize=4)

plot!(p1, df_no_opt.Rozmiar, df_no_opt.BLAS, 
    label="BLAS (GSL)", 
    lw=2, marker=:diamond, markersize=4)

display(p1)

## Analiza przyspieszenia względem naiwnej metody

In [None]:
df_no_opt[!, :Przyspieszenie_Ulepszona] = df_no_opt.Naiwna ./ df_no_opt.Ulepszona
df_no_opt[!, :Przyspieszenie_BLAS] = df_no_opt.Naiwna ./ df_no_opt.BLAS

p2 = plot(df_no_opt.Rozmiar, df_no_opt.Przyspieszenie_Ulepszona, 
    label="Ulepszona / Naiwna", 
    xlabel="Rozmiar macierzy (n)", 
    ylabel="Przyspieszenie (x razy)",
    title="Przyspieszenie względem naiwnej metody",
    lw=2, marker=:square, markersize=4)

plot!(p2, df_no_opt.Rozmiar, df_no_opt.Przyspieszenie_BLAS, 
    label="BLAS / Naiwna", 
    lw=2, marker=:diamond, markersize=4)

hline!(p2, [1.0], label="Brak przyspieszenia", ls=:dash, color=:black)

display(p2)

## Porównanie z optymalizacją kompilatora (dla chętnych)

Odkomentuj poniższy kod, jeśli masz dane z optymalizacją kompilatora:

In [None]:
# p3 = plot(title="Wpływ optymalizacji kompilatora", xlabel="Rozmiar macierzy (n)", ylabel="Czas wykonania [s]")

# # Naiwna metoda
# plot!(p3, df_no_opt.Rozmiar, df_no_opt.Naiwna, label="Naiwna (bez opt.)", lw=2, marker=:circle, markersize=4)
# plot!(p3, df_opt.Rozmiar, df_opt.Naiwna, label="Naiwna (z opt.)", lw=2, ls=:dash, marker=:circle, markersize=4)

# # Ulepszona metoda
# plot!(p3, df_no_opt.Rozmiar, df_no_opt.Ulepszona, label="Ulepszona (bez opt.)", lw=2, marker=:square, markersize=4)
# plot!(p3, df_opt.Rozmiar, df_opt.Ulepszona, label="Ulepszona (z opt.)", lw=2, ls=:dash, marker=:square, markersize=4)

# # BLAS
# plot!(p3, df_no_opt.Rozmiar, df_no_opt.BLAS, label="BLAS (bez opt.)", lw=2, marker=:diamond, markersize=4)
# plot!(p3, df_opt.Rozmiar, df_opt.BLAS, label="BLAS (z opt.)", lw=2, ls=:dash, marker=:diamond, markersize=4)

# display(p3)

## Wnioski

Na podstawie przedstawionych wyników możemy wyciągnąć następujące wnioski:

1. **Naiwna metoda** - standardowa implementacja z potrójną pętlą jest najwolniejsza ze wszystkich metod. Wynika to z faktu, że wzorzec dostępu do pamięci nie jest optymalny dla układu danych w języku C (row-major order).

2. **Ulepszona metoda** - zmiana kolejności pętli pozwala na lepsze wykorzystanie lokalności danych, co prowadzi do znacznej poprawy wydajności. Zysk jest szczególnie widoczny dla większych macierzy.

3. **Metoda BLAS** - wykorzystanie zoptymalizowanej biblioteki BLAS przez GSL daje najlepsze wyniki. Biblioteki BLAS są zoptymalizowane pod kątem konkretnej architektury procesora i wykorzystują zaawansowane techniki optymalizacji, takie jak rozwijanie pętli, wektoryzacja, równoległość na poziomie instrukcji, itp.

Ponadto, włączenie optymalizacji kompilatora ma znaczący wpływ na wydajność wszystkich implementacji, ale największy zysk widoczny jest w przypadku naiwnej i ulepszonej metody. Biblioteka BLAS jest już zoptymalizowana na poziomie implementacji, więc korzyści z optymalizacji kompilatora są mniejsze.