# Elementy biblioteki STL
Wiemy już, że język C++ wprowadza wzorce i pozwala projektować nowe typy w oparciu o znane w czasie kompilacji argumenty (typy bądź wartości całkowite).

Na podstawie mechanizmu szablonów stworzono bibliotekę STL (Standard Template Library), czyli standardową bibliotekę szablonów. Zawiera ona implementacje przeróżnych kontenerów (kolekcji) i algorytmów nieodłącznych w programowaniu. Można przyjąć, że jeżeli potrzeby nam jest jakiś podstawowy algorytm (sortowanie, wyszukiwanie, itp.) jego implementacja już w tej bibliotece się znajduje (i jest zapewne wydajniejsza niż to co wymyślimy sami).

Przyjrzymy się dziś kilku z zawartych w bibliotece STL kontenerom i algorytmom.

## Iteratory
Jest to koncept mający usprawnić, ułatwić i ujednolicić dostęp do elementów przechowywanych w kontenerach. W zamyśle użycie iteratora ma być uniezależnione od struktury samej kolekcji i trochę od niej samej.
Praca przy użyciu iteratorów odbywać się będzie podobnie do działań na wskaźnikach. W szczególności dostęp do wartości odbywać się będzie przez operator \*, operator będzie można inkrementować przez ++ czy porównywać przez !=.

Ogólna składnia:

In [None]:
std::nazwa_kolekcji<typ>::iterator nazwa_iteratora

Podobnie jak w C wskaźnik do typu był nowym typem, tak tu iterator do elementu kolekcji jest typem (iterator do kolekcji iteratorów też).Podobnie jak w C wskaźnik do typu był nowym typem, tak tu iterator do elementu kolekcji jest typem (iterator do kolekcji iteratorów też).

Iteratory pojawiają się w różnych odcieniach. Część wymieniona jest na slajdach do wykładu, a kompletną (i bierzącą listę) mogą państwo znaleźć na stronach z dokumentacją. My w zasadzie skorzystamy z kilku:
* forward iterator: umożliwiają jedynie ruch do przodu (tylko inkrementacja)
* bidirectional iterator: ruch w obie strony
* random access: dowolny dostęp

## Kontenery
Są to obiekty przeznaczone do przechowywania danych. Przechowywać będziemy mogli zarówno typy proste (int, double ...), jak i złożone. Określone przy użyciu zaprogramowanych przez nas klas czy nawet same kontenery (kontenery w kontenerach).
https://en.cppreference.com/w/cpp/container  
https://www.cplusplus.com/reference/stl/

Podstawowy podział kontenerów jest następujący:
* sekwencyjne, czyli przechowujące elementy jeden za drógim, np. wektor, lista ...
* asocjacyjne, czyli przechowujące pary zawierające klucz i wartość, np. mapa

### Vector

Pierwszym kontenerem będzie vector, czyli w zasadzie dynamiczna tablica jaką znamy z C z wieloma wygodnymi dodatkami. Dostęp do vectora uzyskamy przez dołączenie hedeara **vector**. Dodamy też **using namespace std** aby uniknąć konieczności definiowania przestrzeni nazw za każdym razem.

In [None]:
#include <iostream>
#include <vector>
using namespace std;

Vector deklarujemy jak każdą inną zmienną, przy czym musimy podać typ przechowywany (argument templejta) w ostrych nawiasach:

In [None]:
vector<int> myinttab;

Jest kilka konstruktorów dla klasy vector. Np. jeden z parametrycznych konstruktorów pozwala nam na określenie rozmiaru i wartości jaką wypełniony będzie nasz kontener:

In [None]:
vector<int> myinttab2(10, 100);

Dla nas jest to w zasadzie nic innego jak dynamiczna tablica, do elementów której możemy się dobrać przez operator [\\]. Na razie tak samo jak robiliśmy to w **C**:

In [None]:
for(int i=0; i<10; ++i)
{
    myinttab2[i] = i;
    cout << myinttab2[i] << " ";
}

Do elementów możemy się dostać przez \[\], ale też poprzez specjalne metody *front()* i *back()* zwracające referencje do pierwszego i ostatniego elementu kolekcji:

In [None]:
int a = myinttab2.front();
int b = myinttab2.back();
cout << a << " " << b << endl;

Spróbumy teraz wprowadzić iterator. Dla vectora int będzie to:

In [None]:
vector<int>::iterator it = myinttab2.begin();

Przy czym metoda *begin()* zwraca iterator wskazujący na pierwszy element kolekcji.  
Iterator możemy inkrementować i uzyskać wartość przechowywaną przez operator wyłyskania \*, o tak:

In [None]:
++it;
cout << *it << endl;

Możemy teraz zapisać naszą pętlę odrobine lepiej, zato mniej zrozumiale:

In [None]:
for(vector<int>::iterator it = myinttab2.begin();
it != myinttab2.end(); ++it)
{
    cout << *it << " ";
}

Zapisywanie typu jakim jest iterator do kolekcji, może być uciążliwe. Zreszß nie tylko to, ale określenie typu zwracanego przez rózne metody, szczególnie generycznych klas może być kłopotliwe. W tym celu przewidziano słowo kluczowe **auto** pozwalające na odłożenie determinacji typu do czasu kompilacji i jego dedukcję z wartośći przypisywanej. Mamy więc:

In [None]:
for(auto it = myinttab2.begin(); it != myinttab2.end(); ++it)
{
    cout << *it << " ";
}

Ponieważ samo **auto** nie określa typu, zmienne tak kreślona musi być natychmiat inicjalizowana (inaczej jak kompilator ma coś wydedukować?).

In [None]:
auto autovariable;

Vector implementuje różne metody i najlepiej odwołać się do dokumentacji. Tu pokażemy tylko niektóre:  

In [None]:
vector<int> myinttab2(100)

size(), max_size() i capacity():

In [None]:
cout << myinttab2.size() << endl;
cout << myinttab2.max_size() << endl;
cout << myinttab2.capacity() << endl;

reserve():

In [None]:
myinttab2.reserve(1000);

Zwracamy uwagę na zmianę capacity() i brak zmiany size():

In [None]:
cout << myinttab2.size() << endl;
cout << myinttab2.max_size() << endl;
cout << myinttab2.capacity() << endl;

Metody push_back() i pop_back():

In [None]:
vector<double> dvec;
dvec.push_back(4.0);
dvec.push_back(5.0);
dvec.push_back(1.0);

In [None]:
cout << dvec.size() << " " << dvec[2] << endl;

In [None]:
dvec.pop_back();
cout << dvec.size() << " " << dvec.back() << endl;

### Lista
Innym kontenerem sekwencyjnym jest lista. Pozwala na przechowywanie elementów w sposób nieciągły w pamięci. Ma to taką zaletę, że dodawanie i usuwanie elementów jest tanie. Za to trzeba przechowywać informację o sąsiadach. Nie można też dostać się do elementu z kosztem stałym, a należy przeiterować się przez wszystkie elementy.

In [None]:
#include <iostream>
#include <list>
using namespace std;

In [None]:
int myints[] = {75 ,23 ,65 ,42 ,13};
list<int> mylist (myints, myints+5);

Nie możemy już niestety zrobić tak:

In [None]:
for(int i=0; i<10; ++i)
{
    mylist[i] = i;
    cout << mylist[i] << " ";
}

Ale mamy do tego iteratory i możemy się teraz przekonać, że ich zastosowanie pozwala na dostęp do elementów w sposób niezalezny od typu kolekcji:

In [None]:
for(auto it = mylist.begin(); it != mylist.end(); ++it)
{
    cout << *it << " ";
}

Albo iterując od tyłu do przodu:

In [None]:
for(auto it = mylist.end(); it != mylist.begin(); )
{
    --it;
    cout << *it << " ";
}

szie(), maz_size() i capacity() działają podobnie jak poprzednio:

In [None]:
cout << mylist.size() << " " << mylist.max_size() << " " << mylist.empty() << endl;

Listę możemy wyczyścić:

In [None]:
mylist.clear();
cout << mylist.size() << " " << mylist.max_size() << " " << mylist.empty() << endl;

Wstawmy do listy wartości przy użyciu insert(). Wstawimy zawartość tablicy myints podając adresy elementu pierwszego i ostatniego (jeden za nim) oraz pozycję korzystając z iteratora:

In [None]:
mylist.insert(mylist.begin(), myints, myints+5);

W końcu w oparciu o listę napiszemy przykład, w którym będziemy odrzucać naprzemiennie wartości z początku i końca listy. Aż będzie ona pusta:

In [None]:
int i=0;
while(!mylist.empty())
{
    cout << "Size: " << mylist.size() << endl;
    if(i==0)
    {   
        cout << "Value:" << mylist.back() << endl;
        mylist.pop_back();
        i=1;
    }
    else
    {
        cout << "Value:" << mylist.front() << endl;
        mylist.pop_front();
        i=0;
    }
}

### Para
O parze powiemy tylko tyle że przechowuje dwie wartośći a dostęp do nich jest poprzez first i second:

In [None]:
pair<char, int> a; // para łącząca characer i wartość int

In [None]:
a.first = 'a';
a.second= 10;
cout << a.first << " " << a.second << endl;

Parę jeszcze spotkamy!

### Set
Pierwszy kontener asocjacyjny. Przechowuje posortowane i unikalne wartości. Może być ciekawym rozwiązaniem, gdy użyjemy go wraz z parą!

In [None]:
#include <iostream>
#include <set>
using namespace std;

In [None]:
set<int> myset;

Wstawiamy wartości, niektóre wielokrotnie.

In [None]:
myset.insert(0);
myset.insert(0);
myset.insert(0);
myset.insert(10);
myset.insert(50);
myset.insert(-50);
myset.insert(25);
myset.insert(15);

Widzimy, że rozmiar jest jakby mniejszy:

In [None]:
cout << myset.size() << endl;

A zawartość

In [None]:
for(auto it=myset.begin(); it != myset.end(); ++it)
{
    cout << *it << endl;
}

Przyjrzymy się teraz wstawianiu wartości do set'a. W ogóle, koszt takiej operacji jest *logarytmiczny* z liczbą elementów. Jest tak, bo musimy najpierw wyszukać miejsce wstawienia. Możemy ten koszt ograniczyć "zgadując" prawidłowe położenie. Rozważmy kod:

In [None]:
#include <iostream>
#include <set>
using namespace std;

set, iterator i para łącząca iterator i wartość logiczną. Ostatnie jest potrzebne ponieważ to właśnie zwraca metoda insert():

In [None]:
set<int> myset;
set<int>::iterator it;
pair<set<int>::iterator, bool> ret;

In [None]:
// set some initial values :10 20 30 40 50
for ( int i =1; i <=5; ++ i ) myset.insert (i*10);

In [None]:
for(auto it=myset.begin(); it != myset.end(); ++it)
    cout << *it << " ";

Spróbujemy dodać wartość 20:

In [None]:
ret = myset.insert(20);
cout << *ret.first << " " << ret.second << endl;

ret.second ma wartość 0, nie udało nam się, bo 20 jest już w kolekcji. Mamy za to iterator do tej wartości pod ret.first. Możemy to wykorzystać by wydajnie wstawić kilka wartości:

In [None]:
if(ret.second == false)
    it = ret.first; // " it " now points 20

it pokazuje na 20, 25 i 24 wstawiane będą jako następne za 20:

In [None]:
myset.insert(it, 25); // max efficiency 
myset.insert(it, 24); // max efficiency

Ale 26 ma się znaleźć jako następujące po 24 i 25, więc it nie pokazuje już prawidłowej pozycji.

In [None]:
myset.insert(it, 26); // no max efficiency

Zobaczmy co jest w naszej kolekcji:

In [None]:
for(auto it=myset.begin(); it != myset.end(); ++it)
    cout << *it << " ";

### Mapa

In [None]:
#include <iostream>
#include <map>
using namespace std;

In [None]:
map<char, int> first;
first['a']=10;
first['b']=30;
first['c']=50;
first['d']=70;

In [None]:
first['c'] = 100;

In [None]:
cout << first['c'] << endl;

In [None]:
for(auto it=first.begin(); it != first.end(); ++it)
    cout << it->first << " " << it->second << endl;

In [None]:
auto it2 = first.find('b');

In [None]:
cout << it2->first << " " << it2->second << endl;

In [None]:
it2 = first.find('a');

In [None]:
if(it2 != first.end())
    cout << it2->first << " " << it2->second << endl;

## Algorytmy
Operacje takie jak sortowanie, wyszukiwanie, usuwanie kopii i wiele innych są często niezbędne do realizacji zadania programisty. Biblioteka standardowa oferuje zestaw "standardowych" algorytmów. Pełna ich lista jest dość długa, a tu przyjrzymy się tylko kilku. Dzięki zastosowaniu iteratorów algorytmy mogą działać w "nieświadomości" kontenera nad jakim pracują. Zazwyczaj przyjmować będą jedynie początek i koniec zakresu nad jakim mają pracować.

https://en.cppreference.com/w/cpp/algorithm  
https://www.cplusplus.com/reference/algorithm/

### for_each
Pierwszym algorytmem będzie **for_each**.
Służy do zastosowania operacji opisanej funkcją, lub obiektem funkcyjnym (takim dla którego zdefiniowano operator \(\)) do elementów kolekcji. Jako argumenty przyjmuje zakres, w postaci iteratorów oraz definicję operacji. Może ale nie musi zwracać, co pokażemy na przykładzie.

Zdefiniujmy funkcję i funktor:

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;



In [2]:
void fun(int a)
{
    std::cout << "__" << a;
}



In [2]:
vector<int> vec;
vec.push_back(10);
vec.push_back(20);
vec.push_back(30);

(void) @0x7fd9ff600c30


In [4]:
for_each(vec.begin(), vec.end(), fun);

__10__20__30

(void (*)(int)) Function @0x7f9c956d92e0


Możemy też zastosować obiekt ze zdefiniowanym operatorem \(\). Takie podejście da nam możliwość zachowania stanu, oraz zwrócenia obiektu po wykonaniu *for_each*.

In [5]:
struct prtstr{
    void operator()(int a) {std::cout << "__" << a;}
} aa;



In [6]:
std::for_each(vec.begin(), vec.end(), prtstr());

__10__20__30

(prtstr) @0x7f9c68f59e50


In [7]:
std::for_each(vec.begin(), vec.end(), aa);

__10__20__30

(prtstr) @0x7f9c68f4adb0


Albo tak:

In [3]:
struct prtmod{
    prtmod() : n(0) {}
    void operator()(int& a) {n+=a; std::cout << "__" << n; a=0;}
    int n;
} bb;



In [4]:
prtmod a = std::for_each(vec.begin(), vec.end(), bb);

__10__30__60



In [5]:
prtmod b = std::for_each(vec.begin(), vec.end(), prtmod());

__0__0__0



In [6]:
std::cout << a.n << " " << b.n;

60 0

(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fda1d5b1480


### find
Tak jak sugeruje nazwa, algorytm ten służy do wyszukiwania elementów w podanym zakresie. W rezultacie zwróci iterator do pierwszego wystąpienia poszukiwanego elementu. Odznacza się co najwyżej **liniowym** kosztem (proporcjonalnym do *n*). Może być zastosowane do wyszukiwania w nieposortowanych kolekcjach, lub takich, które nie oferują iteratora random access (jak listy). Uwaga, istnieją efektywniejsze metody przeszukiwania.

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;



Pokażemy powinowactwo iteratorów i wskaźników, stosując znane z **C** tablice statyczne.

In [2]:
int tab[] = { 20, 10, 40, 30 };
vector<int> vec(tab , tab+4);



In [3]:
int *p;
vector<int>::iterator it;



In [4]:
p = find ( tab , tab+4, 30);

(int *) 0x7f26210c7028


In [5]:
if ( p != tab + 4)
{
    cout<<"Element found in tab : " << *p << '\n';
    cout<<"Element found in tab : " << (p-tab) << '\n';
}
else
    cout<<"Element not found in tab\n";

Element found in tab : 30
Element found in tab : 2




In [6]:
it = find(vec.begin(), vec.end(), 30);

(__gnu_cxx::__normal_iterator &) @0x7f26210c7058


In [8]:
if ( it != vec.end())
{
    cout<<"Element found in tab : " << *it << '\n';
    cout<<"Element found in tab : " << it-vec.begin() << '\n';
}
else
    cout<<"Element not found in myints\n";

Element found in tab : 30
Element found in tab : 2




### sort
Spróbujemy teraz zastosować kilka algorytmów w celu zastosowania trochę lepszego wyszukiwania. Zaczniemy od sortowania, bo intuicja podpowiada nam, że w uporządkowanej kolekcji wyszukuje się prościej.

Nie jest chyba tajemnicą co robi sort, można go zastosować dla obiektów dla których zdefiniowano odpowiedni operator porównania, luba stosując funkcję czy obiekt funkcyjny (tak jak zrobiliśmy w przypadku *for_each*):

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;



In [2]:
bool fun (int i , int j) { return (i < j ); }

struct comp{
    bool operator() ( int i , int j ) { return (i > j );}
} myobject;



In [3]:
int tab[] = {32, 71, 12, 45, 26, 80, 53, 33};
vector<int> vec (tab, tab + 8);



In [3]:
template<class T>
void print(T a, T b)
{
    for(auto it = a ; it != b; ++it)
        cout << ' ' << *it ;
    cout << endl;    
}



Domyślny operator porównania (<) dla pierwszych 4 elementów:

In [6]:
sort(vec.begin(), vec.begin() + 4);
print(vec.begin(), vec.begin()+4);

 12 32 45 71


(void) @0x7f5410aebc30


In [7]:
sort(vec.begin()+4, vec.end(), fun);
print(vec.begin()+4, vec.end());

 26 33 53 80


(void) @0x7f5410aebc30


In [8]:
sort(vec.begin(), vec.end(), comp());
print(vec.begin(), vec.end());

 80 71 53 45 33 32 26 12


(void) @0x7f5410aebc30


In [9]:
sort(vec.begin(), vec.end(), myobject);
print(vec.begin(), vec.end());

 80 71 53 45 33 32 26 12


(void) @0x7f5410aebc30


### unique
Umiemy posortować kolekcję, czas na pozbycie się z niej duplikatów. Służy do tego *uniqe()*. Działa na posortowanej kolekcji. Powtarzające elementy zostaję
przesunięte na koniec kolekcji, zwraca iterator za ostatni unikalny
element.

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;

int tab[] = {32, 32, 45, 45, 26, 26, 53, 53};
vector<int> vec (tab, tab + 8);



In [3]:
sort(vec.begin(), vec.end());
print(vec.begin(), vec.end());

 26 26 32 32 45 45 53 53


(void) @0x7fb373600c30


In [4]:
auto it = unique(vec.begin(), vec.end());
print(vec.begin(), vec.end());

 26 32 45 53 45 45 53 53


(void) @0x7fb373600c30


In [5]:
cout << *it << " " << it - vec.begin() << endl;

45 4


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fb3914c5480


In [6]:
vec.resize(it - vec.begin());
print(vec.begin(), vec.end());

 26 32 45 53


(void) @0x7fb373600c30


### lower_bound
Dysponując posortowaną kolekcją, niekoniecznie unikalną, możemy zastosować *lower_bound*. Algorytm ten zwraca iterator do elementu nie mniejszego niż argument. Ma tę zaletę, że jego koszt jest logarytmiczny. Tzn. liczba operacji rośnie jak log(n)

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;

int tab[] = {32, 32, 45, 45, 26, 26, 53, 53};
vector<int> vec (tab, tab + 8);



In [2]:
sort(vec.begin(), vec.end());
auto it = unique(vec.begin(), vec.end());
vec.resize(it - vec.begin());

(void) @0x7ff417600c30


In [4]:
print(vec.begin(), vec.end());

 26 32 45 53


(void) @0x7ff417600c30


In [5]:
auto l = lower_bound(vec.begin(), vec.end(), 32);
auto u = upper_bound(vec.begin(), vec.end(), 32);



Uwaga: *upper_bound* działa trochę inaczej, t. zwraca iterator do pierwszego większego elementu.

In [6]:
cout << l-vec.begin() << " " << u-vec.begin() << endl;
if(*u == 32) cout << "u Found!" << endl;
if(*l == 32) cout << "l Found!" << endl;

1 2
l Found!




### binary_search
Jeżeli nie interesuje nas element, a jedynie jego obecność w kolekcji, zastosujemy *binary_seach*. Jak poprzednio działa na posortowanej kolekcji, niekoniecznie unikalnej. Koszt logarytmiczny.

In [1]:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;

int tab[] = {32, 32, 45, 45, 26, 26, 53, 53};
vector<int> vec (tab, tab + 8);



In [2]:
sort(vec.begin(), vec.end());
auto it = unique(vec.begin(), vec.end());
vec.resize(it - vec.begin());

(void) @0x7f2a7a7fac30


In [4]:
if(binary_search(vec.begin(), vec.end(), 44) )
    cout <<"Found!\n";
else cout << "not found\n";

not found




Można też wykorzystać funkcję (lub funktor) w celu opisania operacji porównania. Zastanów się nad realizacją problemu wyszukiwania przez *binary_seach* w kolekcji par wartości?