# Reference

Referenca je drugo ime za isto spremenljivko. Označimo jo s znakom `&`. V spodnjem primeru je `y` referenca na spremenljivko tipa `int`, kar zapišemo kot `int &y`. Referenca ne more biti prazna, inicializirati jo moramo z drugo spremenljivko ob deklaraciji. Deklaracija reference brez inicializacije (`int &y;`) ali inicializacija s konstantno vrednostjo (`int &y = 9;`) nista možni.

In [1]:
#include <iostream>
#include <vector>
using namespace std;

In [2]:
int x = 10;
int &y = x;
cout << x << " " << y << endl;

10 10


Če sedaj spremenimo vrednost spremenljivke `x`, se ta sprememba odraža tudi v spremenljivki `y`, in obratno.

In [3]:
x = 11;
cout << x << " " << y << endl;
y = 12;
cout << x << " " << y << endl;

11 11
12 12


V C++ se argumenti funkcij *prenašajo po vrednosti*. Funkcija torej prejme kopijo podanega argumenta. V Pythonu bi z dodajanjem elementov seznamu, ki ga sprejme funkcija, spremenili tudi zunanji seznam. V C++ temu ni tako. 

In [4]:
void izpisi(vector<int> v) {
    for (int x : v) cout << x << " ";
    cout << endl;
}

In [5]:
auto podvoji(vector<int> v) {
    int n=v.size();
    for (int i=0; i<n; i++) {
        v.push_back(v[i]);
    }
    return v;
}

vector<int> a = {1,2,3,4,5};
vector<int> b = podvoji(a);
izpisi(a);
izpisi(b);

1 2 3 4 5 
1 2 3 4 5 1 2 3 4 5 


Če želimo, lahko to funkcionalnost dosežemo s *prenosom argumentov po referenci*. Funkcija `podvoji_ref` sprejme argument po referenci, vrednost te spremenljivke spremeni in ne vrne ničesar.

In [6]:
void podvoji_ref(vector<int> &v) {
    int n=v.size();
    for (int i=0; i<n; i++) {
        v.push_back(v[i]);
    }
}

podvoji_ref(a);
izpisi(a);

1 2 3 4 5 1 2 3 4 5 


Po referenci lahko podamo tudi osnovne tipe, npr. `int`, česar v Pythonu nismo mogli.

In [7]:
void kvadriraj(int &x) {
    x = x*x;
}

int a = 13;
kvadriraj(a);
cout << a << endl;

169


Prenos po referenci se uporablja za podajanje velikih spremenljivk, da se izognemo ustvarjanju kopije. Druga pogosta uporaba je vračanje več vrednosti iz funkcije preko nastavljanja argumentov, ki so podani po referenci.

V spodnjem primeru funkcija `stat` sprejme seznam celih števil `v` po referenci, da se ne ustvari kopija po nepotrebnem, ker funkcija seznama ne spreminja. Prešteje pozitivna in negativna števila ter rezultate vpiše v argumenta `poz` in `neg`, ki sta prav tako podana po referenci.

In [8]:
void stat(vector<int> &v, int &poz, int &neg) {
    poz=0;
    neg=0;
    for (int x : v) {
        if (x>0) poz++;
        if (x<0) neg++;
    }
}

vector<int> st = {5, -7, 8, 9, -3, -2, -1, -4};
int poz, neg;
stat(st, poz, neg);
cout << "poz/neg: " << poz << " " << neg << endl;

poz/neg: 3 5


# Kazalci

Vsaka spremenljivka ima svojo vrednost in *naslov*, kje v pomnilniku se nahaja. Do naslova spremenljivke `x` pridemo s sintakso `&x`. Ta `&` ne predstavlja reference, ampak naslov spremenljivke. Naslovi se izpisujejo v šestanjstiškem sistemu, lahko pa ga pretvorimo tudi v celo število.

In [9]:
cout << "vrednost " << x << " na naslovu " << &x << " oziroma " << long(&x) << endl;

vrednost 12 na naslovu 0x7f1ecf655030 oziroma 139770305269808


Kazalci so spremenljivke, ki hranijo naslove. Z deklaracijo `int *p` ustvarimo kazalec na `int`. To pomeni, da kazalec `p` hrani naslov, na katerem se nahaja spremenljivka tipa `int`. Modifikator `*` označuje, da gre za kazalec. Pozor, z deklaracijo `int *p, q` bi ustvarili kazalec `p` in navadno celoštevilsko spremenljivko `q`.

Z ukazom `p = &x` shranimo naslov spremenljivke `x` v kazalec `p`. Rečemo tudi, da kazalec `p` kaže na spremenljivko `x`.

Preko kazalca lahko dostopamo do vrednosti spremenljivke, na katero kaže. Temu rečemo *dereferenca*, izvedemo pa jo z unarnim operatorjem `*`, torej `*p`. Zopet imamo opravka z zvezdico, ki pa ima drugačen pomen. Pri deklaraciji tipov z njo označimo kazalec, drugod pa z njo dostopamo do vrednosti spremenljivke, na katere kaže kazalec.

In [10]:
int *p;
p = &x;
cout << "kazalec: " << p << endl;
cout << "vrednost: " << *p << endl;

kazalec: 0x7f1ecf655030
vrednost: 12


Naslovi, ki jih hrani kazalec, se lahko spreminjajo. V isti kazalec `p` lahko shranimo naslov neke druge spremenljivke.

In [11]:
int xx = 3;
p = &xx;
cout << "kazalec: " << p << endl;
cout << "vrednost: " << *p << endl;
*p += 100;
cout << "spremenjena: " << *p << endl;

kazalec: 0x7f1ecf6550a0
vrednost: 3
spremenjena: 103


Z uporabo kazalcev lahko funkcija spreminja podane argumente. To storimo tako, da namesto spremenljivk sprejme funkcija kazalce na te spremenljivke. Pri klicu funkcije se še vedno ustvari kopija, vendar v tem primeru kopija kazalca, torej kopija naslova. S tem lahko dosežemo enako funkcionalnost kot z uporabo referenc.

V spodnjem primeru funkcija `nicle` sprejme kazalca na seznam in število. S kazalcem na seznam se izognemo kopiji celega seznama, z uporabo kazalca na število pa funkcija vanj zapiše rezultat. Pri klicu funkcije moramo kot argumente podati kazalce oz. naslove spremenljivk.

In [12]:
void nicle(vector<int> *pv, int *z) {
    *z=0;
    for (int x : *pv) {
        if (x==0) (*z)++;
    }
}

vector<int> sez = {0,1,1,0,1,0,1};
int z;
nicle(&sez, &z);
cout << z << endl;

3


Kot vidimo, so si kazalci in reference podobne:
- kazalci so starejši (C), reference novejse (C++)
- referenca je sintaktična poenostavitev pogoste uporabe kazalcev
- referenca je fiksna, kazalec se lahko spreminja
- referenca se "avtomatsko dereferencira"
- obstaja kazalec na kazalec, kazalec na referenco in referenca na referenco pa ne
- s kazalci lahko izvajamo aritmetične operacije

# Tabele

Tabelo *alociramo* z deklaracijo `int s[3]`, pri čemer podamo tip elementov in velikost tabele. Če tabelo hkrati tudi inicializiramo, lahko pustimo prevajalniku, da sam ugotovi velikost tabele. Do elementov tabele dostopamo in jih spreminjamo z indeksiranjem, ki ga že poznamo.

In [13]:
int s[3];
int t[] = {0,2,4,6,8,10,12};
t[1] = 20;
for (int i=0; i<10; i++) cout << t[i] << " ";

0 20 4 6 8 10 12 0 0 0 

V zgornjem primeru smo namenoma izpisali več elementov, kot je velika tabela. "Index out of bounds", ki smo ga navajeni iz Pythona, ne sesuje programa v C++. Vsaj ne vedno. Če dostopamo do elementov izven meja tabele, ne vemo, kaj se tam nahaja. V zgornjem primeru so bile ničle. Lahko je na tistem mestu shranjena kakšna druga spremenljivka našega programa, ki si jo brez težav po nesreči prepišemo. Lahko pa je to že del pomnilnika, ki pripada drugemu programu. V tem primeru se program sesuje oz. mu operacijski sistem prepreči, da bi dostopal do tujega pomnilnika.

Tabela se obnaša kot *kazalec na začetek pomnilnika*, kjer so zaporedoma shranjeni elementi tabele. Indeksiranje je pravzaprav okrajšava za aritmetiko s kazalci. Izraz `t[i]` je enakovreden izrazu `*(t+i)`. Začetku tabele (kazalcu na začetek tabele) prištejemo `i`, s čimer dobimo naslov `i`-tega elementa v tabeli, ki ga nato dereferenciramo, da dobimo njegovo vrednost. Prevajalnik pozna tip kazalca, zato pri povečanju kazalca dejansko poveča naslov za velikost tipa. Naslov `t+1` je za en element (v primeru `int`-a je to običajno 4 bajte) večji od naslova, kamor kaže `t`.

In [14]:
cout << t[2] << " " << *(t+2) << endl;

// t+=2;  // začetka tabele ne moremo spreminjati
int *pt = t;  // lahko pa ustvarimo nov kazalec, ki bo kazal na poljubno mesto v tabeli
cout << pt << " " << pt+2 << endl;  // aritmetika s kazalci: naslovu v kazalcu se pristeje 2*sizeof(int)
pt += 2;
cout << *pt << endl;

cout << pt[0] << " " << pt[1] << " " << pt[2] << endl;  // za indeksiranje lahko uporabimo tudi drug kazalec
cout << (pt == t+2) << endl;  // primerjava kazalcev
cout << endl;

4 4
0x7f1ecf6550e0 0x7f1ecf6550e8
4
4 6 8
1



Program lahko hrani spremenljivke v različnih delih pomnilnika. Pomembna sta sklad (*stack*) in kopica (*heap*). Na skladu se hranijo vse lokalne spremenljivke funkcij. Na kopici pa globalne in *dinamično alocirane* spremenljivke. Sintaksa za dinamično alokacijo tabele z `n` elementi tipa `int` je `new int[n]`, ki vrne kazalec oz. naslov začetka pomnilnika velikosti `n` `int`-ov. Kopica je načeloma precej večja od sklada.

In [15]:
int n;
cin >> n;
int *tab = new int[n];  // alokacija na kopici (dostopno vsem)
//int tab[n];  // alokacija na skladu (dostopno tej funkciji in njenim "potomcem")
for (int i=0; i<n; i++) {
    cin >> tab[i];
}

10
1 2 3 4 5 6 7 8 9 10


V zgornjem primeru je bilo vseeno, kje naredimo alokacijo pomnilnika za našo tabelo. Funkcija pa lahko vrača samo naslove delov pomnilnika, ki so v kopici. Lokalne spremenljivke na skladu namreč niso več na voljo, ko se funkcija zaključi.

In [16]:
int* kvadriraj(int *t, int n) {
    int *tt = new int[n];
    //int tt[n]; // ne dela - address of local variable returned
    for (int i=0; i<n; i++) {
        tt[i] = t[i]*t[i];
    }
    return tt;
}

int *kvad = kvadriraj(tab, n);
for (int i=0; i<n; i++) cout << kvad[i] << " ";
cout << endl;

1 4 9 16 25 36 49 64 81 100 


## Buffer overflow

Buffer overflow je napaka v programu, ki lahko predstavlja varnostno luknjo. Program pri pisanju v tabelo preseže mejo tabele in tako prepiše sosednje pomnilniške lokacije.

Ilustrirajmo napako na konkretnem primeru. Naš program za preverjanje gesel bo imel tabelo `secret` s prostorom za 5 znakov, kamor bo shranil vnešeno geslo in spremenljivko `valid`, ki bo hranila vrednost 1 ali 0 glede na pravilnost gesla.

In [17]:
char secret[5];
int valid=0;
cout << "secret: " << long(&secret) << endl;
cout << "valid : " << long(&valid) << endl;

secret: 139770305270056
valid : 139770305270064


Spremenljivka `valid` se nahaja 8 bajtov za začetkom tabele `secret`, ki sicer zasede samo 5 bajtov, vendar je zaradi poravnave naslovov vmes malo neuporabljenega prostora.

Napišimo program, ki bo bral geslo po znakih. Vnos gesla se bo zaključil z znakom `#`. Vsak prebrani znak bo shranil v tabelo, hkrati pa prebrano števko prišel kodi. Recimo, da je geslo pravilno, če je koda ob koncu enaka 7, sicer pa ne. Pravilna gesla so torej "7#", "43#", ...

In [18]:
int i=0, code=0;
while (true) {
    char c;
    cin >> c;
    if (c=='#') break;
    secret[i]=c;
    i++;
    code += c-'0';
}
if (code==7) valid=1;
if (valid) cout << "ACCEPTED" << endl;
else cout << "WRONG" << endl;

000000000#
ACCEPTED


Kako so lahko same ničle pravilno geslo? Bistveno je, da je teh ničel (ali katerih koli drugih števk) vsaj 9. Zadnja ničla se namreč shrani na 9. mesto v tabeli, ki pa je dolga samo 5 mest. V pomnilniku je na naslovu 9 bajtov za začetkom tabele `secret` že vsebina spremenljivke `valid`, ki jo prepišemo in tako ni več enaka 0.

# Ostalo

S področja kazalcev in tabel je nam je ostalo še kar nekaj neobdelanih tem:
- C-jevski nizi (null-terminated string)
- dealokacija (`delete`)
- kazalci na kazalce (`char **x`)
- 2D tabele (`char x[][]`)
- tabela kazalcev, kazalec na tabelo (`char* x[]`, `char (*x)[]`)
- prenos kazalca po referenci (`char* &x`)
- kazalci na funkcije (`int (*f)(int,int)`)