![OMNIS2_Logo_projektu.png](../figures/OMNIS2_Logo_projektu.png)

# Ćwiczenie 2: Zmienne, stałe, typy danych, konwersja typów

## Wprowadzenie

W tym ćwiczeniu zapoznasz się z pojęciem stałej i zmiennej oraz poznasz podstawowe typy danych w języku C++ i sposób przechowywania ich wartości w pamięci operacyjnej. Przedstawione zostaną również możliwości konwersji pomiędzy poszczególnymi typami danych. Początkowa część notatnika poświęcona jest przybliżeniu systemów liczbowych spotykanych w informatyce oraz organizacji pamięci operacyjnej komputera. Jeśli te zagadnienia są Ci już znane, po sekcji „Przygotowanie notatnika” przejdź do „Zmienne i stałe w C++”.

## Przygotowanie notatnika

Z poprzedniego ćwiczenia wiesz już, że właściwy kod programu w języku C++ musi być poprzedzony dodatkowymi instrukcjami: załączeniem niezbędnych modułów biblioteki standardowej, np. 
```c++
#include <iostream>
```
oraz dyrektywą globalnego użycia przestrzeni nazw *std*
```c++
using namespace std;
```
W środowisku Jupyter każdy notatnik należy traktować jako osobny program, wobec czego owe instrukcje muszą się w nim znaleźć przed komórkami z kodem źródłowym przykładów i zadań. Dlatego na początku notatnika do każdego ćwiczenia znajdziesz zawierającą je komórkę. Wykonaj poniższą komórkę, aby przygotować niniejszy notatnik do pracy.

In [1]:
#include <iostream>
using namespace std;

## Systemy liczbowe w informatyce

Przed omówieniem typów danych w języku C++ oraz sposobu przechowywania danych w pamięci operacyjnej, warto poświęcić kilka słów systemom liczbowym stosowanym w informatyce i programowaniu.
**System liczbowy** jest pewną ustaloną konwencją zapisu liczb wedle określonych reguł. Współcześnie spotyka się głównie **systemy pozycyjne** (w odróżnieniu od np. systemu rzymskiego), w których wartość liczbowa jest zapisywana w formie ciągu cyfr. **Cyfrą** nazywamy symbol opisujący pewną wartość liczbową. Wobec tego '1' można nazwać zarówno cyfrą – symbolem, jak i liczbą. Natomiast '10' jest wyłącznie liczbą, aczkolwiek zapisaną za pomocą dwóch cyfr. W systemie pozycyjnym o wadze poszczególnych cyfr (ich wpływie na zapisaną wartość) decydują ich pozycje w ciągu, zazwyczaj od prawej do lewej. Cyfra najbardziej na prawo ma najmniejszą wagę, cyfra najbardziej na lewo największą. Sposób odczytu tak zapisanej wartości określa liczba zwana **podstawą systemu liczbowego**.

Dla człowieka naturalnym systemem liczbowym jest **system dziesiętny**. Jest to system pozycyjny, którego podstawę stanowi liczba 10. Oznacza to, że w liczbie zapisanej w tym systemie na każdej pozycji w ciągu może wystąpić jedna z dziesięciu cyfr ('0','1','2',...,'8','9'). Wagę każdej cyfry określa potęga, której podstawą jest liczba 10, zaś wykładnikiem pozycja cyfry w ciągu liczona od prawej strony (zaczynając od 0 jako numeru skrajnie prawej pozycji). Przykładowo liczbę 2025 można wyrazić jako:
$$
2025 = 5\cdot10^0 + 2\cdot10^1 + 0\cdot10^2 + 2\cdot10^3 = 5 + 20 + 0 + 2000
$$
Oczywiście my, widząc zapisaną w ten sposób liczbę, nie musimy dokonywać takiego rozkładu, jednak obrazuje on ideę funkcjonowania systemu pozycyjnego o określonej podstawie. Z wartości podstawy wynika więc zarówno liczba cyfr potrzebnych w danym systemie, jak i sposób obliczania wag poszczególnych pozycji.
W naukach informatycznych występują dwa inne systemy liczbowe: binarny (dwójkowy) oraz heksadecymalny (szesnastkowy). Są to również systemy pozycyjne, jednak o innych podstawach.

W przypadku **systemu binarnego**, naturalnego dla maszyn cyfrowych pracujących w logice dwustanowej, podstawą systemu jest liczba 2. Występują więc jedynie dwie cyfry: '0' (stan niski) oraz '1' (stan wysoki), które można utożsamiać z wartościami logicznymi: fałsz i prawda. Wagi poszczególnych pozycji w ciągu binarnym oblicza się na postawie potęg liczby 2. Przykładowo reprezentacją binarną liczby 2025 będzie:
$$
0111 \;1110 \;1001 = 1\cdot2^0 + 0\cdot2^1 + 0\cdot2^2 + 1\cdot2^3 + 0\cdot2^4 + 1\cdot2^5 + 1\cdot2^6 + 1\cdot2^7 + 1\cdot2^8 + 1\cdot2^9 + 1\cdot2^10 + 0\cdot2^11 = 1 + 0 + 0 + 8 + 0 + 32 + 64 + 128 + 256 + 512 + 1024 + 0 = 2025
$$
W **systemie heksadecymalnym** podstawą jest liczba 16. Można więc oczekiwać, że na danej pozycji w ciągu może wystąpić jedna z szesnastu wartości. Do zapisu potrzeba więc zbioru szesnastu cyfr. Na potrzeby tego systemu zaadaptowano 10 cyfr arabskich znanych z sytemu dziesiętnego, uzupełniając je sześcioma początkowymi literami standardowego alfabetu łacińskiego: 'A', 'B', 'C', 'D', 'E', oraz 'F'. Cyfrą symbolizującą wartość 10 jest 'A', 11 – 'B', 12 – 'C', 13 – 'D', 14 – 'E', zaś 15 – 'F'. W ten sposób uzyskuje się zbiór symboli potrzebnych do zapisu liczb w systemie heksadecymalnym. Analogicznie do dwóch poprzednich systemów, podstawa systemu jest jednocześnie podstawą potęgi określającej wagę cyfry na danej pozycji. Wobec tego przykładowa liczba 2025 w systemie szesnastkowym jest wyrażona jako:
$$
\mathrm{7E9} = 9\cdot16^0 + 14\cdot16^1 + 7\cdot16^2 = 9 + 224 + 1792 = 2025
$$
System binarny jest kluczowy dla przechowywania wartość liczbowych w pamięciach cyfrowych za pomocą dwustanowych elementów pamięci zwanych **bitami**. Z systemem heksadecymalnym spotkasz się zapewne przy okazji sprawdzania adresów komórek pamięci komputera, zapisywanych właśnie liczbami szesnastkowymi.

## Organizacja pamięci operacyjnej

W ramach niniejszego kursu zapewne wielokrotnie spotkasz się z pojęciem **pamięć**. Jest to jednak pewien skrót myślowy – pojęcie to odnosi się do pamięci operacyjnej komputera. Nie należy utożsamiać go z trwałymi nośnikami pamięci, takimi jaki dyski SSD i HDD, nośniki USB czy nośniki optyczne CD/DVD.
**Pamięć operacyjna** stanowi całość pamięci dostępnej dla procesora komputera, na którą składa się pamięć fizyczna i wirtualna. Współcześnie pamięć fizyczna wytwarzana jest najczęściej w technologii pamięci o dostępie swobodnym RAM (ang. *Random-Access Memory*), której moduły montowane są w gniazdach na płycie głównej komputera (lub lutowane do płyty głównej). Pomijając zbędne na tym etapie szczegóły techniczne, pamięć taką można wyobrazić sobie jako matrycę elementów bitowych, z których każdy może przyjąć jeden z dwóch stanów logicznych: niski (0) lub wysoki (1), przechowując w ten sposób pojedynczy bit informacji. Do fizycznej realizacji pojedynczego bitu wykorzystuje się kondensator, który może być rozładowany (stan niski) lub naładowany (stan wysoki). Elementy bitowe zgrupowane są w ośmiobitowe komórki podstawowe, przechowujące pojedynczy **bajt** informacji (1 B). Łatwo więc zauważyć, że w odniesieniu do informacji (jak również pojemności pamięci) funkcjonują dwie jednostki: bit i bajt, przy czym:
$$
1 \;\mathrm{B} = 8 \;\mathrm{bit}
$$

Współczesne pamięci komputerowe mają pojemności miliardów bajtów, więc do ich opisu stosuje się krotności znane z układu jednostek SI: kilo-, mega-, giga-. Należy jednak pamiętać, że w tym przypadku krotności oparte są na potęgach liczby 2, a nie 10. Tak więc:
$$\begin{align}
&1 \;\mathrm{kB} = 2^{10} \;\mathrm{B} = 1 \;024 \;\mathrm{B}\\
&1 \;\mathrm{MB} = 2^{20} \;\mathrm{B} = 1 \;024 \;\mathrm{kB} = 1 \;048 \;576 \;\mathrm{B}\\
&1 \;\mathrm{GB} = 2^{30} \;\mathrm{B} = 1 \;024 \;\mathrm{MB} = 1 \;073 \;741 \;824 \;\mathrm{B}
\end{align}
$$

Jedną z podstawowych funkcji systemu operacyjnego jest zarządzanie pamięcią operacyjną, w tym przydzielanie jej uruchamianym programom wedle zapotrzebowania. Aby było to możliwe, pamięć operacyjna musi być adresowana – każda komórka podstawowa ma swój unikatowy identyfikator liczbowy zwany **adresem**. Programy przechowują więc swoje dane w komórkach o ściśle określonych adresach przydzielonych im przez system operacyjny. W takim podejściu pamięć można traktować jako jednowymiarową tablicę ośmiobitowych komórek podstawowych ponumerowanych kolejno od 0 do maksymalnej liczby wynikającej z rozmiaru pamięci. Przykładowo można policzyć, że pamięć operacyjna o pojemności 16 GB jest podzielona na $16\cdot1024\cdot1024\cdot1024$ = 17 179 869 184 jednobajtowych komórek podstawowych, czyli maksymalnym adresem jest 17 179 869 183. Znajomość adresu danej komórki pozwala uzyskać dostęp do jej zawartości.

## Zmienne i stałe w C++

Wróćmy na chwilę do pierwszego programu z poprzedniego ćwiczenia, który miał postać:
```c++
#include <iostream>
using namespace std;
cout << "Witaj!" << endl;
```
Jego jedyną rolą było wypisanie napisu „Witaj!”. Operował więc na pewnej ściśle określonej, z góry ustalonej wartości, która nie ulegała żadnym zmianom w trakcie wykonywania programu. Zazwyczaj chcemy jednak, by nasze programy mogły operować na wartościach zmieniających się w trakcie działania i niekoniecznie ustalonych z góry, np. przechowywać wyniki operacji matematycznych realizowanych przez program. Do tego celu służą zmienne. **Zmienna** jest pewnym obszarem pamięci przydzielonym programowi, w którym może on przechowywać jakieś dane. Aby móc korzystać ze zmiennych, należy je najpierw zdefiniować. Ogólny schemat definicji zmiennej w C++ wygląda następująco (zwróć uwagę na obecność średnika, będącego w C++ znakiem końca instrukcji – każda instrukcja musi być zakończona średnikiem):
```c++
typ_danych nazwa_zmiennej;
``` 
**Typ danych** określa, jaki rozmiar pamięci jest potrzebny do przechowania wartości danego typu oraz w jaki sposób go interpretować (jako liczbę, znak, wartość logiczną). Przykładowo liczby całkowite przechowujemy w zmiennych typu *int* (skrót od ang. *inteeger* - liczba całkowita). Inne dostępne typy zostaną omówione w dalszej części ćwiczenia. **Nazwa zmiennej** jest jej unikatowym identyfikatorem w kodzie źródłowym programu. Przy nadawaniu nazw zmiennym, obowiązują pewne reguły:
1. Nazwa zmiennej może zawierać wielkie i małe litery standardowego alfabetu łacińskiego, cyfry arabskie oraz znak ’_’. Nie może zawierać spacji.
2. Cyfra nie może być pierwszym znakiem w nazwie zmiennej.
3. Nazwa zmiennej musi być unikatowa w danym bloku instrukcji (bloki instrukcji wydziela się nawiasami klamrowymi {}). W danym bloku nie mogą istnieć dwie zmienne o jednakowej nazwie.
4. Nazwa zmiennej nie może być identyczna z jakimkolwiek słowem składni języka, np. *if*, *while*, *for*, itd.

Poprawne nazwy zmiennych to np. *a*, *zmienna1*, *_wartosc24*, *Rozmiar_tablicy*, *TAB*. Niepoprawną nazwą będzie np. *1zmienna* (cyfra na początku), *nowa zmienna* (zawiera spację), *while* (słowo jest elementem składni języka C++), *wartość* (zawiera znaki spoza standardowego alfabetu łacińskiego ‘ś’ i ‘ć’). Nadanie zmiennej niepoprawnej nazwy skutkuje błędem kompilacji programu. Spróbuj wykonać poniższą komórkę:

In [None]:
int 1a;

W wyniku podania niepoprawnej nazwy zmiennej rezultatem jest błąd. Spróbujmy teraz utworzyć zmienną typu całkowitego o poprawnej nazwie – wykonaj poniższą komórkę:

In [None]:
int a1;
cout << &a1 << endl;

Użycie symbolu ‘&’ przed nazwą zmiennej pozwala pozyskać jej adres w pamięci (będzie to dokładniej omówione w dalszej części kursu przy okazji wskaźników i zmiennych dynamicznych). Wobec tego rezultatem wykonania powyższej komórki jest wypisanie adresu zmiennej *a1* w pamięci, zapisanego w systemie heksadecymalnym. Widzimy więc, że pod nazwą nadaną zmiennej kryje się tak naprawdę adres obszaru pamięci przydzielonego dla naszej zmiennej. Możliwe jest, że zmienna danego typu zajmuje więcej niż jedną podstawową komórkę pamięci (np. wspomniany typ *int* zajmuje 4 komórki – 4 B). Z nazwą związany jest zawsze adres pierwszej komórki zajmowanego obszaru. Definiując zmienną określamy, jakiego typu wartość przechowuje, jak duży obszar pamięci będzie potrzebny do przechowywania tej wartość oraz pod jaką nazwą w kodzie programu będziemy się odwoływać do tego obszaru.

Spróbujmy teraz utworzyć zmienną typu całkowitego i wypisać jej wartość. Wykonaj w tym celu poniższą komórkę:

In [None]:
int a;
cout << a << endl;

W tym przypadku wypisujemy już nie adres obszaru pamięci, a zawartość tego obszaru, czyli aktualną wartość zmiennej (brak symbolu ‘&’ przed nazwą zmiennej). Jest duże prawdopodobieństwo, że wynikiem wykonania powyższej komórki jest 0. Nie jest to jednak gwarantowane – przydzielenie obszaru pamięci dla zmiennej nie oznacza, że obszar ten zostanie zresetowany do stanu zerowego. Jeśli wcześniej jakiś program korzystał z tego obszaru, mogły pozostać w nim jakieś dane (nie wszystkie bity są w stanie 0). Wtedy powyższa komórka zwróci jakąś niezerową wartość. Dlatego należy pamiętać, że zdefiniowana zmienna nie ma ustalonej wartość, dopóki nie dokonamy jej inicjalizacji. **Inicjalizacja** jest pierwszym nadaniem wartości zmiennej w programie, np. poprzez przypisanie jakiejś wartości, co zauważysz, wykonując poniższą komórkę.

In [None]:
a = 5;
cout << a << endl;

Teraz mamy gwarancję, że zmienna przechowuje wartość 5, choć w dowolnym momencie możemy przypisać jej nową wartość, jak w poniższym przykładzie:

In [None]:
a = 10;
cout << a << endl;
a = 15;
cout << a << endl;

Możliwe jest też zainicjalizowanie zmiennej od razu po jej zdefiniowaniu w ramach jednej instrukcji:

In [None]:
int b = 50;
cout << b << endl;

Warto również pamiętać, że w ramach jednej instrukcji możemy zdefiniować i zainicjalizować kilka zmiennych tego samego typu, rozdzielając je przecinkami – typ danych określamy wtedy tylko raz na początku instrukcji. W poniższym przykładzie zmienne *x* i *z* są zdefiniowane i zainicjalizowane, natomiast zmienna *y* jest tylko zdefiniowana i nie ma ustalonej wartości (prawdopodobnie, ale nie na pewno przyjmie wartość 0):

In [None]:
int x = 5, y, z = 15;
cout << x << ',' << y << ',' << z << endl;

Wszystkie zdefiniowane zmienne są typu *int*. Formalnie ta potrójna definicja jest jedną instrukcją – średnik występuje dopiero na końcu listy definiowanych zmiennych.

Oprócz zmiennych, w języku C++ występują również **stałe**. Definiuje się je w sposób bardzo podobny do zmiennych, jednak poprzedzając definicję specyfikatorem *const*. Różnica polega jednak na tym, że stała musi być od razu zainicjalizowana – musimy nadać jej wartość w momencie jej utworzenia, tak jak w poniższej komórce:

In [None]:
const int stala = 100;
cout << stala << endl;

Po zdefiniowaniu i zainicjalizowaniu stałej, nie można już zmienić jej wartości – wykonanie poniżej komórki powinno zakończyć się błędem:

In [None]:
stala = 200;

W języku C++ występują pewne sytuacje wymagające posługiwania się stałymi, np. rozmiar tablicy statycznej musi być określony za pomocą stałej. 

Na zakończenie warto jeszcze dodać, że przedstawione w tym rozdziale zmienne są zmiennymi statycznymi – istnieją w pamięci przez cały czas wykonywania zawierającego je bloku instrukcji (jeśli znajdują się w bloku funkcji *main*, to przez cały czas działania programu). Istnieją również zmienne dynamiczne, w przypadku których programista sam decyduje o momencie ich utworzenia i usunięcia. Będą one przedmiotem ćwiczeń w dalszej części kursu.

## Typy danych w języku C++

Obok składni (zbioru słów i symboli tworzących dany język), jednym z podstawowych elementów języka programowania są dostępne w nim **typy danych**. Język C++ zawiera 5 typów fundamentalnych, których nazwy należą do składni języka:
- *int* – liczba całkowita, np. 25
- *float* – liczba rzeczywista (zmiennoprzecinkowa), np. 12.53
- *double* – liczba rzeczywista (zmiennoprzecinkowa) o podwójnej precyzji, np. 12.53
- *char* – znak, np. ‘A’
- *bool* – wartość logiczna, możliwe tylko *false* (0) lub *true* (1)

Każdy typ może przechowywać określony rodzaj danych i zajmuje obszar pamięci o określonym rozmiarze.

### Typ *int*

Wspomniany wcześniej **typ *int*** (ang. *inteeger* – liczba całkowita) służy do przechowywania wartości całkowitych dodatnich i ujemnych. Aby sprawdzić rozmiar zmiennej typu *int* w pamięci, możemy posłużyć się wbudowanym w C++ operatorem *sizeof*(). Operator ten zwraca wrażony w bajtach rozmiar pamięci zajmowanej przez obiekt podany jako argument. Wykonanie poniższej komórki poskutkuje wypisaniem rozmiaru pamięci zajmowanej przez zdefiniowaną zmienną *liczba*:

In [None]:
int liczba = 10;
cout << sizeof(liczba) << endl;

Jak widzimy, zmienna typu *int* zajmuje w pamięci obszar o rozmiarze 4 B. Argumentem operatora *sizeof*() może być również sama nazwa typu, którego rozmiar nas interesuje:

In [None]:
cout << sizeof(int) << endl;

Tu również wynikiem są 4 B. Nietrudno policzyć, że pojedyncza zmienna typu *int* jest w takim razie przechowywana z wykorzystaniem 32 bitów (4 komórki podstawowe po 8 bitów każda). Skoro każdy bit może przyjąć jedną z dwóch wartości (0 lub 1), to w ciągu 32 bitów można uzyskać $2^{32} = 4 \;294 \;967 \;296$ różnych kombinacji. Jest to tzw. **pojemność typu**, która określa, ile różnych wartości można przechować w zmiennej danego typu. Nie oznacza to jednak, że w zmiennej typu *int* można przechować liczbę 4 294 967 295 (teoretycznie maksymalna wartość). Wykonując poniższą komórkę zaobserwujesz, jaki efekt przynosi próba przypisania takiej wartości do zmiennej *liczba*:

In [None]:
liczba = 4294967295;
cout << liczba << endl;

Uzyskany rezultat -1 zapewne mocno odbiega od oczekiwań. Wynika on z tego, że w zmiennej typu *int* możemy przechowywać wartości zarówno dodatnie, jak i ujemne. Część obszaru pamięci zajmowana przez zmienną typu *int* jest więc potrzebna do przechowanie informacji o znaku liczby. W praktyce wygląda to tak, że najstarszy bit (na najwyższej pozycji licząc od prawej) koduje znak liczby (0 – liczba dodatnia, 1 – liczba ujemna). Sama wartość bezwzględna liczby jest przechowywana w dalszych 31 bitach w formie ciągu binarnego, którego wartość można wyrazić w systemie dziesiętnym w sposób omówiony na początku ćwiczenia. Oznacza to, że wartość bezwzględna liczby może przyjąć jedną z $2^{31} = 2 \;147 \;483 \;648$ możliwych wartość, co przekłada się na zakres liczb całkowitych możliwych do przechowania w zmiennej typu *int* wynoszący od -2 147 483 648 do 2 147 483 647 (górna wartość jest o 1 niższa, bo w zbiorze wartości znajduje się też 0). W razie potrzeby zakres wartości *int* można odczytać korzystając ze stałych zdefiniowanych w bibliotece standardowej INT_MIN oraz INT_MAX:

In [None]:
cout << INT_MIN << endl;
cout << INT_MAX << endl;

Zatem nie powinno być zaskoczeniem, że przypisanie do zmiennej *liczba* wartości spoza tego zakresu prowadzi do absurdalnych rezultatów. Ponieważ ciąg binarny odpowiadający liczbie 4 294 967 295 ma postać 1000 0000 0000 0000 0000 0000 0000 0001, to przy zapisaniu go w zmiennej typu *int* jest on mylnie interpretowany jako -1 (najstarszy bit ma wartość 1 – liczba ujemna, pozostała część daje wartość bezwzględną 1). Przypisanie do zmiennej *liczba* wartości z poprawnego zakresu powinno już dawać prawidłowe rezultaty:

In [None]:
liczba = 2000000000;
cout << liczba << endl;
liczba = -2000000000;
cout << liczba << endl;

Liczby całkowite są najlepiej przechowywalne w dwustanowych pamięciach cyfrowych – ich wartość mogą być reprezentowane wprost przez ciągi binarne.

### Typ *float*

Operowanie na liczbach całkowitych nie zawsze jest wystarczające. Często musimy w naszych programach sięgać po liczby rzeczywiste, zwane w informatyce liczbami zmiennoprzecinkowymi. Do ich przechowywania początkowo służył **typ *float*** (skrót od ang. *floating point* – ruchoma kropka). Spróbujmy zdefiniować zmienną typu *float*, przypisać do niej wartość oraz zobaczyć, jaki rozmiar pamięci ona zajmuje:

In [None]:
float rzeczywista = 12.25;
cout << rzeczywista << endl;
cout << sizeof(float) << endl;

Pierwszą zwracającą uwagę rzeczą jest sposób zapisu wartości rzeczywistej – separatorem dziesiętnym jest kropka, a nie przecinek. Podobnie jak większość języków programowania, C++ rozwijany był w anglosaskim kręgu kulturowym, w którym za separator części dziesiętnej liczby rzeczywistej przyjmowana jest kropka. Trzeba się do tego przyzwyczaić. Drugą rzeczą jest rozmiar pamięci zajmowany przez typ *float*, który wynosi 4 B, tak samo, jak dla typu *int*. Rozmiar pamięci dla obu typów jest więc jednakowy, natomiast różni się sposób jego interpretacji. Liczba rzeczywista jest przechowywana w postaci wykładniczej, gdzie podstawą potęgi jest liczba 2, natomiast część znacząca i wykładnik są zapisane w formie binarnej. 32 bity tworzące zmienną typu *float* są więc zagospodarowane następująco:
- najstarszy bit koduje znak liczby (jak w typie *int*),
- kolejne 8 bitów przechowuje wykładnik liczby w formie ciągu binarnego,
- pozostałe 23 bity przechowują część znaczącą liczby, również w formie ciągu binarnego.

Sposób przeliczania liczb zmiennoprzecinkowy na binarną postać wykładniczą jest dość skomplikowany, więc nie będziemy się zajmować tą kwestią – nie jest niezbędna do dalszej pracy. Przedstawiony rozkład bitów w zmiennej typu *float* pozwala przechowywać liczby rzeczywiste z dokładnością do ok. 7 miejsc znaczących. Jest to precyzja wystarczająca do większości zastosowań technicznych.

### Typ *double*

Przy bardzo precyzyjnych obliczeniach naukowych lub obliczeniach finansowych na wysokich kwotach, precyzja typu *float* okazuje się niewystarczająca. Wobec tego do reprezentacji liczb zmiennoprzecinkowych wprowadzono również **typ *double*** (skrót od ang. *double precision* – podwójna dokładność). Zdefiniujmy zmienną typu *double* i sprawdźmy jej rozmiar:

In [None]:
double podwojna_precyzja = 12.25;
cout << podwojna_precyzja << endl;
cout << sizeof(double) << endl;

Wykonanie powyższej komórki ujawnia, że podwojenie precyzji względem typu *float* osiągnięto poprzez podwojenie rozmiaru zmiennej w pamięci. Typ *double* zajmuje 8 B, co przekłada się na 64 bity zagospodarowane w następujący sposób:
- najstarszy bit koduje znak liczby (jak w typie *int* i *float*),
- kolejne 11 bitów przechowuje wykładnik liczby w formie ciągu binarnego,
- pozostałe 52 bity przechowują część znaczącą liczby, również w formie ciągu binarnego.

Takie wykorzystanie bitów pozawala na przechowywanie liczb rzeczywistych z dokładnością do ok. 15 pozycji znaczących.

Nasuwa się więc pytanie, którego typu używać w swoich programach do przechowywania liczb zmiennoprzecinkowych? Typ *double* zapewnia większą precyzję, ale kosztem większego zużycia pamięci. Jeśli więc nie zależy nam aż tak bardzo na dokładności odwzorowania w pamięci liczby zmiennoprzecinkowej, typ *float* jest racjonalnym wyborem. Jednak przy rozmiarach pamięci współczesnych komputerów osiągających dziesiątki GB, oszczędność pamięci oferowana przez typ *float* traci na znaczeniu i wielu programistów korzysta wyłącznie z typu *double* (niektóre języki, np. Matlab, mają wbudowany wyłącznie typ *double*). Jedynie przy pracy z ogromnymi zbiorami danych zmiennoprzecinkowych typ *float* może okazać się konieczny celem racjonalnego wykorzystania dostępnej pamięci operacyjnej.

### Typ *char*

Oprócz pracy z wartościami liczbowymi, język C++ oferuje również możliwość pracy ze znakami alfanumerycznymi (litery, cyfry, znaki specjalne). Służy do tego **typ *char*** (skrót od ang. *character* - znak). Zmienna typu *char* może przechowywać tylko jeden znak. Wartości tego typu zapisujemy w apostrofach, np. ‘A’ jest wartością typu *char* reprezentującą literę A. Zdefiniujmy zmienną typu *char* i, podobnie jak poprzednio, sprawdźmy jej rozmiar w pamięci:

In [None]:
char znak = 'A';
cout << znak << endl;
cout << sizeof(char) << endl;

Zmienna typu *char* zajmuje w pamięci zaledwie 1 B, czyli 8 bitów. Przekłada się to na $2^{8} = 256$ możliwych wartości. W istocie typ *char* jest typem liczbowym całkowitym, podobnie jak *int*, tyle że o mniejszej pojemności. W zmiennej typu *char* przechowywana jest liczba całkowita będąca kodem liczbowym określonego znaku. Kod ten przechowywany jest w 1 B zajmowanym przez typ *char* wprost jako ciąg binarny, przeliczalny na liczbę dziesiętną w sposób omówiony na początku ćwiczenia. Przypisanie kodów do poszczególnych znaków określa **tabela ASCII** (ang. *American Standard Code for Information Interchange*). Tabelę ASCII (pozycje od 0 do 127) przedstawiono poniżej:

| Dec | Char | Dec | Char | Dec | Char | Dec | Char |
|-----|------|-----|------|-----|------|-----|------|
|  0  |  NUL |  32 |  SPC |  64 |  @   |  96 |  `   |
|  1  |  SOH |  33 |  !   |  65 |  A   |  97 |  a   |
|  2  |  STX |  34 |  "   |  66 |  B   |  98 |  b   |
|  3  |  ETX |  35 |  #   |  67 |  C   |  99 |  c   |
|  4  |  EOT |  36 |  $   |  68 |  D   | 100 |  d   |
|  5  |  ENQ |  37 |  %   |  69 |  E   | 101 |  e   |
|  6  |  ACK |  38 |  &   |  70 |  F   | 102 |  f   |
|  7  |  BEL |  39 |  '   |  71 |  G   | 103 |  g   |
|  8  |  BS  |  40 |  (   |  72 |  H   | 104 |  h   |
|  9  |  TAB |  41 |  )   |  73 |  I   | 105 |  i   |
| 10  |  LF  |  42 |  *   |  74 |  J   | 106 |  j   |
| 11  |  VT  |  43 |  +   |  75 |  K   | 107 |  k   |
| 12  |  FF  |  44 |  ,   |  76 |  L   | 108 |  l   |
| 13  |  CR  |  45 |  -   |  77 |  M   | 109 |  m   |
| 14  |  SO  |  46 |  .   |  78 |  N   | 110 |  n   |
| 15  |  SI  |  47 |  /   |  79 |  O   | 111 |  o   |
| 16  |  DLE |  48 |  0   |  80 |  P   | 112 |  p   |
| 17  |  DC1 |  49 |  1   |  81 |  Q   | 113 |  q   |
| 18  |  DC2 |  50 |  2   |  82 |  R   | 114 |  r   |
| 19  |  DC3 |  51 |  3   |  83 |  S   | 115 |  s   |
| 20  |  DC4 |  52 |  4   |  84 |  T   | 116 |  t   |
| 21  |  NAK |  53 |  5   |  85 |  U   | 117 |  u   |
| 22  |  SYN |  54 |  6   |  86 |  V   | 118 |  v   |
| 23  |  ETB |  55 |  7   |  87 |  W   | 119 |  w   |
| 24  |  CAN |  56 |  8   |  88 |  X   | 120 |  x   |
| 25  |  EM  |  57 |  9   |  89 |  Y   | 121 |  y   |
| 26  |  SUB |  58 |  :   |  90 |  Z   | 122 |  z   |
| 27  |  ESC |  59 |  ;   |  91 |  [   | 123 |  {   |
| 28  |  FS  |  60 |  <   |  92 |  \   | 124 |  |   |
| 29  |  GS  |  61 |  =   |  93 |  ]   | 125 |  }   |
| 30  |  RS  |  62 |  >   |  94 |  ^   | 126 |  ~   |
| 31  |  US  |  63 |  ?   |  95 |  _   | 127 |  DEL |

Kolumny *Dec* zawierają kolejne wartości liczbowe w systemie dziesiętnym, natomiast kolumny *Char* odpowiadające tym liczbom znaki. Widzimy więc, że po przypisaniu do zmiennej *znak* znaku ‘A’, w pamięci przechowywana jest tak naprawdę liczba 65, stanowiąca kod tego znaku. Tabela zawiera m.in. wielkie i małe litery standardowego alfabetu łacińskiego (z literami ‘q’, ‘v’, ‘x’, ale bez polskich znaków diakrytycznych ‘ą’, ‘ę’, ‘ć’, itp.), cyfry arabskie (tu znów ważne jest odróżnienie pojęcia cyfry – symbolu graficznego, od pojęcia liczby) oraz znaki specjalne (kropka, przecinek, średnik, itp.). Są tu również zawarte znaki sterujące, np. HT (pozycja 9) – tabulator, CR (pozycja 13) – przejście do nowej linii, czy SPC (pozycja 32) – spacja. Jak widzisz, *char* to nie tylko znaki widoczne, ale również tzw. białe znaki – znaki, których symboli nie widzimy, ale wpływają na układ tekstu. Znaki te mają swoje kody sterujące, za pomocą których można je przypisywać do zmiennych typu *char*, np. ‘\n’ jest kodem sterującym przejścia do nowej linii, a ‘\t’ tabulatora (pomimo, że kod sterujący składa się z dwóch symboli, odpowiada pojedynczemu znakowi). Zauważysz to, wykonując poniższą komórkę:

In [None]:
char tabulator = '\t', nowa_linia = '\n';
cout << tabulator << "jakis napis" << nowa_linia << "inny napis" << tabulator << "kolejny napis" << endl;

Utworzone zmienne znakowe zawierające kody sterujące wpływają na układ tekstu. Tabela ASCII liczy 128 pozycji, choć w zmiennej typu *char* można przechować 256 różnych liczb. Pozostałe możliwe pozycje (od 128 do 255) są zajmowane przez dodatkowe znaki zależne od ustawionego w systemie kodowania znaków, np. dla systemu Windows ustawionego na region środkowoeuropejski znajdą się tam m.in. polskie, czeskie i słowackie znaki diakrytyczne. W ramach niniejszego kursu ograniczymy się do obsługi znaków zawartych w tabeli ASCII.

### Typ *bool*

Ostatnim fundamentalnym typem danych jest służący do przechowywania wartości logicznych **typ *bool*** (ang. *boolean*, od nazwiska George’a Boole’a, współtwórcy logiki matematycznej). Zmienna typu *bool* może przyjąć tylko jedną z dwóch wartości: *false* – logiczny fałsz lub *true* – logiczna prawda. Zarówno *false* jak i *true* są słowami ze składni języka C++ (nie mogą więc być nazwami zmiennych). Zamiennie z tymi słowami używa się liczb 0 i 1, co zobaczysz, wykonując poniższą komórkę:

In [None]:
bool logiczna = true;
cout << logiczna << endl;
cout << sizeof(bool) << endl;

Wartość *true* przypisana zmiennej *logiczna* została wypisana jako 1. Wynik działania powyższej komórki ujawnia również, że zmienna typu *bool* zajmuje 1 B pamięci. Teoretycznie do przechowania takiej dwustanowej informacji wystarczyłby jeden bit, jednak wysokopoziomowe języki programowania, jak C++, operują na pełnych bajtach jako najmniejszej adresowalnej jednostce pamięci. Wartości logiczne mają kluczowe znaczenie dla wykonywania instrukcji sterujących programu, takich jak instrukcje warunkowe i pętle.

## Typ napisowy – łańcuch znaków *string*

Jeśli przyjrzysz się pięciu podstawowym typom danych omówionym w poprzedniej sekcji zauważysz, że żaden z nich nie przechowuje wartości występujących w pierwszym programie z poprzedniego ćwiczenia. Mowa tu o wypisywanej przez tamten program wartości „Witaj!”. Nie jest to ani liczba całkowita lub rzeczywista, ani wartość logiczna. Najbardziej przypomina wartość typu *char*, jednak jest ujęta w cudzysłów, a nie apostrof, i zawiera więcej niż jeden znak. Jest to wartość napisowa, a do ich przechowywania służy typ *string*, zwany również łańcuchem znakowym. Jest to nic innego, jak ciąg znaków tworzących jedną wartość.

**Typ *string*** nie jest typem fundamentalnym języka C++. W istocie jest to klasa (typ złożony) zdefiniowany w module *string* biblioteki standardowej. Czy oznacza to, że do programu obsługującego łańcuchy znakowe trzeba załączać moduł string? Niekoniecznie – moduł *string* jest załączony do modułu *iostream*. Jeśli więc nasz program ma załączony *iostream*, to *string* jest już załączony przez niego pośrednio i nie ma potrzeby załączania go jawnie dyrektywą *#include*. Natomiast trzeba mieć na uwadze, że nazwa typu *string*, niebędąca elementem składni języka C++, nie będzie rozpoznawana bez wskazania przestrzeni nazw *std*. W przypadku niniejszego notatnika zostało to już zrobione w sekcji „Przygotowanie notatnika”, więc możemy spróbować zdefiniować i wypisać zmienną typu *string*:


In [None]:
string napis;
cout << napis << endl;

Jedynym widocznym efektem wypisania utworzonej zmiennej *napis* jest pusta linia – napis nie zawiera więc żadnych znaków. W odróżnieniu od typów fundamentalnych, zdefiniowanie zmiennej typu *string*, czy mówiąc poprawniej obiektu klasy *string*, daje gwarancję stanu początkowego – zdefiniowana zmienna przechowuje pusty napis. Dopiero przypisanie do niej niepustej wartości powoduje zmianę tego stanu:

In [None]:
napis = "Witaj!";
cout << napis << endl;

W przypadku obiektów *string* nie będziemy sprawdzać rozmiaru zajmowanej pamięci, bowiem może on ulegać zmianie w zależności od tego, jak długi łańcuch zamierzamy przechować. Rozmiar jest więc na bieżąco dostosowywany do potrzeb.

Istotną kwestią związaną z klasą *string* jest fakt, że posiada ona zestaw funkcji wbudowanych pozwalających wykonywać pewne operacje na łańcuchu znakowym, np. sprawdzić jego długość – liczbę znaków. Funkcje wbudowane wywołuje się na konkretnym zdefiniowanym obiekcie klasy, podając jego nazwę i po kropce nazwę funkcji:
```c++
nazwa_obiektu.nazwa_funkcji();
``` 
Przykładowo wypisania aktualnej długości obiektu *napis* dokonamy za pomocą funkcji wbudowanej *length()*, wywołując ją w następujący sposób:

In [None]:
cout << napis.length() << endl;

Wyświetlona liczba powinna odpowiadać liczbie znaków w przypisanym wcześniej łańcuchu "Witaj!" i wynosić 6. Inną ciekawą funkcją jest *max_size()*, która zwraca maksymalną liczbę znaków możliwą do przechowania w obiekcie klasy *string*:

In [None]:
cout << napis.max_size() << endl;

Wartość ta jest zależna od komputera, na którym uruchamiamy program. W przypadku notatników Jupyter, ze względu na specyficzny sposób implementacji kodu, liczba ta jest stosunkowo niewielka w porównaniu z tym, co mógłbyś zaobserwować wykonując podobną operację na własnym komputerze. Przydatną funkcją wbudowaną klasy *string* jest *empty()*, która zwraca wartość logiczną będącą odpowiedzią na pytanie, czy łańcuch znakowy jest pusty: 1 (*true*) – tak, łańcuch jest pusty, 0 (*false*) – nie, łańcuch zawiera przynajmniej 1 znak. Jeśli wywołamy tę funkcję na obiekcie *napis*, zawierającym już jakieś znaki, rezultatem będzie 0:

In [None]:
cout << napis.empty() << endl;

Jednak wywołanie jej na nowozdefiniowanym obiekcie powinno dać rezultat 1:

In [None]:
string nowy_napis;
cout << nowy_napis.empty() << endl;

Przedstawione funkcje to tylko część możliwości związanych z klasą *string*. Więcej informacji na temat łańcuchów znakowych poznasz w dalszej części kursu.

## Konwersja typów
Znasz już podstawowe typy danych, z którymi będziemy pracować w dalszych ćwiczeniach. Jeśli spojrzysz na nie raz jeszcze, zapewne zauważysz, że niektóre z nich dzielą pewne podobieństwa, czy to w rodzaju przechowywanych wartości, czy w sposobie ich zapisu w pamięci. Pojawia się zatem pytanie, czy np. liczbę całkowitą możemy przypisać do zmiennej typu *float* lub *double*? W końcu liczby całkowite też należą do zbioru liczb rzeczywistych. Albo co się stanie, jeśli znak typu *char* przypiszemy do zmiennej typu *int*? W języku C++ zmiana typu jest jak najbardziej możliwa, a operację taką nazywamy **konwersją typów**. Należy jednak pamiętać, że w niektórych przypadkach może sie ona wiązać z utratą danych - nie zawsze ma więc sens.

W C++ występują dwa typy konwersji: niejawna (automatyczna) i jawna. Przykład obu typów konwersji zawiera poniższa komórka:

In [None]:
float l1, l2;
l1 = 10;
l2 = float(10);
cout << l1 << endl << l2 << endl;

 *Konwersja niejawna* (automatyczna) ma miejsce wtedy, gdy wartość danego typu jest przypisywana do zmiennej innego typu. Wtedy, jeśli to możliwe, kompilator automatycznie konwertuje wartość na typ docelowy. W powyższym przykładzie taka konwersja zachodzi w linii *l1 = 10;*. Wartość źródłowa jest typu całkowitego *int* (gdyby miała być typu rzeczywistego, należałoby ją zapisać jako 10.0), zaś zmienna docelowa jest typu *float*. Jak już wiesz, sposób interpretacji pamięci dla wartości obu typów jest różny, wiec liczba 10 musi być zapisana tak, jak wartości typu *float*. Sam kod nie zdradza jednak na pierwszy rzut oka, że taka konwersja zajdzie.
W drugim przypadku (linia *l2 = float(10);*) mamy do czynienia z *konwersją jawną*, zwaną też rzutowaniem (w tym przypadku rzutowaniem typu *int* na typ *float*). Ogólnie składnia takiego rzutowania wygląda następująco:
```c++
typ_docelowy (wartosc_typu_zrodlowego);
``` 
Tu już ewidentnie konwersja jest intencją programisty, który jawnie zawarł ją w kodzie źródłowym programu.
Odpowiedzieliśmy więc na pytanie, czy można przypisać liczbę całkowitą do zmiennej rzeczywistej. Jakie są inne możliwości konwersji typów? Jeśli za typ źródłowy przyjmiemy typ *int*, to okaże się on konwertowalny na każdy z pozostałych typów fundamentalnych. Skoro może być konwertowany na typ *float*, to nie ma powodu, by nie dał się konwertować na typ *double*. Możliwa jest również konwersja na typ *char*, a nawet typ *bool*. Prześledźmy na początek konwersje na typy rzeczywiste:

In [None]:
int calkowita1 = 20;
float rzeczywista1 = calkowita1;
double rzeczywista2 = calkowita1;
cout << rzeczywista1 << endl << rzeczywista2 << endl;

W obu przypadkach zaszła niejawna konwersja, a liczba całkowita jest przechowywana w zmiennych typów zmiennoprzecinkowych. Oczywiście możliwe jest też zastosowanie konwersji jawnej, ale efekt będzie taki sam. 

W przypadku typu *char* konwersja jest jeszcze prostsza – w końcu zarówno *int*, jak i *char* są w istocie typami liczbowymi całkowitymi. Jedynym problemem jest różny rozmiar zajmowany przez oba typy. Dlatego konwersja zajdzie prawidłowo tylko dla liczb całkowitych z zakresu 0-255. Dla wyższych wartości dojdzie do utraty danych – przepełniona zostanie pojemność zmiennej typu *char* (podobnie jak w przypadku, który analizowaliśmy przy okazji omawiania typu *int*). Wykonajmy więc poniższą komórkę:

In [None]:
char zn1 = 100, zn2 = 310;
cout << zn1 << endl << zn2 << endl;

W przypadku konwersji liczby 100 na typ znakowy (przypisanie do zmiennej *zn1*) wynik jest zgodny z tabelą ASCII – wyświetlona zostaje litera ‘d’ o kodzie 100. Natomiast w przypadku liczby 310 wypisana została cyfra ‘6’, której odpowiada kod 54. Jest to wartość będąca wynikiem konwersji liczby 310, wymagającej co najmniej 9 bitów (0001 0011 0110), na wartość typu *char*, zajmującą 8 bitów. Najstarszy bit liczby został utracony, a pozostałe (0011 0110) odpowiadają wartości 54 w systemie dziesiętnym, kodującej cyfrę ‘6’.

Konwersja typu *int* na typ *bool* może dać jeden z dwóch rezultatów. Jeśli liczba całkowita jest zerem, wynikiem konwersji będzie logiczny fałsz (0). Dla niezerowej wartości liczby rezultatem jest logiczna prawda (1):

In [None]:
int calkowita3 = 0, calkowita4 = 20;
bool logiczna1 = calkowita3, logiczna2 = calkowita4;
cout << logiczna1 << endl << logiczna2 << endl;

Przyjrzyjmy się teraz możliwościom konwersji typów rzeczywistych *float* i *double*. Konwersja między obydwoma typami jest oczywiście możliwa. W przypadku konwersji *float* na *double* jest ona bezstratna – każdą liczbę rzczywistą możliwą do przechowania w 4-bajtowej zmiennej typu *float* można tym bardziej przechować w 8-bajtowej zmiennej typu *double*. Jednak w sytuacji odwrotnej należy liczyć się z możliwością utraty danych – wartość typu *double* może nie zmieścić się w zmiennej typu *float*. Poniższa komórka zawiera przykłady konwersji niejawnej między typami rzeczywistymi. Przy okazji zapoznasz się z możliwością zapisu wartości rzeczywistych w notacji wykładniczej (naukowej), np. zapis 254e-5 oznacza $254\cdot10^{-5} = 0.00254$:

In [2]:
float f1 = 254e-5;
double d1 = f1;
cout << "Wartosc zrodlowa typu float: " << f1 << endl << "Wynik konwersji na typ double: " << d1 << endl;
double d2 = 4845641515464e-3;
float f2 = d2;
cout << "Wartosc zrodlowa typu double: " << fixed << d2 << endl << "Wynik konwersji na typ float: " << f2 << endl;

Wartosc zrodlowa typu float: 0.00254
Wynik konwersji na typ double: 0.00254
Wartosc zrodlowa typu double: 4845641515.464000
Wynik konwersji na typ float: 4845641728.000000


W przypadku konwersji z typu *float* na *double* przykładowa liczba nie wymaga dużej ilości pamięci – nawet typ *float* jest wystarczający. W przypadku konwersji z *double* na *float* liczbę dobrano tak, aby przepełniła pojemność typu *float* - zauważ, że wynik konwersji odbiega od oryginalnej wartość, którą wiernie odwzorowywał typ *double*. Dla lepszej czytelności wyniku w wypisaniu drugiej liczby użyto manipulatora *fixed* wymuszającego wypisanie liczby w notacji dziesiętnej. Domyślnie tak duże wartości wypisywane są w notacji wykładniczej, która utrudniałaby porównanie wartości przed i po konwersji. Więcej o manipulatorach wydruku dowiesz się w kolejnym ćwiczeniu.

Przeanalizowaliśmy możliwości konwersji pomiędzy typami rzeczywistymi. Natomiast co z konwersją na inne typy? W przypadku konwersji na typ *int* zawsze będzie się ona wiązała z utratą danych. Jeśli wykonasz poniższą komórkę:

In [3]:
float rzeczywista3 = 12.35;
int calkowita5 = rzeczywista3;
cout << calkowita5 << endl;

12


zauważysz, że liczba została tak jakby zaokrąglona w dół do części całkowitej. Nie jest to jednak prawda, co obrazuje kolejna komórka:

In [4]:
rzeczywista3 = 12.85;
calkowita5 = rzeczywista3;
cout << calkowita5 << endl;

12


Gdyby wynikiem konwersji było zaokrąglenie, w tym przypadku rezultatem powinna być liczba 13, a nie 12. Przy konwersji z typu rzeczywistego na typ całkowity zachodzi więc nie zaokrąglenie liczby do części całkowitej, a zupełna utrata części ułamkowej. Zatem takie przypisanie jest możliwe, ale wiąże się z utratą danych.

W przypadku konwersji na typ *char* sytuacja jest podobna, przy czym należy pamiętać dodatkowo o znacznie mniejszej pojemności typu znakowego. Dokonując poniższej konwersji:

In [5]:
rzeczywista3 = 65.954;
char znak1 = rzeczywista3;
cout << znak1 << endl;

A


utraciliśmy rozwinięcie dziesiętne. Część całkowita wynosi 65, co stanowi kod wyświetlonego znaku ‘A’.

Reguły konwersji typu *float* lub *double* na typ *bool* są podobne, jak w przypadku konwersji z typu *int*. Wartość 0.0 daje logiczny fałsz, natomiast jakakolwiek niezerowa liczba rzeczywista daje prawdę:

In [6]:
float rzeczywista4 = 0.0;
bool logiczna3 = rzeczywista4;
float rzeczywista5 = -0.05;
bool logiczna4 = rzeczywista5;
cout << logiczna3 << endl << logiczna4 << endl;

0
1


Kolejnym możliwym przypadkiem jest przyjęcie *char* jako typu źródłowego. Skoro zarówno *char*, jak i *int* są tak naprawdę liczbami, a przy tym pojemność *int* jest większa, konwersja z *char* na *int* odbędzie się bezstratnie:

In [7]:
char znak2 = 'r';
int calkowita6 = znak2;
cout << calkowita6 << endl;

114


Natomiast sama wartość nie będzie już interpretowana jako kod znaku w tabeli ASCII, a jako zwykła liczba całkowita. Jest to wygodna metoda sprawdzenia kodu liczbowego danego znaku, czego można dokonać również konwersją jawną:

In [8]:
cout << int('s') << endl;

115


Skoro typ *char* jest kowertowalny na typ *int*, to jest również konwertowalny na typy rzeczywiste *float* i *double* – liczbę całkowitą można przecież przechować w zmiennej typu rzeczywistego:

In [9]:
znak2 = 'r';
float rzeczywista6 = znak2;
cout << rzeczywista6 << endl;

114.000000


Tu również konwersja zachodzi bezstratnie. W przypadku konwersji *char* na typ *bool* reguły znów są podobne, jak przy konwersji *int* -> *bool*. Tylko znak o zerowym kodzie ASCII (znak pusty, tzw. NULL, uzyskiwany kodem sterującym ‘\0’) daje logiczny fałsz. Każdy inny znak prowadzi do uzyskania logicznej prawdy:

In [10]:
char znak3 = '\0';
char znak4 = '4';
bool logiczna5 = znak3;
bool logiczna6 = znak4;
cout << logiczna5 << endl << logiczna6 << endl;

0
1


Ostatnim wariantem jest przyjęcie wartości typu *bool* jako wartości źródłowej. Pozostałe 4 typy są w istocie liczbami, więc reguły są stosunkowo proste. Wartość *false* odpowiada liczbowej wartości zero (całkowitej 0 lub rzeczywistej 0.0), co w przypadku typu *char* daje kod liczbowy 0 odpowiadający znakowi NULL w tablicy ASCII. Wartość *true* w konwersji na inne typy zawsze odpowiada wartości 1. Dla typu *char* wartość ta odpowiada w tabeli ASCII znakowi SOH (ang. *Start of Heading* – początek nagłówka):

In [11]:
cout << int(false) << ',' << float(false) << ',' << char(false) << endl;
cout << int(true) << ',' << float(true) << ',' << char(true) << endl;

0,0.000000, 
1,1.000000,


Wykonując powyższą komórkę zauważyłeś, że dla *false* zarówno konwersja na typ *int*, jak i *float* daje 0, natomiast *true* daje 1. Wyniki konwersji dla *char* nie są wyświetlane, ponieważ zarówno NULL jak i SOH nie są znakami graficznymi – są to białe znaki.

Podsumowując, możliwa jest konwersja między wszystkimi typami fundamentalnymi. Jednak nie zawsze ma ona sens, gdyż w niektórych przypadkach może się wiązać z utratą istotnych danych. Poniższa tabela podsumowuje możliwości konwersji pomiędzy typami fundamentalnymi: b – konwersja bezstratna, m – możliwa utrata danych (w zależności od konwertowanej wartości), s – konwersja stratna. Zauważ, że konwersja na typ *bool* jest zawsze konwersją stratną – tracona jest informacja o oryginalnej wartości.

| Typ źródłowy | int | float | double | char | bool |
|-----|------|-----|------|-----|------|
| **Typ docelowy** |  |  |  |  |  |
|  **int**  | - |  m |  m  |  b | b |
|  **float**  |  b | - | m | b | b |
|  **double**  |  b |  b  | - |  b | b |
|  **char** | m |  m  | m | - |  b |
|  **bool**  | s |  s  |  s   | s | - |

## Typy zmodyfikowane

Ostatnim zagadnieniem poruszonym w tym ćwiczeniu są typu zmodyfikowane. Są rozszerzeniem zestawu typów fundamentalnych, pozwalającym dostosować niektóre z nich do specyficznych zastosowań.

### Typ unsigned

Jak już wiesz, w zmiennej typu *int* można przechowywać liczby całkowite dodatnie i ujemne mieszczące się w zakresie określonym pojemnością typu. Niekiedy jednak występują sytuacje, gdy nie bierzemy pod uwagę liczb ujemnych. Wtedy definicję zmiennej typu *int* można poprzedzić słowem *unsigned*. Rozmiar tak zdefiniowanej zmiennej wciąż będzie wynosił 4 B, natomiast wszystkie 32 bity będą wyrażały wartość liczbową w formie ciągu binarnego – najstarszy bit nie będzie kodował znaku liczby. Wobec tego zakres możliwych do przechowania wartości przesunie się z -2 147 483 648 do 2 147 483 647 na 0 do 4 294 967 295. Zauważysz to w poniższym przykładzie:

In [13]:
int duza_liczba = 4294967295;
unsigned int duza_liczba1 = 4294967295;
cout << duza_liczba << endl << duza_liczba1 << endl;
cout << sizeof(unsigned int) << endl;

-1
4294967295
4


Dla pierwszej zmiennej, zdefiniowanej jako *int* wypisana wartość jest niepoprawna, co wyjaśnialiśmy już przy omawianiu typu *int*. W przypadku drugiej zmiennej wartość jest już przechowywana prawidło. Natomiast zwrócony przez operator *sizeof()* rozmiar zmiennej typu *unsigned int* wciąż wynosi 4 B. Modyfikator *unsigned* nie zmienia więc pojemności zmiennej, a jedynie sposób odczytu przydzielonej dla niej pamięci. Istnieje również modyfikator *signed*, wymuszający uwzględnianie znaku liczby, jednak definicja zmiennej typu *int* domyślnie daje typ uwzględniający znak *signed int*. Modyfikatorów *signed* i *unsigned* nie można używać dla typów rzeczywistych *float* i *double*.

### Typy o zmodyfikowanej pojemności

W C++ istnieje również zestaw modyfikatorów, które zmieniają pojemność niektórych typów podstawowych poprzez zmianę rozmiaru przydzielanej im pamięci. Modyfikator ***short*** ma zastosowanie tylko dla typu *int*. Zmienia on rozmiar zmiennej ze standardowych 4 B na 2 B, czyli dostępne jest 16 bitów. Przekłada się to na $2^{16} = 65 \;536$ możliwych do przechowania wartości.

In [14]:
short int x1 = 20000;
short int x2 = 65535;
cout << x1 << endl << x2 << endl;
cout << sizeof(short int) << endl;

20000
-1
2


Zmienna *x1* prawidłowo przechowuje przypisaną wartość, natomiast w przypadku *x2* doszło do przepełnienia – modyfikator *short* nie wymusza pomijania znaku. Wobec tego realny zakres wartości możliwych do przechowania w zmiennej *short int* wynosi od -32 768 do 32 767. Jeśli nie interesują nas liczby ujemne, można wymusić pomijanie znaku modyfikatorem *unsigned*:

In [15]:
short unsigned int x3 = 65535;
cout << x3 << endl;

65535


Teraz przypisana liczba jest przechowywana prawidłowo. Jak widzisz modyfikator *unsigned* i modyfikatory pojemności mogą być używane razem, przy czym dopuszczalna jest dowolna kolejność modyfikatorów: możemy zapisać *unsigned short int x3;*, jak i *short unsigned int x3;*. Możesz się też spotkać ze skróconym zapisem *short x3;*, *unsigned x3;*, a nawet *unsigned short x3;*. Zapisy te pomijają nazwę typu fundamentalnego *int*, ale jest on tam obecny domyślnie. Zatem zapis *short x3;* jest równoważny zapisowi *short int x3;*. Jest to prawdziwe również dla pozostałych modyfikatorów pojemności.

Drugim z dostępnych modyfikatorów pojemności jest *long*, który może być stosowany dla typów *int* i *double*. Jednak jeśli wykonasz poniższą komórkę zauważysz, że dla typu *int* zastosowanie tego modyfikatora nie zmienia rozmiaru:

In [16]:
long int x4 = 246;
cout << sizeof(long int) << endl;

4


W obecnych implementacjach języka C++ przyjęto,  że zarówno *int* jak i *long int* mają ten sam rozmiar i tę samą pojemność. Standard języka C++ określa jedynie minimalne rozmiary poszczególnych typów, w tym dla typu *int* i *long int* podając jako minimalny rozmiar 32 bity. Jednakże w starszych implementacjach zdarzało się, że typ *int* zajmował 16 bitów. Wtedy typ *long int* faktycznie zwiększał pojemność względem standardowej. Podobnie jak dla modyfikatora *short*, zapis *long int x4;* jest równoważny zapisowi *long x4;*. Można również łączyć modyfikator *long* z modyfikatorem *unsigned*.

Dla typu *double*, użycie modyfikatora *long* przynosi już wyraźny efekt:

In [18]:
long double ld1 = 12.65;
cout << sizeof(long double) << endl;

16


Zajmowany przez zmienną rozmiar pamięci został podwojony i wynosi 16 B. Zatem możliwe jest przechowanie liczb zmiennoprzecinkowych z jeszcze większą precyzją. Definiując zmienną rzeczywistą o zwiększonej precyzji nie można już zapisać *long ld1;* - domyślnie będzie to zmienna typu *long int*. W nazwie typu musi się znaleźć słowo *double* określające, że chodzi nam o powiększony typ rzeczywisty.

Ostatnim modyfikatorem pojemności jest *long long*, który ma zastosowanie tylko dla typu *int*. Ponownie zapis *long long x5;* jest równoważny zapisowi *long long int x5;*. Wykonaj poniższą komórkę, aby sprawdzić rozmiar typu *long long int*:


In [19]:
long long int x5 = 24357;
cout << sizeof(long long int) << endl;

8


Wynikiem jest 8 B, co przekłada się na 64 bity zajmowane przez wartość tego typu. Znacząco podnosi to pojemność zmiennej, mogącej teraz przechowywać wartości od -9 223 372 036 854 775 808 do 9 223 372 036 854 775 807. Możliwe jest też zdefiniowanie zmiennej *unisgned long long int*, dla której maksymalna przechowywana wartość wyniesie $2^{64}$ = 18 446 744 073 709 551 616 (ponad 18 trylionów).
Podsumowując:
- modyfikator *short* – tylko dla typu *int*, zmniejsza dwukrotnie rozmiar zmiennej (z 4 B do 2 B);
- modyfikator *long* – dla typu *int* i *double*, dla *int* w większości implementacji nie zmienia rozmiaru, dla *double* podwaja rozmiar (z 8 B do 16 B);
- modyfikator *long long* – tylko dla typu *int*, podwaja rozmiar zmiennej (z 4 B do 8 B).


### Zadanie

Poniższy program oblicza wartość silni liczby *n* za pomocą pętli *for* (z zasadą działania pętli zapoznasz się w dalszych ćwiczeniach). Wartość *n* jest wczytywana od użytkownika – po wykonaniu komórki musisz podać liczbę naturalną i wcisnąć ENTER. Sprawdź jego działanie dla kilku liczb mniejszych lub równych 12. Uwaga: przed każdym ponownym uruchomieniem zresetuj kernel, aby uniknąć błędów redefinicji zmiennych.

In [1]:
#include <iostream>
using namespace std;

int n;
int silnia = 1;
cout << "Podaj liczbe naturalna i wcisnij ENTER: ";
cin >> n;
for (int i=1;i<n+1;i++){
    silnia = silnia*i;
}
cout << "Silnia liczby " << n << " wynosi: " << silnia << endl;

Podaj liczbe naturalna i wcisnij ENTER: 

 1


Silnia liczby 1 wynosi: 1


Wyniki zapewne są poprawne. Sprawdź teraz działanie programu dla liczby 13. Rezultat zapewne jest nieprawidłowy. Wiedząc, że obliczona wartość silni jest przechowywana w zmiennej *silnia*, wykorzystaj odpowiedni modyfikator pojemności, aby silnia była obliczana prawidłowo również dla większych liczb.

### Odpowiedź

Problem tkwi w przepełnieniu pojemności zmiennej typu *int*. Aby zwiększyć pojemność, zmień typ zmiennej *silnia* z *int* na *long long int*. Oczywiście rozwiązanie to pozwala zwiększyć poprawność w stosunkowo niewielkim zakresie liczb – silnia rośnie na tyle szybko, że już dla liczby 21 wartość silni przepełnia nawet typ *long long int*.

![logotypy.png](../figures/OMNIS2_logotypy.png)