# Cvičení 02 - Čísla, Řetězce

## Čísla

### Python int
V minulém cvičení jsme si říkali, že v pythonu jsou dva základní typy čísel: `int` a `float`. Než se podíváme trochu více do hloubky bych chtěl ještě upřesnit odpověď na jeden dotaz - jak velký je v pythonu `int`? Minule jsem odpověděl, že `int64`, což nebylo úplně přesné - implementace `int` v pythonu3 je poněkud složitější.

In [1]:
import sys

i = 1
j = 12345**12345

print("i:", type(i), "of size", sys.getsizeof(i), "bytes.")
print("j:", type(j), "of size", sys.getsizeof(j), "bytes.")

i: <class 'int'> of size 28 bytes.
j: <class 'int'> of size 22396 bytes.


Jak je vidět, `int` je v pythonu3 implementován jako postupně se zvětšující pole číslic a ne jako číslo s pevně vymezenou oblast paměti. Pokud chcete pracovat s `int` jako např. v C++ musíte využít numpy:

In [2]:
import numpy as np

print("i as int32:", np.uint32(i))
print("j as int64:", np.int64(j))

i as int32: 1


OverflowError: ignored

Více info na https://www.quora.com/How-is-a-long-integer-implemented-in-python nebo v [PEP237](https://www.python.org/dev/peps/pep-0237/)

### Python float

`float` je v pythonu implementován jako `float64`. Float s jinou přesností je možné použít opět prostřednictvím numpy (`np.float16`, ...)

In [3]:
print("2.28 as python float is ", (2.28).hex())
print("2.28 as numpy float64 is", np.float64(2.28).hex())

a = 2.32343265622321313
b = np.float32(a)
c = np.float16(b)

print(a, b, c)

2.28 as python float is  0x1.23d70a3d70a3dp+1
2.28 as numpy float64 is 0x1.23d70a3d70a3dp+1
2.323432656223213 2.3234327 2.324


### Číselné operátory, standardní knihovna `math`

V minulém cvičení jsme si povídali o operátorech:

- číselné:
  - `+` sčítání
  - `-` odčítání
  - `*` násobení
  - `**` mocnění
  - `/` dělění
  - `//` celočíselné dělění
  - `%` zbytek po celočíselném dělění

  Nyní si ukážeme další funkce ze standardní knihovny `math` https://docs.python.org/3/library/math.html

In [4]:
import math

print("#### constants ###")
print("math.pi", math.pi)
print("math.e", math.e)
print("### basic arithmetics ###")
print("math.ceil(2.8)", math.ceil(2.8))
print("math.floor(2.8)", math.floor(2.8))
print("math.trunc(2.8)", math.trunc(2.8))
print("math.trunc(-2.8)", math.trunc(-2.8))
print("round(2.55332, 2)", round(2.55332, 2))
print("### power functions ###")
print("math.pow(2, 5)", math.pow(2, 5))
print("math.exp(2)", math.exp(2))
print("### log functions ###")
print("math.log(math.e)", math.log(math.e))
print("math.log(10**2,10)", math.log(10**2, 10))
print("### complex numbers ###")
print("i+3j", i+3j)
print("type(i+3j)", type(i+3j))
print("### další funkce ###")
print("Nejvyšší společný dělitel: math.gcd(200,300)", math.gcd(200, 300))
print("Suma: math.fsum(range(1, 6))", math.fsum(range(1, 6)))
print("sum(range(1, 6))", sum(range(1,6)))
print("math.prod(range(1, 6))", math.prod(range(1, 6)))
print("math.factorial(5)", math.factorial(5))
print("### geometrie a goniometrické funkce ###")
print("math.radians(90)", math.radians(90))
print("math.degrees(math.pi / 2)", math.degrees(math.pi / 2))
print("math.cos(math.pi)", math.cos(math.pi))
print("math.sin(math.pi)", math.sin(math.pi))

# pro ty, kteri chteji vedet vic...
# help(math)

#### constants ###
math.pi 3.141592653589793
math.e 2.718281828459045
### basic arithmetics ###
math.ceil(2.8) 3
math.floor(2.8) 2
math.trunc(2.8) 2
math.trunc(-2.8) -2
round(2.55332, 2) 2.55
### power functions ###
math.pow(2, 5) 32.0
math.exp(2) 7.38905609893065
### log functions ###
math.log(math.e) 1.0
math.log(10**2,10) 2.0
### complex numbers ###
i+3j (1+3j)
type(i+3j) <class 'complex'>
### další funkce ###
Nejvyšší společný dělitel: math.gcd(200,300) 100
Suma: math.fsum(range(1, 6)) 15.0
sum(range(1, 6)) 15
math.prod(range(1, 6)) 120
math.factorial(5) 120
### geometrie a goniometrické funkce ###
math.radians(90) 1.5707963267948966
math.degrees(math.pi / 2) 90.0
math.cos(math.pi) -1.0
math.sin(math.pi) 1.2246467991473532e-16


Hezký tutorial např. zde https://realpython.com/python-math-module/

In [5]:
# šestnáctkově
print("int(0xA)", int(0xA))

# osmičkově
print("int(0o10", int(0o10))

# dvojkově
print("int(0b10)", int(0b10))

int(0xA) 10
int(0o10 8
int(0b10) 2


### Opakování logických operátorů

Priorita je od nejvyšší k nejnižší: `not` > `and` > `or`

Ne úplně intuitivní je také přímé použítí logických operátorů not, and, or na typy str, int a podobně.
Ano v pythonu můžete použít výrazy jako `"ahoj" and "vojto"`. Jaký ale bude výsledek tohoto výrazu?

V pythonu platí následující: Prázdný řetězec má hodnotu `False`, neprázdný `True`. Tzn:

In [7]:
print(bool(''))
print(bool('vojta'))

False
True


Pro int pak pak platí: 0 má hodnotu False, nenulový True. Tzn:

In [6]:
print(bool(0))
print(bool(28))
print(bool(-2))

False
True
True



Dále platí pro operátor **and**:

*   Pokud je levá hodnota True, pravá hodnota je vyhodnocena a případně vrácena.
*   Pokud je levá hodnota False, je vrácena (tzn výsledek nemusí být False, může to být prázdný řetězec - viz předchozí stránka):

In [8]:
print(True and "vojta")
print(False and "vojta")
print("" and "vojta", type("" and "vojta"))
print("ahoj" and "vojta")

vojta
False
 <class 'str'>
vojta


Pro operátor **or** pak platí:

*   Pokud je levá hodnota True, je vrácena.
*   Pokud je levá hodnota False, pravá hodnota je vrácena.

In [9]:
print(True or 'vojta')
print(False or 'vojta')

True
vojta


A tak dále.

In [10]:
True and "Vojta" and "Jirka"

'Jirka'

### Binární operátory

Krom minule probíraných operátorů (číselné, logické, porovnávací) jsou v pythonu ještě operátory binární

#### binární operátory >> a <<

Binární operátory pracují pouze s celým čísly (`int`)

In [11]:
# x << y
2 << 1 # 10 --> 100

4

Výsledkem je x s posunutými bity doleva o y pozic. Nové bity zprava budou 0. Stejné jako `x*(2**y)`.

In [12]:
# x >> y
4 >> 1 # 100 -> 10

2

Výsledkem je x s posunutými bity doprava o y pozic. Nové bity zleva budou 0. Stejné jako `x//(2**y)`.

#### binární operátory & a |


In [13]:
# x & y
print(4 & 2, bin(4 & 2))  # 100 & 010 --> 000
print(4 & 5, bin(4 & 5))  # 100 & 101 --> 100

0 0b0
4 0b100


Provede bitový and. Pokud jsou odpovídající bity v obou číslech 1, tak na odpovídajícím místě ve výsledném čísle bude 1, jinak 0.

In [14]:
# x | y
print(4 | 2, bin(4 | 2))  # 100 | 010 --> 110
print(4 | 5, bin(4 | 5))  # 100 | 101 --> 101

6 0b110
5 0b101


Provede bitový or. Pokud jsou odpovídající bity v obou číslech 0, tak na odpovídajícím místě ve výsledném čísle bude 0, jinak 1.

#### binární operátor ^


In [15]:
# x ^ y
print(4 ^ 2, bin(4 ^ 2))  # 100 | 010 --> 110
print(4 ^ 5, bin(4 ^ 5))  # 100 | 101 --> 001

6 0b110
1 0b1


Provede bitový XOR. Pokud jsou odpovídající bity v obou číslech stejné, tak na odpovídajícím místě ve výsledném čísle bude 0, jinak 1.

#### binární operátor ~


In [None]:
print(126, ~126, bin(126), bin(~126), sep="\t")
print(0, ~0, bin(0), bin(~0), sep="\t")
print(-1, ~-1, bin(-1), bin(~-1), sep="\t")

126	-127	0b1111110	-0b1111111
0	-1	0b0	-0b1
-1	0	-0b1	0b0


Prohodí bity v binární reprezentaci x (`~x == -x -1`)

Konvence, že `-x = ~(x-1)` je výhodná při počítání s int.

## Řetězce

V Pythonu 3 jsou všechny řetězce posloupnostmi znaků v **Unicode**.
- Řetězec vytvoříme tak, že posloupnost znaků uzavřeme do uvozovacích znaků. Pythonovské řetězce mohou být definovány uzavřením buď do apostrofů ('; single quotes) nebo do uvozovek ("; double quotes).
- Zabudovaná funkce len() vrací délku řetězce, tj. počet znaků. Je to stejná funkce, jakou používáme pro nalezení délky seznamu, n-tice, množiny nebo slovníku. Řetězec připomíná n-tici znaků.
- S využitím indexové notace můžeme získat jednotlivé znaky řetězce, podobně jako u seznamu.
- Operátor + provádí konkatenaci řetězců (zřetězení, spojení), stejně jako u seznamů.


In [16]:
s = '"Ahoj"'
print('-' * 80)
print(s[0])
print(s[0:2])
print(len(s))
"Ahoj" + "nazdar"

--------------------------------------------------------------------------------
"
"A
6


'Ahojnazdar'

In [17]:
s2 = 'Ahoj'
s3 = 'Ahoj \
na více řádků?'
s4 = """Docstrings
can
have
multiple lines."""

print(s2)
print(s3)
print(s4)

Ahoj
Ahoj na více řádků?
Docstrings
can
have
multiple lines.


### Speciální řetězce
Existuje také možnost používat víceřádkové řetěžce. Ty se uzavírají do ztrojeného znaku `"` nebo `'`.

In [18]:
multiline = """Nejaky
vice
radkovy
text."""
multiline2 = '''Jde
to i
takto'''

Existuje taky velmi mocný nástroj formátovaných řetězců, které nahrazují volání funkce `format(...)` pro formátovaný tisk řetězců.

In [19]:
var = 42
x = 'answer'
print("Odpoved (", x, ") je = ", var, sep='')
print("Odpoved ({}) je = {}".format(x, var))
print("Odpoved ({preklad}) je = {hodnota}".format(hodnota=var, preklad=x))
# jde to udelat prehledneji:
print(f'Odpoved ({x}) je = {var}')  # pozor, nutné string prefixovat pomocí "f"
print(f'Odpoved ({x}) je = {var:0.3f}')

Odpoved (answer) je = 42
Odpoved (answer) je = 42
Odpoved (answer) je = 42
Odpoved (answer) je = 42
Odpoved (answer) je = 42.000


Existují ještě tzv. **raw** stringy s prefixem `r`, kde jde o to, že escapovací `\` je bráno jako normální, nikoli escape znak. Detaily [zde](https://docs.python.org/3/reference/lexical_analysis.html#string-and-bytes-literals). Na to si vzpomeňte při práci s regulárními výrazy.

In [None]:
print('a\tb')
print(r"a\tb")

a	b
a\tb


Dále viz [Strings cheatsheet](https://www.shortcutfoo.com/app/dojos/python-strings/cheatsheet).

### Řetězce vs Seznamy

Seznamy (a také n-tice, množiny a slovníky) budeme probírat příště, ale malou odbočku k seznamům si v tento moment nemůžu odpustit.

Seznamy (lists) jsou uspořádané posloupnosti hodnot.

In [20]:
s = [1, 2, 3]
print(s[1])

for x in s:
  print(x)

s[2]

2
1
2
3


3

Řetězec samozřejmě můžeme převést na seznam přímo pomocí konstruktoru `list()`

In [21]:
list("Ahoj")

['A', 'h', 'o', 'j']

Rozdělení řetězce na části se provádí pomocí metody `split()`. Defaultně se dělí podle mezer, ale lze zvolit vlastní řetězec. Například převod věty na seznam slov:

In [24]:
l = 'All human beings are born free and equal in dignity and rights.'.split(' ')
l

['All',
 'human',
 'beings',
 'are',
 'born',
 'free',
 'and',
 'equal',
 'in',
 'dignity',
 'and',
 'rights.']

A spojit pomocí metody `join()` objektu `str`:

In [25]:
print("".join(l))
print(" ".join(l))
print("_".join(l))

Allhumanbeingsarebornfreeandequalindignityandrights.
All human beings are born free and equal in dignity and rights.
All_human_beings_are_born_free_and_equal_in_dignity_and_rights.


In [26]:
for x in l:
  print(x)

All
human
beings
are
born
free
and
equal
in
dignity
and
rights.


In [27]:
s = "ahoj"
s[1] = "x"

TypeError: ignored

In [28]:
l = list(s)
l[1] = "x"
l

['a', 'x', 'o', 'j']

## List comprehensions

Opět –⁠ toto bude primárně náplní příštího cvičení, ale při řešení úkolu na gitlabu by se vám to mohlo hodit.

List comprehension –⁠ česky generátorová notace seznamu –⁠ je velice běžnou součásti jazyka python a umožňuje stručný zápis vytvoření seznamu z jiného iterable objektu aplikováním funkce na všechny prvky zdrojového objektu.



In [29]:
mocniny = []
for x in range(10):
  mocniny.append(x**2)

print(mocniny)
print([x**2 for x in range(10)])

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]



V našem případě aplikujeme druhou mocninu na všechny x z rozsahu 0 až 10.

Vybraná x lze omezit pomocí if:

In [30]:
[x**2 for x in range(10) if x % 2 == 0]

[0, 4, 16, 36, 64]

S výsledným seznamem lze pracovat jako s každým jiným seznamem, například můžeme jeho prvky sečíst.


In [31]:
sum([x**2 for x in range(10)])

285

Jak číst list comprehensions?

1. Vždy si výrazu najděte prostřední část **`for prvek in iterable`**
2. V levé části pak uvidíte co se prvkem stane před tím než je vložen do nového seznamu, např. **`prvek / 2`**
3. v pravé části najdete podmínku pomocí inline if, která říká kdy prvek projde do levé části výrazu, např. **`if prvek % 2 == 0`**. Tato část je nepovinná

In [None]:
iterable = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print([prvek for prvek in iterable])
print([prvek / 2 for prvek in iterable])
print([prvek / 2 for prvek in iterable if prvek % 2 == 0])


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0]
[1.0, 2.0, 3.0, 4.0, 5.0]


## Příklad
**Každé slovo věty vypíšeme postupně od shora dolů.**

In [32]:
sentence = 'All human beings are born free and equal in dignity and rights'
words = sentence.split()
words

['All',
 'human',
 'beings',
 'are',
 'born',
 'free',
 'and',
 'equal',
 'in',
 'dignity',
 'and',
 'rights']

In [33]:
# zjistime pocet slov a delku nejdelsiho, abychom vedeli jak velky list listu budeme potrebovat
num_words = len(words)
max_len = max([len(x) for x in words])
print(num_words, max_len)
# vetsi z rozmeru bude slouzit jako rozmer rotovaneho "pole" (list listu)
size = max(num_words, max_len)
# print([list(x) for x in words])
ls = [list(x.ljust(size, ' ')) for x in words]
ls

12 7


[['A', 'l', 'l', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['h', 'u', 'm', 'a', 'n', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['b', 'e', 'i', 'n', 'g', 's', ' ', ' ', ' ', ' ', ' ', ' '],
 ['a', 'r', 'e', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['b', 'o', 'r', 'n', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['f', 'r', 'e', 'e', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['a', 'n', 'd', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['e', 'q', 'u', 'a', 'l', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['i', 'n', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['d', 'i', 'g', 'n', 'i', 't', 'y', ' ', ' ', ' ', ' ', ' '],
 ['a', 'n', 'd', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 ['r', 'i', 'g', 'h', 't', 's', ' ', ' ', ' ', ' ', ' ', ' ']]

In [34]:
transposed_ls = [[ls[y][x] for y in range(size)] for x in range(size)]
transposed_ls

[['A', 'h', 'b', 'a', 'b', 'f', 'a', 'e', 'i', 'd', 'a', 'r'],
 ['l', 'u', 'e', 'r', 'o', 'r', 'n', 'q', 'n', 'i', 'n', 'i'],
 ['l', 'm', 'i', 'e', 'r', 'e', 'd', 'u', ' ', 'g', 'd', 'g'],
 [' ', 'a', 'n', ' ', 'n', 'e', ' ', 'a', ' ', 'n', ' ', 'h'],
 [' ', 'n', 'g', ' ', ' ', ' ', ' ', 'l', ' ', 'i', ' ', 't'],
 [' ', ' ', 's', ' ', ' ', ' ', ' ', ' ', ' ', 't', ' ', 's'],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'y', ' ', ' '],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' '],
 [' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ']]

In [35]:
transposed_words = ["  ".join(x) for x in transposed_ls]
transposed_words

['A  h  b  a  b  f  a  e  i  d  a  r',
 'l  u  e  r  o  r  n  q  n  i  n  i',
 'l  m  i  e  r  e  d  u     g  d  g',
 '   a  n     n  e     a     n     h',
 '   n  g              l     i     t',
 '      s                    t     s',
 '                           y      ',
 '                                  ',
 '                                  ',
 '                                  ',
 '                                  ',
 '                                  ']

In [36]:
for x in transposed_words:
  print(x)

A  h  b  a  b  f  a  e  i  d  a  r
l  u  e  r  o  r  n  q  n  i  n  i
l  m  i  e  r  e  d  u     g  d  g
   a  n     n  e     a     n     h
   n  g              l     i     t
      s                    t     s
                           y      
                                  
                                  
                                  
                                  
                                  


## Matrix script - procvičování řetězců

https://colab.research.google.com/drive/1RSs3rwbREbgakun3CoCMqj5aIP-wGwwq?usp=sharing

Zkuste si vyřešit jako samostatný úkol :-)