## Еще совсем немного о float в Python

### Ограничения

Мы знаем, что компьютер оперирует числами в двоичной системе. 

Иногда значения сопоставимы, как, например в случае с дробью 1/8

$\frac{1}{8} = 0.125_{10} = 1 / 10 + 2 / 100 + 5 / 1000$ и $0.001_2 = \frac{1}{8}$

На примере десятичной системы счисления, мы, например, уже никак не можем точно записать дробь $\frac{1}{3}$:

$\frac{1}{3} \approx 0.3 \approx 0.33 \approx 0.33(3)$

Также и в двоичной уже дробь $\frac{1}{10}$ не представляется точно:

0.0001100110011001100110011001100110011001100110011...

On most machines, if Python were to print the true decimal value of the binary approximation stored for 0.1, it would have to display

In [1]:
0.1000000000000000055511151231257827021181583404541015625

0.1

In [2]:
1 / 10 

0.1

In [3]:
f'{1 / 10:.60f}'

'0.100000000000000005551115123125782702118158340454101562500000'

### Будьте очень аккуратны со сравнениями float

In [4]:
1.53 - 1. == 0.53

True

![](img/meme.jpeg)

In [5]:
.1 + .1 + .1 == .3

False

In [6]:
round(.1, 1) + round(.1, 1) + round(.1, 1) == round(.3, 1)

False

In [7]:
round(.1 + .1 + .1, 3) == round(.3, 3)

True

Хорошая напоминалка есть во многих источниках и в частности в [официальной документации](https://docs.python.org/3/tutorial/floatingpoint.html)

## Строки и разное с ними связанное

### Строки и кавычки

In [8]:
print("Hello world!")

Hello world!


Строка – это объект, как и число. Строки используются для записи текстовой информации, а также произвольных последовательностей байтов. Чтобы отличать обычную строку от строк кода, её нужно обрамлять либо одинарными, либо двойными кавычками. 

In [9]:
#Например:
"Hello world!" == 'Hello world!'


True

Если текст состоит из нескольких строк, его нужно обрамлять в тройные кавычки

In [10]:
print("""Hello 
world!""")

Hello 
world!


Кавычки в таких случаях также могут быть как одинарными, так и двойными

In [11]:
print('''Hello 
world!''')

Hello 
world!


Символы кавычек внутри строк нужно экранировать, то же самое со специсимвлолами. Например, `\t` (символ вертикальной табуляции) или `\n` -- символ перевода строки

### Что такое строка

Строка -- это частный случай последоватьностей в Python, представитель группы `Flat sequences`. То есть, строка -- это последовательность, каждый элемент в которой представляет лишь один тип. Можно сказать, что строка -- это последовательность символов.

Также строка -- одна из неизменяемых последовательностей (immutable sequences). Это значит, что мы не можем ее изменить после создания

In [30]:
example_str = 'example_str'

Строка является последовательностью односимвольных строк, к которым можно получить доступ. Строки можно сохранять в переменные и выполнять над ними некоторые операции.

In [None]:
name = "Jack"
surname = "Daniels"
print("I love " + name + ' ' + surname) #конкатенация или склейка строк
say = "Meow"
print(say * 3) #повторение строки
print(len(say)) #длина строки say


I love Jack Daniels
MeowMeowMeow
4


Функция input() считывает строку из консоли, пока не нажат enter

In [None]:
print("What is your name?")
name = input()
print("Hello," + name)


What is your name?


Функция **len()** возвращает длину строки-параметра

In [None]:
s = input()
print(len(s))

hello
5


### Что происходит, когда мы печатаем на экран?

Вам что-то говорят следующие названия?   `__repr__ , __str__`

In [226]:
class MyPrettyInt:
    def __init__(self, value: int):
        self.value = value
    
    def __repr__(self):
        return f'MyPrettyInt({self.value})'
    
    def __str__(self):
        return f'here is my pretty {self.value}'

Строка, возвращаемая `__repr__` должна быть однозначной и по возможности совпадать с кодом, требуемым для создания показываемого объекта

Если не определить `__repr__`, то

Строка, возвращаемая `__str__`, должна быть понятной конечному пользователю

Если не определить `__str__`, то

### Слайсы на примере строк

#### Немного общей информации

    "As you may have noticed, several of the operations mentioned work equally for texts, lists and tables. Texts, lists and tables together are called trains. 
    […] The FOR command also works generically on trains"

Мощь Python в том, что для многих схожих классов у нас есть общее множество поддерживаемых операций. Например, strings, lists, byte sequences, arrays и др. поддерживают iteration, slicing, sorting, contactenation и прочие общие операции.

Understanding и embracing данного принципа помогает нам не изобретать велосипед, а использовать общий интерфейс, который дает реализуемым классам поддержку уже принятых методов 

#### Slicing (срезы, слайсы, whatever you call it)

**Slicing** -- это общая фича всех последовательностей в Python. Ниже мы рассмотрим ее на примере строк, но помните, что это относится и к другим последовательностям

`sequence[start:stop:step]`

Срезы нужны для того, чтобы извлечь подстроки или символы из исходной строки. Таким образом, создаётся новая строка, а исходная остается неизменённой.

#### Basics

Чтобы обратиться к символу строки, используются две нумерации: неотрицательными и отрицательными числами.

![alternate text](https://pp.userapi.com/c837320/v837320502/59b9f/c4cTcRUnMWg.jpg)

Нумерация неотрицательными числами начинается с 0 и идет слева направо. То есть чтобы получить первый символ строки s, нужно написать s[0], второй символ – s[1], и т.д.

Нумерация отрицательными числами начинается с -1 и также идет слева направо (справа налево, если смотреть на модуль числа). То есть чтобы получить последний символ строки s, нужно написать s[-1], предпоследний символ – s[-2], и т.д.

In [11]:
# Например
s = "Hello world!"  # создали переменную s со содержимым “Hello world!”
print(s[0])  # печатает первый символ строки
print(s[-1])  # печатает последний символ строки
print(s[15])  # выдаст ошибку, так как должна напечатать 16-ый элемент строки, а длина строки s меньше 16 символов

H
!


IndexError: string index out of range

Следующий вид срезов – с двумя параметрами, между которыми ставится двоеточие. Если нужно получить подстроку строки s с __i__ по __j__ символы включительно, то нужно применить срез __s[i: j+1]__.

Правая граница не включается

...

...

...

![](img/why.png)

!

![](img/reason.jpg)

Это не просто так!

#### Правая граница

1. Просто сразу видеть длину слайса, если задана только конечная позиция!
`my_seq[:3] -- 3 items`

2. Просто посчитать длину!
`stop - start == length`

3. Просто разбирать на две части без пересечения!


In [14]:
my_seq = '123456789'

print(my_seq[:3], my_seq[3:])

for i in range(len(my_seq)):
    assert my_seq[:i] + my_seq[i:] == my_seq

123 456789


#### Step

In [101]:
my_seq[::2]

'13579'

In [102]:
my_seq[::-1]

'987654321'

#### Слайсы можно именовать

Пусть у нас есть большая строчка

In [105]:
invoice = """
0.....6.................................40........52...55........
1909  Pimoroni PiBrella                   $17.50     3    $52.50
1489  6mm Tactile Switch x20              $4.95      2    $9.90
1510  Panavise Jr. - PV-201               $28.00     1    $28.00
1601  PiTFT Mini Kit 320x240              $34.95     1    $34.95
"""

In [109]:
NUMBER = slice(0, 6)
DESC = slice(6, 40)
PRICE = slice(40, 52)
TOTAL = slice(55, None)

for sold_item in invoice.split('\n')[2:]:
    print(sold_item[PRICE], sold_item[DESC])

  $17.50     Pimoroni PiBrella                 
  $4.95      6mm Tactile Switch x20            
  $28.00     Panavise Jr. - PV-201             
  $34.95     PiTFT Mini Kit 320x240            
 


#### Особые случаи

Если взять срез s[:], то получим копию исходной строки

Если в качестве второго параметра в срезе взять число, большее или равное данной строке, то будут взять все символы, начиная номера символа первого параметра среза до конца строки

Если в срезе первый параметр находится правее второго, то будет сгенерирована пустая строка.

И последний вид срезов – срезы с тремя параметрами, где третий параметр задаёт за шаг, с которым берутся символы.

Например срез s[::2] берет все символы строки s с шагом 2, то есть через один.


Также шаг может быть отрицательным, в таком случае первый параметр должен находиться правее второго. С помощью среза s[::-1] можно получить развернутую строку s.

### Форматирование (reminder)

Часто возникают ситуации, когда нужно сделать строку, подставив в неё некоторые данные, полученные в процессе выполнения программы. 
Форматирование можно сделать с помощью оператора %, format и f-string

Чтобы отформатировать строку  требуется:


#### Оператор %.  

<Строка формата, содержащая один или более спецификаторов формата(например, %d (digit))> % <объект (или объекты, в виде кортежа),значение которого должно быть подставлено на место спецификатора (или спецификаторов) в левой части выражения>.


In [None]:
print('That  is  %d  %s  fish!' % (1, 'gold')) 

That  is  1  gold  fish!


In [None]:
print("%d %s %d you" % (1, 'spam', 4) )

1 spam 4 you


In [None]:
"%s -- %s -- %s" % (42, 3.14159, [1, 2, 3]) 

'42 -- 3.14159 -- [1, 2, 3]'

**почему так больше не надо**

Хотя бы потому, что это очень длинно и малочитаемо

In [26]:
first_name = "Eric"
last_name = "Idle"
age = 74
profession = "comedian"
affiliation = "Monty Python"

"Hello, %s %s. You are %s. You are a %s. You were a member of %s." % (first_name, last_name, age, profession, affiliation)

'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

#### format

In [18]:
weight_of_one_sheep = 23.1234
print('One sheep is {:.3f} kilos'.format(weight_of_one_sheep))

One sheep is 23.123 kilos


Удобство *.format* заключается в том, что можно передавать строку с плейсхолдерами, а потом их доопределять. Плейсхолдеры могут быть именованными или нет, в единственном числе или множество. Пример:

In [13]:
new_estimation = 42.

future_info_unnamed = 'Our brand new estimation of sheeps weight is {:.3f} kilos'
print(future_info_unnamed.format(new_estimation))

future_info_named = 'Our brand new estimation of sheeps weight is {new_value:.3f} kilos'
print(future_info_named.format(new_value=new_estimation))

future_info_named_mult = 'Our brand new estimation of sheeps {item} is {new_value:.3f} kilos'
print(future_info_named_mult.format(item='weight', new_value=new_estimation))

Our brand new estimation of sheeps weight is 42.000 kilos
Our brand new estimation of sheeps weight is 42.000 kilos
Our brand new estimation of sheeps weight is 42.000 kilos


In [19]:
'{0}, {1}, {2}'.format('a', 'b', 'c')

'a, b, c'

In [20]:
'{}, {}, {}'.format('a', 'b', 'c')

'a, b, c'

In [21]:
'{2}, {1}, {0}'.format('a', 'b', 'c')

'c, b, a'

А еще поддерживает задание кастомного форматирования с помощью `__format__()`!

Классно, но все еще длинно

In [54]:
first_name = "Eric"
last_name = "Idle"
age = 74
profession = "comedian"
affiliation = "Monty Python"

pattern_str = "Hello, {first_name} {last_name}. You are {age}. You are a {profession}. You were a member of {affiliation}."

pattern_str.format(
    first_name=first_name,
    last_name=last_name,
    age=age,
    profession=profession,
    affiliation=affiliation,
)

'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

Можно чуть короче, если есть dict

In [56]:
data = {
    'first_name': 'John',
    'last_name': 'Doe',
    'age': '18',
    'profession': 'seeker',
    'affiliation': 'humanity'
}

pattern_str.format(**data)

'Hello, John Doe. You are 18. You are a seeker. You were a member of humanity.'

#### f-strings

Как format, только чуть короче

Можно писать коротко

In [57]:
name = 'Denis'
surname = 'Belyakov'

f'my name is {name} {surname}'

'my name is Denis Belyakov'

И можно использовать выражения!

In [58]:
f'my name is {name.upper()} {surname*3}'

'my name is DENIS BelyakovBelyakovBelyakov'

Вспомним наш кастомный класс

In [59]:
class MyPrettyInt:
    def __init__(self, value: int):
        self.value = value
    
    def __repr__(self):
        return f'MyPrettyInt({self.value})'
    
    def __str__(self):
        return f'here is my pretty {self.value}'

Вызов `format` для него будет вызывать метод `__str__`, а потом уже `__repr__`

In [60]:
pretty_int = MyPrettyInt(4) 

In [61]:
f'{pretty_int} and it is the prettiest!'

'here is my pretty 4 and it is the prettiest!'

Можно насильно вызвать `__repr__` написав `!r`

In [63]:
f'{pretty_int!r} and it is the prettiest!'

'MyPrettyInt(4) and it is the prettiest!'

**Мультистрока**

In [67]:
print(f'''
My 
name is {name}
and surname is {surname}
''')


My 
name is Denis
and surname is Belyakov



In [74]:
sample_str = f'My ' \
             f'name is {name} ' \
             f'and surname is {surname}' \

print(sample_str)

My name is Denis and surname is Belyakov


**А еще он быстрее**

In [75]:
name = 'John'
surname = 'Doe'
age = 99

In [86]:
%%timeit -n 1000000
'name is %s, surname is %s, and age is %d' % (name, surname, age)

225 ns ± 14.9 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [87]:
%%timeit -n 1000000
'name is {name}, surname is {surname}, and age is {age}'.format(name=name, surname=surname, age=age)

576 ns ± 11.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [88]:
%%timeit -n 1000000
f'name is {name}, surname is {surname}, and age is {age}'

155 ns ± 12.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


**special cases**

In [90]:
f'I love \'Nestle\' chocolate' # экранирование

"I love 'Nestle' chocolate"

In [98]:
f'Values in braces are the best: {{4 + 5}}'  # {{}} для показа скобочек

'Values in braces are the best: {4 + 5}'

In [99]:
f'Values in braces are the best: {{{4 + 5}}}'  # {{{}}} для показа скобочек и вычисления

'Values in braces are the best: {9}'

In [100]:
f'Values in braces are the best: {{{{4 + 5}}}}'  # {{{}}} для показа скобочек и вычисления

'Values in braces are the best: {{4 + 5}}'

Ну, вы поняли

### Дополнительные функции и методы строк

In [None]:
# Функция input() считывает строку из консоли, пока не нажат enter
s = input()
print(s*3)

eeew
eeeweeeweeew


*Поиск подстроки в строке. Возвращает номер первого вхождения или -1*

    s.find(str, [start],[end])
    
*Поиск подстроки в строке. Возвращает номер последнего вхождения или -1*

    s.rfind(str, [start],[end]

*Поиск подстроки в строке. Возвращает номер первого вхождения или вызывает ValueError*

    s.index(str, [start],[end])

*Поиск подстроки в строке. Возвращает номер последнего вхождения или вызывает ValueError*

    s.rindex(str, [start],[end])
    
*Замена шаблона*

    s.replace(шаблон, замена)
    
*Разбиение строки по разделителю*

    s.split(символ)
    
*Состоит ли строка из цифр*

    s.isdigit()
    
*Состоит ли строка из букв*

    s.isalpha()

*Состоит ли строка из цифр или букв*

    s.isalnum()

*Состоит ли строка из символов в нижнем регистре*

    s.islower()
    

*Состоит ли строка из символов в верхнем регистре*
    
    s.isupper()

*Состоит ли строка из неотображаемых символов (пробел, символ перевода страницы ('\f'), "новая строка" ('\n'), "перевод каретки" ('\r'), "горизонтальная табуляция" ('\t') и "вертикальная табуляция" ('\v'))*
    
    s.isspace()

*Начинаются ли слова в строке с заглавной буквы*

    s.istitle()

*Преобразование строки к верхнему регистру*
    
    s.upper()

*Преобразование строки к нижнему регистру*
    
    s.lower()

*Начинается ли строка S с шаблона str*
    
    s.startswith(str)

*Переводит символы нижнего регистра в верхний, а верхнего – в нижний*
    
    s.swapcase()


*Символ в его код ASCII*
    
    ord(символ)

*Код ASCII в символ*
    
    chr(число)


*Возвращает количество непересекающихся вхождений подстроки в диапазоне [начало, конец] (0 и длина строки по умолчанию)*

    s.count(str, [start],[end])


*Удаление пробельных символов в начале строки*

    s.lstrip([chars])

*Удаление пробельных символов в конце строки*

    s.rstrip([chars])

*Удаление пробельных символов в начале и в конце строки*

    s.strip([chars])

*Первую букву каждого слова переводит в верхний регистр, а все остальные в нижний*
    
    s.title()

### Метод split()

Метод `split()` разделяет строку на подстроки по указанному разделителю и выдает на выходе другую (уже изменяемую!) последовательность -- `list`

In [None]:
s = "mother, father, sister, brother"
s.split(", ")

['mother', 'father', 'sister', 'brother']

Если разделитель не указан, что строка разделяется по любому whitespace символу

In [134]:
s = "mother father \t sister \n brother   me"
s.split()

['mother', 'father', 'sister', 'brother', 'me']

### Text Versus Bytes

Выше мы дали определение строки как неизменяемая последовательность символов (immutabe sequence of _charachters_). Но что такое _charachter_?

в Python3 это символ Unicode. В зависимости от используемого стандарта Unicode, представление кода в байтах может отличаться

In [138]:
s = 'café'
len(s)  # 4 символа юникода

4

In [141]:
b = s.encode('utf8')
b  # 5 байт в кодировке, т.к. последний символ занимает 2 байта в UTF-8

b'caf\xc3\xa9'

In [140]:
b.decode('utf8')

'café'

## Bonus: let's have fun

In [198]:
bar = 'foo'

1. Сделайте удвоение строчки с помощью .format(), чтобы в ней было ровно два упоминания переменной `bar`

In [173]:
bar = '{0}:{0}'.format(bar)

In [206]:
assert bar == 'foo:foo'

2. Сделайте то же самое с использованием format, только совсем без использования символов {}

In [2]:
bar = 'foo'

In [205]:
bar = str(repr(set([0,]))*2).format(bar)

In [207]:
assert bar == 'foofoo'

3. Получите строчку 'foofoo' с использованием функции format, без использования {} и без использования каких-либо переменных

In [224]:
answer = (str(format).split()[-1][:-1][:2] + str(format).split()[-1][:-1][1]) * 2

In [225]:
assert answer == 'foofoo'