## Немного о float в Python

https://bit.ly/iad-floats

Вы помните, как хранятся с памяти компьютера float? (IEEE754) Хорошее [видео](https://www.youtube.com/watch?v=RuKkePyo9zk) с объяснением формата

Python использует 64 бита (8 байт):

    - 1 bit для знака (положительное или отрицательное число)
    - 11 bits для экспоненты. Например, 1.5e-5 = 1.5 x 10-5: (экспонента будет -5)
    - 52 bits for significant digits

![](https://media.geeksforgeeks.org/wp-content/uploads/Double-Precision-IEEE-754-Floating-Point-Standard-1024x266.jpg)

Как перевести число:

    1. Определить знак
    
    2. Сконвертировать в binary
    
    3. Нормализовать, чтобы определить мантиссу и unbiased экспоненту (поместить binary point после самой левой единички). "float" binary point влево
    
    4. Посчитать biased exponent (добавить 2^(11 - 1) - 1 = 1023)
    
    5. Удалить leading единичку из мантиссы, потому что мы знаем, что она всегда там должна быть (экономим бит)

### Ограничения

Мы знаем, что компьютер оперирует числами в двоичной системе. Из-за этого мы можем 

Иногда значения сопоставимы, как, например в случае с дробью 1/8

$\frac{1}{8} = 0.125_{10} = 1 / 10 + 2 / 100 + 5 / 1000$ и $0.001_2 = \frac{1}{8}$

In [103]:
0.125 == 1 / 8

True

На примере десятичной системы счисления, мы, например, уже никак не можем точно записать дробь $\frac{1}{3}$:

$\frac{1}{3} \approx 0.3 \approx 0.33 \approx 0.33(3)$

Также и в двоичной уже дробь $\frac{1}{10}$ не представляется точно:

0.0001100110011001100110011001100110011001100110011...

Как думаете, что будет храниться в переменной со значением 0.1?

In [104]:
1 / 10 

0.1

In [107]:
f'{1 / 10:.25g}'

'0.1000000000000000055511151'

In [108]:
0.1.as_integer_ratio()

(3602879701896397, 36028797018963968)

### Будьте очень аккуратны со сравнениями float

In [109]:
1.53 - 1. == 0.53

True

In [110]:
10.4 + 20.8 > 31.2

True

In [112]:
0.8 - 0.1 > 0.7

True

In [116]:
f'{0.8 - 0.1:.25f}'

'0.7000000000000000666133815'

In [117]:
.1 + .1 + .1 == .3

False

In [118]:
round(.1, 1) + round(.1, 1) + round(.1, 1) == round(.3, 1)

False

Хорошая напоминалка есть во многих источниках и в частности в [официальной документации](https://docs.python.org/3/tutorial/floatingpoint.html)

### Как можно делать?

In [120]:
desired_value = 0.1 + 0.2
answer_value = 0.3

round(desired_value, 3) == round(answer_value, 3)

True

Для дробных значений можно использовать модуль `fractions`

In [123]:
from fractions import Fraction

val = Fraction(1, 10)

In [124]:
val + val + val == Fraction(3, 10)

True

Можно использовать метод `isclose()` из `math`

In [24]:
from math import isclose

In [125]:
isclose(0.1 + 0.2, 0.3)

True

## (*) Про память

In [10]:
2 * (1_000_000 + 1)

2000000

Что происходит в этот момент?

1. Лексический парсер
2. Синтаксический анализ выражения
3. Вычисление выражения:

    3.1 Заводятся объекты 1_000_000 и 1
    
    3.2 Вычисляется их сумма и заводится объект 1000001
    
    3.3 Заводится объект 2
    
    3.4 Заводится объект 2 * 1000001
    
    3.5. Получается объект результата выражения

4. Объекты удаляются, потому что на них ничего не ссылается



Когда мы пишем "=", мы сохраняем объект с помощью операции связывания

**dir()** -- список имен в пространстве имен

**globals()** -- позволяет посмотреть, что находится в глобальном скоупе

А сколько ссылок на ячейку памяти?

```import sys
sys.getrefcount(a)``` -- в момент вызова этой функции создается еще одна ссылка, поэтому значение будет +1 к реальному количеству 

операция `del` -- это не операция удаления объекта, а удаление ссылки

In [22]:
import _ctypes

def get_by_id(obj_id: int):
    """ Inverse of id() function. """
    return _ctypes.PyObj_FromPtr(obj_id)

## Строки и разное с ними связанное

### Строки и кавычки

In [8]:
print("Hello world!")

Hello world!


Строка – это объект, как и число. Строки используются для записи текстовой информации, а также произвольных последовательностей байтов. Чтобы отличать обычную строку от строк кода, её нужно обрамлять либо одинарными, либо двойными кавычками. 

In [9]:
#Например:
"Hello world!" == 'Hello world!'


True

Если текст состоит из нескольких строк, его нужно обрамлять в тройные кавычки

In [10]:
print("""Hello 
world!""")

Hello 
world!


Кавычки в таких случаях также могут быть как одинарными, так и двойными

In [11]:
print('''Hello 
world!''')

Hello 
world!


Символы кавычек внутри строк нужно экранировать, то же самое со специсимвлолами. Например, `\t` (символ вертикальной табуляции) или `\n` -- символ перевода строки

### Что такое строка

Строка -- это частный случай последоватьностей в Python, представитель группы `Flat sequences`. То есть, строка -- это последовательность, каждый элемент в которой представляет лишь один тип. Можно сказать, что строка -- это последовательность символов.

Также строка -- одна из неизменяемых последовательностей (immutable sequences). Это значит, что мы не можем ее изменить после создания

In [30]:
example_str = 'example_str'

Строка является последовательностью односимвольных строк, к которым можно получить доступ. Строки можно сохранять в переменные и выполнять над ними некоторые операции.

In [126]:
print("What is your name?")
name = input()
print("Hello," + name)

What is your name?


 Denis


Hello,Denis


Функция **len()** возвращает длину строки-параметра

In [None]:
s = input()
print(len(s))

hello
5


### Что происходит, когда мы печатаем на экран?

Вам что-то говорят следующие названия?   `__repr__ , __str__`

In [133]:
class MyPrettyInt:
    def __init__(self, value: int):
        self.value = value
    
    def __repr__(self):
        return f'MyPrettyInt({self.value})'
    
    def __str__(self):
        return f'here is my pretty {self.value}'

Строка, возвращаемая `__repr__` должна быть однозначной и по возможности совпадать с кодом, требуемым для создания показываемого объекта

Строка, возвращаемая `__str__`, должна быть понятной конечному пользователю

У разных объектов в Python могуть быть по-разному объявлены данные методы

### Слайсы на примере строк

#### Немного общей информации

    "As you may have noticed, several of the operations mentioned work equally for texts, lists and tables. Texts, lists and tables together are called trains. 
    […] The FOR command also works generically on trains"

Мощь Python в том, что для многих схожих классов у нас есть общее множество поддерживаемых операций. Например, strings, lists, byte sequences, arrays и др. поддерживают iteration, slicing, sorting, contactenation и прочие общие операции.

Understanding и embracing данного принципа помогает нам не изобретать велосипед, а использовать общий интерфейс, который дает реализуемым классам поддержку уже принятых методов 

#### Slicing (срезы, слайсы, whatever you call it)

**Slicing** -- это общая фича всех последовательностей в Python. Ниже мы рассмотрим ее на примере строк, но помните, что это относится и к другим последовательностям

`sequence[start:stop:step]`

Срезы нужны для того, чтобы извлечь подстроки или символы из исходной строки. Таким образом, создаётся новая строка, а исходная остается неизменённой.

#### Basics

Чтобы обратиться к символу строки, используются две нумерации: неотрицательными и отрицательными числами.

![alternate text](https://pp.userapi.com/c837320/v837320502/59b9f/c4cTcRUnMWg.jpg)

Нумерация неотрицательными числами начинается с 0 и идет слева направо. То есть чтобы получить первый символ строки s, нужно написать s[0], второй символ – s[1], и т.д.

Нумерация отрицательными числами начинается с -1 и также идет слева направо (справа налево, если смотреть на модуль числа). То есть чтобы получить последний символ строки s, нужно написать s[-1], предпоследний символ – s[-2], и т.д.

In [143]:
# Например
s = "Hello world!"  # создали переменную s со содержимым “Hello world!”
print(len(s))
print(s[0])  # печатает первый символ строки
print(s[-1])  # печатает последний символ строки
# print(s[15])  # выдаст ошибку, так как должна напечатать 16-ый элемент строки, а длина строки s меньше 16 символов

12
H
!


Следующий вид срезов – с двумя параметрами, между которыми ставится двоеточие. Если нужно получить подстроку строки s с __i__ по __j__ символы включительно, то нужно применить срез __s[i: j+1]__.

Правая граница не включается

Это не просто так!

#### Правая граница

1. Просто сразу видеть длину слайса, если задана только конечная позиция!
`my_seq[:3] -- 3 items`

2. Просто посчитать длину!
`stop - start == length`

3. Просто разбирать на две части без пересечения!


In [152]:
my_seq = '123456789'

print(my_seq[:3], my_seq[3:])

for i in range(len(my_seq)):
    print(i, my_seq[:i], my_seq[i:])
    assert my_seq[:i] + my_seq[i:] == my_seq

123 456789
0  123456789
1 1 23456789
2 12 3456789
3 123 456789
4 1234 56789
5 12345 6789
6 123456 789
7 1234567 89
8 12345678 9


#### Step

In [156]:
my_seq[0:-1:1]

'12345678'

In [157]:
my_seq[:-1]

'12345678'

А как можно развернуть строчку?

In [158]:
my_seq[::-1]

'987654321'

#### Слайсы можно именовать

Пусть у нас есть большая строчка

In [159]:
invoice = """
0.....6.................................40........52...55........
1909  Pimoroni PiBrella                   $17.50     3    $52.50
1489  6mm Tactile Switch x20              $4.95      2    $9.90
1510  Panavise Jr. - PV-201               $28.00     1    $28.00
1601  PiTFT Mini Kit 320x240              $34.95     1    $34.95
"""

In [160]:
NUMBER = slice(0, 6)
DESC = slice(6, 40)
PRICE = slice(40, 52)
TOTAL = slice(55, None)

for sold_item in invoice.split('\n')[2:]:
    print(sold_item[PRICE], sold_item[DESC])

  $17.50     Pimoroni PiBrella                 
  $4.95      6mm Tactile Switch x20            
  $28.00     Panavise Jr. - PV-201             
  $34.95     PiTFT Mini Kit 320x240            
 


In [163]:
invoice_part = '1909  Pimoroni PiBrella                   $17.50     3    $52.50'
invoice_part[PRICE]

'  $17.50    '

### Форматирование

Часто возникают ситуации, когда нужно сделать строку, подставив в неё некоторые данные, полученные в процессе выполнения программы. 
Форматирование можно сделать с помощью оператора %, format и f-string

Чтобы отформатировать строку  требуется:


#### Оператор %.  

<Строка формата, содержащая один или более спецификаторов формата(например, %d (digit))> % <объект (или объекты, в виде кортежа),значение которого должно быть подставлено на место спецификатора (или спецификаторов) в левой части выражения>.


In [None]:
print('That  is  %d  %s  fish!' % (1, 'gold')) 

That  is  1  gold  fish!


In [168]:
"%d %s %d you" % (int(input()), input(), int(input()))

 1
 spam
 4


'1 spam 4 you'

In [166]:
"%s -- %s -- %s" % (42, 3.14159, [1, 2, 3])

'42 -- 3.14159 -- [1, 2, 3]'

**почему так больше не надо**

Хотя бы потому, что это очень длинно и малочитаемо

In [26]:
first_name = "Eric"
last_name = "Idle"
age = 74
profession = "comedian"
affiliation = "Monty Python"

"Hello, %s %s. You are %s. You are a %s. You were a member of %s." % (first_name, last_name, age, profession, affiliation)

'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

#### format

In [170]:
weight_of_one_sheep = 23.1234
'One sheep is {:.3f} kilos'.format(weight_of_one_sheep)

'One sheep is 23.123 kilos'

`format` позволяет задать тип числа и отформатировать строку

In [181]:
'{:*<30}'.format('left aligned')  # "*" здесь задаваемый символ

'left aligned******************'

In [174]:
'{:*>30}'.format('right aligned')  # "*" здесь задаваемый символ

'*****************right aligned'

In [175]:
'{:*^30}'.format('aligned')  # "*" здесь задаваемый символ


'***********aligned************'

In [176]:
'{:+f}; {:+f}'.format(3.14, -3.14)  # всегда показывать знак

'+3.140000; -3.140000'

In [177]:
'{:.25g}'.format(3.14)  # показать первые n значимых цифр

'3.140000000000000124344979'

In [178]:
'{0:b} {0:x}'.format(1337)  # показать в бинарном или hex виде

'10100111001 539'

In [179]:
'{:10.2f}'.format(314.314)  # можно задать точность 

'    314.31'

*Task*. А как записать с нулями впереди?

In [182]:
'{:010.2f}'.format(314.314)

'0000314.31'

Удобство *.format* заключается в том, что можно передавать строку с плейсхолдерами, а потом их доопределять. Плейсхолдеры могут быть именованными или нет, в единственном числе или множество. Пример:

In [184]:
new_estimation = 42.

future_info_unnamed = 'Our brand new estimation of sheeps weight is {:.3f} kilos'
print(future_info_unnamed.format(new_estimation))

future_info_named = 'Our brand new estimation of sheeps weight is {new_value:.3f} kilos'
print(future_info_named.format(new_value=new_estimation))

future_info_named_mult = 'Our brand new estimation of sheeps {item} is {new_value:.3f} kilos'
print(future_info_named_mult.format(new_value=new_estimation, item='weight'))

Our brand new estimation of sheeps weight is 42.000 kilos
Our brand new estimation of sheeps weight is 42.000 kilos
Our brand new estimation of sheeps weight is 42.000 kilos


In [185]:
'{0}, {1}, {2}'.format('a', 'b', 'c')

'a, b, c'

In [186]:
'{}, {}, {}'.format('a', 'b', 'c')

'a, b, c'

In [188]:
'{2}, {0}, {1}'.format('a', 'b', 'c')

'c, a, b'

Классно, но все еще длинно

In [54]:
first_name = "Eric"
last_name = "Idle"
age = 74
profession = "comedian"
affiliation = "Monty Python"

pattern_str = "Hello, {first_name} {last_name}. You are {age}. You are a {profession}. You were a member of {affiliation}."

pattern_str.format(
    first_name=first_name,
    last_name=last_name,
    age=age,
    profession=profession,
    affiliation=affiliation,
)

'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

Можно чуть короче, если есть dict

In [56]:
data = {
    'first_name': 'John',
    'last_name': 'Doe',
    'age': '18',
    'profession': 'seeker',
    'affiliation': 'humanity'
}

pattern_str.format(**data)

'Hello, John Doe. You are 18. You are a seeker. You were a member of humanity.'

#### f-strings

Как format, только чуть короче

Можно писать коротко

In [195]:
name = 'Denis'
surname = 'Belyakov'

f'my name is {name} {surname}'

'my name is Denis Belyakov'

И можно использовать выражения!

In [197]:
f'my name is {name.upper()} {surname[:4] if len(surname) > 4 else surname}'

'my name is DENIS Bely'

Тоже можно использовать форматирование, как смотрели выше

In [198]:
number = 123456.1234
f"{number:012.2f}"

'000123456.12'

In [201]:
f"{number:12.2}"

'     1.2e+05'

### Вспомним про два возможных строковых представления для объектов

In [59]:
class MyPrettyInt:
    def __init__(self, value: int):
        self.value = value
    
    def __repr__(self):
        return f'MyPrettyInt({self.value})'
    
    def __str__(self):
        return f'here is my pretty {self.value}'

Вызов `format` для него будет вызывать метод `__str__`, а потом уже `__repr__`

In [203]:
pretty_int = MyPrettyInt(4) 

In [204]:
f'{pretty_int} and it is the prettiest!'

'here is my pretty 4 and it is the prettiest!'

Можно насильно вызвать представление через `__repr__` написав `!r`

In [205]:
f'{pretty_int!r} and it is the prettiest!'

'MyPrettyInt(4) and it is the prettiest!'

In [208]:
num = '4'
f'there is a great number {num}'

'there is a great number 4'

In [210]:
f'there is a great number {num!r}'

"there is a great number '4'"

**Мультистрока**

In [211]:
print(f'''
My 
name is {name}
and surname is {surname}
''')


My 
name is Denis
and surname is Belyakov



In [212]:
sample_str = f'My ' \
             f'name is {name} ' \
             f'and surname is {surname}' \

print(sample_str)

My name is Denis and surname is Belyakov


### А что по скорости

In [213]:
name = 'John'
surname = 'Doe'
age = 99

In [214]:
%%timeit -n 1000000
'name is %s, surname is %s, and age is %d' % (name, surname, age)

130 ns ± 2.72 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [215]:
%%timeit -n 1000000
'name is {name}, surname is {surname}, and age is {age}'.format(name=name, surname=surname, age=age)

431 ns ± 2.03 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [216]:
%%timeit -n 1000000
f'name is {name}, surname is {surname}, and age is {age}'

108 ns ± 2.83 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


Кто-нибудь знает, почему?

Давайте посмотрим

In [35]:
def create_format_str():
    name = 'Denis'
    surname = 'Belyakov'
    age = 24
    string = 'name is {name}, surname is {surname}, and age is {age}'.format(name=name, surname=surname, age=age)
    return string

def create_f_str():
    name = 'Denis'
    surname = 'Belyakov'
    age = 24
    string = f'name is {name}, surname is {surname}, and age is {age}'
    return string

[Диссим](https://docs.python.org/3/library/dis.html) Python

In [36]:
import dis

dis.dis(create_f_str)

  9           0 LOAD_CONST               1 ('Denis')
              2 STORE_FAST               0 (name)

 10           4 LOAD_CONST               2 ('Belyakov')
              6 STORE_FAST               1 (surname)

 11           8 LOAD_CONST               3 (24)
             10 STORE_FAST               2 (age)

 12          12 LOAD_CONST               4 ('name is ')
             14 LOAD_FAST                0 (name)
             16 FORMAT_VALUE             0
             18 LOAD_CONST               5 (', surname is ')
             20 LOAD_FAST                1 (surname)
             22 FORMAT_VALUE             0
             24 LOAD_CONST               6 (', and age is ')
             26 LOAD_FAST                2 (age)
             28 FORMAT_VALUE             0
             30 BUILD_STRING             6
             32 STORE_FAST               3 (string)

 13          34 LOAD_FAST                3 (string)
             36 RETURN_VALUE


Обратите внимание на [FORMAT_VALUE](https://docs.python.org/3/library/dis.html#opcode-FORMAT_VALUE)

In [37]:
dis.dis(create_format_str)

  2           0 LOAD_CONST               1 ('Denis')
              2 STORE_FAST               0 (name)

  3           4 LOAD_CONST               2 ('Belyakov')
              6 STORE_FAST               1 (surname)

  4           8 LOAD_CONST               3 (24)
             10 STORE_FAST               2 (age)

  5          12 LOAD_CONST               4 ('name is {name}, surname is {surname}, and age is {age}')
             14 LOAD_ATTR                0 (format)
             16 LOAD_FAST                0 (name)
             18 LOAD_FAST                1 (surname)
             20 LOAD_FAST                2 (age)
             22 LOAD_CONST               5 (('name', 'surname', 'age'))
             24 CALL_FUNCTION_KW         3
             26 STORE_FAST               3 (string)

  6          28 LOAD_FAST                3 (string)
             30 RETURN_VALUE


Наличие Function call (24) без дополнительных оптимизаций скорее всего обуславливает относительную медлительность .format() 

**special cases**

In [217]:
f'I love \'Nestle\' chocolate' # экранирование

"I love 'Nestle' chocolate"

In [218]:
f'Values in braces are the best: {{4 + 5}}'  # {{}} для показа скобочек

'Values in braces are the best: {4 + 5}'

In [219]:
f'Values in braces are the best: {{{4 + 5}}}'  # {{{}}} для показа скобочек и вычисления

'Values in braces are the best: {9}'

In [220]:
f'Values in braces are the best: {{{{4 + 5}}}}'  # {{{}}} для показа скобочек и вычисления

'Values in braces are the best: {{4 + 5}}'

Ну, вы поняли

### Дополнительные функции и методы строк

In [221]:
# Функция input() считывает строку из консоли, пока не нажат enter
s = input()
print(s*3)

 10


101010


*Поиск подстроки в строке. Возвращает номер первого вхождения или -1*

    s.find(str, [start],[end])
    
*Поиск подстроки в строке. Возвращает номер последнего вхождения или -1*

    s.rfind(str, [start],[end]

*Поиск подстроки в строке. Возвращает номер первого вхождения или вызывает ValueError*

    s.index(str, [start],[end])

*Поиск подстроки в строке. Возвращает номер последнего вхождения или вызывает ValueError*

    s.rindex(str, [start],[end])
    
*Замена шаблона*

    s.replace(шаблон, замена)
    
*Разбиение строки по разделителю*

    s.split(символ)
    
*Состоит ли строка из цифр*

    s.isdigit()
    
*Состоит ли строка из букв*

    s.isalpha()

*Состоит ли строка из цифр или букв*

    s.isalnum()

*Состоит ли строка из символов в нижнем регистре*

    s.islower()
    

*Состоит ли строка из символов в верхнем регистре*
    
    s.isupper()

*Состоит ли строка из неотображаемых символов (пробел, символ перевода страницы ('\f'), "новая строка" ('\n'), "перевод каретки" ('\r'), "горизонтальная табуляция" ('\t') и "вертикальная табуляция" ('\v'))*
    
    s.isspace()

*Начинаются ли слова в строке с заглавной буквы*

    s.istitle()

*Преобразование строки к верхнему регистру*
    
    s.upper()

*Преобразование строки к нижнему регистру*
    
    s.lower()

*Начинается ли строка S с шаблона str*
    
    s.startswith(str)

*Переводит символы нижнего регистра в верхний, а верхнего – в нижний*
    
    s.swapcase()

*Символ в его код ASCII*
    
    ord(символ)

*Код ASCII в символ*
    
    chr(число)

In [223]:
ord('a'), chr(97)

(97, 'a')

*Возвращает количество непересекающихся вхождений подстроки в диапазоне [начало, конец] (0 и длина строки по умолчанию)*

    s.count(str, [start],[end])


*Удаление пробельных символов в начале строки*

    s.lstrip([chars])

*Удаление пробельных символов в конце строки*

    s.rstrip([chars])

*Удаление пробельных символов в начале и в конце строки*

    s.strip([chars])

*Первую букву каждого слова переводит в верхний регистр, а все остальные в нижний*
    
    s.title()

### Метод split()

Метод `split()` разделяет строку на подстроки по указанному разделителю и выдает на выходе другую (уже изменяемую!) последовательность -- `list`

In [224]:
s = "mother, father, sister, brother"
s.split(", ")

['mother', 'father', 'sister', 'brother']

Если разделитель не указан, что строка разделяется по любому whitespace символу

In [227]:
s = "mother father \t sister \n brother   me"
s.split()

['mother', 'father', 'sister', 'brother', 'me']

### Text Versus Bytes (1)

Выше мы дали определение строки как неизменяемая последовательность символов (immutabe sequence of _charachters_). Но что такое _charachter_?

в Python3 это символ Unicode. В зависимости от используемого стандарта Unicode, представление кода в байтах может отличаться

In [138]:
s = 'café'
len(s)  # 4 символа юникода

4

In [141]:
b = s.encode('utf8')
b  # 5 байт в кодировке, т.к. последний символ занимает 2 байта в UTF-8

b'caf\xc3\xa9'

In [140]:
b.decode('utf8')

'café'

**В Unicode бывают сюрпризы**

In [39]:
s_one = 'Spicy Jalape\u00f1o' 
s_two = 'Spicy Jalapen\u0303o' 

In [41]:
s_one, s_two

('Spicy Jalapeño', 'Spicy Jalapeño')

In [42]:
s_one == s_two

False

In [43]:
len(s_one), len(s_two)

(14, 15)

Что делать?

In [44]:
import unicodedata

In [47]:
ns_one = unicodedata.normalize('NFD', s_one)
ns_two = unicodedata.normalize('NFD', s_two)

In [48]:
ns_one == ns_two

True

In [51]:
ns_one.encode('utf-8'), ns_two.encode('utf-8')

(b'Spicy Jalapen\xcc\x83o', b'Spicy Jalapen\xcc\x83o')

In [53]:
ns_one, ns_two

('Spicy Jalapeño', 'Spicy Jalapeño')

Например, можно почистить текст от спецсимволов вроде диактритических знаков

In [54]:
''.join(c for c in ns_one if not unicodedata.combining(c))

'Spicy Jalapeno'

## Немного задачек

Бонусный балл предлагется за решение 1, 2, 3 или 1, 2, 4. Можно получить частичный. Решайте! Надеюсь, будет интересно

**1. Получите с помощью форматирования строк строку "foo:foo".**

Попробуйте использовать все способы, которые вы знаете на текущий момент (>=5)

In [65]:
bar = 'foo'

In [None]:
# your solutions

**2. Напишите форматную строку, которая могла бы форматировать число по заданной ширине и целочисленной точности**

hint: в f-строках возможно вложенное использование {}

In [22]:
width = 10
d_prec = 3
value = 1337.808

```'output:   1.34e+03'```

In [23]:
# your solution

**3. Напишите функцию, которая:**

   - получает на вход строку (возможно, небольшой текст) и стоп-слово
    
   - находит все индексы стоп-слова в строке
    
   - (*) в результате своей работы собирает новую строку, в которой нет стоп-слов
   - (*) желательно написать удаление именно стопслова, когда оно не является частью другого слова

example:

    s = 'here is my stopword stop it please stop'
    stopword = 'stop'
    
output:
    
    20 24
    35 39
    'here is my stopword  it please '

In [58]:
s = 'here is my stopword stop it please stop'
stopword = 'stop'

In [62]:
# your solution

20 24
35 39


'here is my stopword  it please '

In [64]:
s[20:24], s[35:39]

('stop', 'stop')

   **4. Let the FUN begin**
   
   4.1 Сделайте преобразование  с использованием .format(). Но теперь в вашем решении не должно быть символов "{}"

In [60]:
bar = 'foo'

In [63]:
# bar = ... .format(...)

In [None]:
assert bar == 'foo:foo'

4.2 
Получите строчку 'foo:foo' с использованием функции format, без использования "{}" и без использования каких-либо переменных

In [64]:
# answer = ...

In [None]:
assert answer == 'foo:foo'