# **Лекция 4: функции и методы**

## **План лекции**

- Обсуждение плана лекции
- Форматирование строк: `f`-строки и `.format()`
- Считывание файлов в `python`
- Разные режими считывания файлов
    - Вопросы?
- Словари
- Методы словарей
    - Вопросы?
- Кортежи
    - Вопросы?


## **Более крутой способ форматировать строки**

Вам не казалось что складывание строк через:
``` python
'Сегодня ' + str(degrees) + ' градусов по Цельсию' 
```
немного громоздким? Это правда, и можно делать это более элегантно сразу тремя разными способами.

### `f`-строки

Добавив к строке до е начала `f` можно вставлять туда числовые значения:

In [3]:
degrees = 24.2
message = f'Сегодня в Москве {degrees} градуса по Цельсию' 

print(message)

Сегодня в Москве 24.2 градуса по Цельсию


<p>
<details>
<summary> ☝ ✨ <u> f-строки можно использовать для нахождения багов </u> </summary>

Можно выводить сразу с выражением `=` в процессе, и наиболее всего такая форма удобная для нахождения багов в коде, так как позволяет подсвечивать сразу названия переменных:

``` python
name = 'SCP-173'
count = 13
object_class = 'Euclid'
print(f'Объект {name=} класса {object_class=} нарушал условия содержания {count=} раз')
```
> `Объект name='SCP-173' класса object_class='Euclid' нарушал условия содержания count=13`
</details>
</p>

### Метод `.format()`

Очень похожий способ, проще всего проиллюстрировать его примером:

In [6]:
print('{person1} и {person2}'.format(person1='Биба', person2='Боба'))

Биба и Боба


Большой разницы в этих способах нету, можно спокойно использовать и то и то.

### Через оператор `%`

Раньше основным способом был:

In [33]:
pi = 3.141592653589793 # и так далее

print('Значения числа π примерно равно %5.3f.' % pi)

Значения числа π примерно равно 3.142.


Но сейчас его почти не используют, чтобы не путать с оператором остатка от деления, да `f`-строки просто более читаемые.

<p>
<details>
<summary> ☝ ✨ <u> Что за 5.3f? </u> </summary>

Это формативанный вывод (или ввод). Раньше, в низкоуровневых языках (`C` или `FORTRAN`) вывод мог быть только с указанием типа переменной (`f` - float) и длиной поля. Первое число до (5) означает полное количество знаков, которое будет занято выводом числа, а второе число (3) означает число выведенных знаков после запятой. 

Может показаться, что это уже очень устаревшая форма записи, однако иногда данные записаны именно в таком виде: они не разделяются запятыми или пробелами, а имеют фиксированную длину поля. Зато, зная форму записи, можно всегда легко прочитать данные и не ошибиться!

</details>
</p>

# **Считывание файлов в python**

До этого мы хранили всю информацию в строчках кода. В реальности, все данные всегда хранятся в файлах! Давайте разберем как их считывать и что с ним делать.

Простейший способ открытия текстового файла выглядит так: 

In [16]:
f = open('data/russian_cities.txt')
russian_cities = f.read()
f.close()

print(russian_cities) # данные с координатами Российских городов

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147



Каждый раз открывая файл мы создаем специальную переменную *файлового потока*. После использования файла, эту переменную нужно закрыть, иначе могут возникнуть [разные неприятные последствия](https://stackoverflow.com/questions/25070854/why-should-i-close-files-in-python). Часть люди забывают закрывать файл, да и выглядит это не очень читаемо, поэтому была придумана следующая схема:

In [17]:
with open('data/russian_cities.txt') as f:
    russian_cities = f.read()

print(russian_cities) # данные с координатами Российских городов

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147



Она закрывает файл сразу же окончания отступа.

> ☝ Строго говоря, ключевое слово `with` используется и для [других целей](https://stackoverflow.com/questions/3012488/what-is-the-python-with-statement-designed-for), но в абсолютном большинстве случаев его используют именно для открытия/закрытия файлов.

Теперь посмотрим на разные методы для считывания файлов:
- `.read()` считывает файл полностью в виде строки
- `.readline()` считывает только одну строку и сохраняет положение курсора: если вызвать еще раз, то считает уже следующую строку
- `.readlines()` считывает все строки и записывает в массив: каждый элемент массива это новая строка 

In [34]:
with open('data/russian_cities.txt') as f:
    russian_cities = f.readlines()

print(russian_cities) 

['Moscow 55.7558 37.6178\n', 'SaintPetersburg 59.9500 30.3167\n', 'Novosibirsk 55.0333 82.9167\n', 'Yekaterinburg 56.8356 60.6128\n', 'NizhniyNovgorod 56.3269 44.0075\n', 'Kazan 55.7964 49.1089\n', 'Chelyabinsk 55.1500 61.4000\n', 'Omsk 54.9667 73.3833\n', 'Samara 53.2028 50.1408\n', 'Rostov 47.2333 39.7000\n', 'Ufa 54.7261 55.9475\n', 'Krasnoyarsk 56.0089 92.8719\n', 'Voronezh 51.6717 39.2106\n', 'Perm 58.0139 56.2489\n', 'Volgograd 48.7086 44.5147\n']


> ☝ Символ `\n` обозначает начало новой строки, а сам механизм разделения строк может работать немного по разному на разных системах

При желании, мы можем сделать (почти) то же самое с помощью:

In [36]:
with open('data/russian_cities.txt') as f:
    russian_cities = f.read()
    russian_cities_lines = russian_cities.split('\n')

print(russian_cities_lines) 

['Moscow 55.7558 37.6178', 'SaintPetersburg 59.9500 30.3167', 'Novosibirsk 55.0333 82.9167', 'Yekaterinburg 56.8356 60.6128', 'NizhniyNovgorod 56.3269 44.0075', 'Kazan 55.7964 49.1089', 'Chelyabinsk 55.1500 61.4000', 'Omsk 54.9667 73.3833', 'Samara 53.2028 50.1408', 'Rostov 47.2333 39.7000', 'Ufa 54.7261 55.9475', 'Krasnoyarsk 56.0089 92.8719', 'Voronezh 51.6717 39.2106', 'Perm 58.0139 56.2489', 'Volgograd 48.7086 44.5147', '']


### Запись в файлы

Для того, чтобы записывать строчки в файл, нужно использовать другой режим:

In [41]:
with open('data/duplicate_cities.txt', mode='w') as f:
    f.write(russian_cities)

%cat data/duplicate_cities.txt # лайфхак для вывода (может не работать на Windows)

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147


В целом, все очень похоже:
- `.write()` запишет всю строку в текстовый файл
- `.writelines()` запишет список из строк построчно в файл

# **Вопросы?**

# **Словари**

Словари это особая форма хранения данных: для доступа к ячейке используются не индекс, а любая строка (*ключ*). Словари проще всего создавать через фигурные скобки. Посмотрим на [пример](https://dtf.ru/life/838343-segodnya-svoj-52-oj-den-rozhdeniya-otmechaet-lshtshfum-ashf):

In [47]:
jason_borne = {'Фамилия': 'Лштшфум', 'Имя': 'Ащьф', 'Дата рождения': '21.08.1969', 'Пол': 'М'}

print(jason_borne)

{'Фамилия': 'Лштшфум', 'Имя': 'Ащьф', 'Дата рождения': '21.08.1969', 'Пол': 'М'}


Для доступа к значениям нужно использовать квадратные скобки, как и в списках:

In [48]:
print(jason_borne['Имя'], jason_borne['Фамилия'])

Ащьф Лштшфум


Добавление элемента в словарь очень просто работает:

In [49]:
jason_borne['Место рождения'] = 'Moscou'

Для упрощения работы с ними полезно знать несколько методов:
- `.keys()` возвращает список ключей
- `.values()` возвращает список значений

In [52]:
print('Ключи в нашем словаре:', jason_borne.keys())
print('Значения в нашем словаре:', jason_borne.values())

Ключи в нашем словаре: dict_keys(['Фамилия', 'Имя', 'Дата рождения', 'Пол', 'Место рождения'])
Значения в нашем словаре: dict_values(['Лштшфум', 'Ащьф', '21.08.1969', 'М', 'Moscou'])


Мы можем индексировать ключи в циклах так же, как и списки:

In [56]:
for key in jason_borne.keys():
    print(f'Значение по ключу {key} равно {jason_borne[key]}')

Значение по ключу Фамилия равно Лштшфум
Значение по ключу Имя равно Ащьф
Значение по ключу Дата рождения равно 21.08.1969
Значение по ключу Пол равно М
Значение по ключу Место рождения равно Moscou


> ☝ Мы не часто будем встречаться со словарями напрямую, но часто они используются с библиотеках с которыми мы будем работать. Также, очень удобно парсить большие массивы данных в словари, где каждый ключ отвечает за каждую переменную.

# **Вопросы?**

Можно использовать и другой метод:

In [58]:
for key, value in jason_borne.items():
    print(f'Значение по ключу {key} равно {value}')

Значение по ключу Фамилия равно Лштшфум
Значение по ключу Имя равно Ащьф
Значение по ключу Дата рождения равно 21.08.1969
Значение по ключу Пол равно М
Значение по ключу Место рождения равно Moscou


А что находится внутри `jason_borne.items()`?

In [60]:
list(jason_borne.items())

[('Фамилия', 'Лштшфум'),
 ('Имя', 'Ащьф'),
 ('Дата рождения', '21.08.1969'),
 ('Пол', 'М'),
 ('Место рождения', 'Moscou')]

Тип данных заключенный в скобки называется *кортежами*.

## **Кортежи**

Кортежи (*tuples*) очень похожи на списки, но их нельзя изменять. Например:

In [65]:
cities_names = tuple([element.split(' ')[0] for element in russian_cities_lines][:-1]) # сгенировали список городов
cities_names

('Moscow',
 'SaintPetersburg',
 'Novosibirsk',
 'Yekaterinburg',
 'NizhniyNovgorod',
 'Kazan',
 'Chelyabinsk',
 'Omsk',
 'Samara',
 'Rostov',
 'Ufa',
 'Krasnoyarsk',
 'Voronezh',
 'Perm',
 'Volgograd')

In [67]:
cities_names[0] = 'Москва'

TypeError: 'tuple' object does not support item assignment

Зачем нужны *кортежи*, если они напрямую хуже списков? Потому что они более эффективно используются в вычисление, и это сделано для оптимизации внутренних процессов. Если у вас нет четкого понимания, что конкретно вы хотите сделать, **никогда не используйте кортежи в вашем коде**. 

<p>
<details>
<summary> ☝ ✨✨ <u> Как проверить насколько кортежи быстрее? </u> </summary>

Как описано в [этом ответе](https://stackoverflow.com/questions/2174124/why-do-we-need-tuples-in-python-or-any-immutable-data-type), можно проверить замерив скорость выполнения кода с помощью встроенных команд `ipython`. Сделайте две новых ячейки, в одну из них напишите:
``` python
python -mtimeit '["fee", "fie", "fo", "fum"]'
```
А в другую:
``` python
python -mtimeit '("fee", "fie", "fo", "fum")'
```
В зависимости от процессора и системы, результаты будут разными, но можно ожидать следующее:
`1000000 loops, best of 3: 0.432 usec per loop` для первого случая, и `10000000 loops, best of 3: 0.0563 usec per loop` для второго.

</details>
</p>