# **Лекция 4: ввод и вывод в `python`**

## **План лекции**

- Обсуждение плана лекции
- Разбор задач из второго домашнего задания
- Форматирование строк: `f`-строки и `.format()`
    - Вопросы?
- Считывание файлов в `python`
- Разные режимы считывания файлов
    - Вопросы?
- Кортежи (если успеем)
- Разбор разных задач (сколько успеем)

## Разбор задач с семинара

Механик Зеленый прилетел на планету Железяку к роботам. Большинство роботов пишут цифры в бинарном коде, а механик Зеленый сходу их не понимает. Помогите написать программу, которая переведет бинарные числа в десятичные. Используйте только знания, полученные в рамках нашего курса. 

<p>
<details>
<summary> <u> Подсказка 1: </u> </summary>

```python
number = int(string) # функция для перевода строк в integer

```

</details>
</p>


Как всегда разобьем задачу на подзадачи:

<p>
<details>
<summary> <u> Вспоминаем как конвертировать числа из бинарной системы в десятичную </u> </summary>

Берем цифры с конца числа, записанного в бинарной системе, и умножаем их на степени двойки. Последняя цифра будет умножена на 2$^0$, предпоследнее –– на 2$^1$ и так далее. Подробнее [здесь](https://ru.wikihow.com/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B8%D1%82%D1%8C-%D0%B8%D0%B7-%D0%B4%D0%B2%D0%BE%D0%B8%D1%87%D0%BD%D0%BE%D0%B9-%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D1%8B-%D0%B2-%D0%B4%D0%B5%D1%81%D1%8F%D1%82%D0%B8%D1%87%D0%BD%D1%83%D1%8E).

</details>
</p>

<p>
<details>
<summary> <u> Возьмем произвольную цифру из строки, конвертируем ее в целочисленную (int) и умножим на двойку в какой-нибудь степени </u> </summary>

```python
sample_bin = '1100000011110'
char = sample_bin[5]
number = int(char)
print(number*2**3)

```
</details>
</p>

<p>
<details>
<summary> <u> Разберемся как брать правильную цифру из строки и как умножать ее на правильную степень двойки </u> </summary>

Нам нужно брать числа с конца, это можно сделать либо с помощью `sample_bin[len(sample_bin)-1]`, либо с помощью `sample_bin[-1]`. Если обозначить такой индекс за `i`, то степень, на которую мы можем умножать число, мы можем обозначить за `i-1`.
    
```python
sample_bin = '1100000011110'
i = 1
char = sample_bin[-i]
number = int(char)
print(number*2**(i-1))

```
</details>
</p>

<p>
<details>
<summary> <u> Теперь повторим для всех элементов строки </u> </summary>

Напишем цикл! Очевидно, что нужно менять `i` от `1`, но до какого числа? Длина нашей строки `len(sample_bin)`, начинаем мы с единицы, а значит нам нужно `len(sample_bin) + 1`:
    
```python
sample_bin = '1100000011110'
    
for i in range(1, len(sample_bin) + 1):
    char = sample_bin[-i]
    number = int(char)
    print(number*2**(i-1), char)
```
</details>
</p>

<p>
<details>
<summary> <u> Осталось сложить все элементы, что мы с вами уже не раз делали </u> </summary>
    
```python
sample_bin = '1100000011110'
dec_number = 0
    
for i in range(1, len(sample_bin) + 1):
    char = sample_bin[-i]
    number = int(char)
    dec_number += number*2**(i-1)
print(dec_number)
```
</details>
</p>

<p>
<details>
<summary> <u> Можем ли мы придумать слегка более элегантное решение? </u> </summary>

В целом да. Мы не избавимся от цикла по индексам (нам нужен индекс/итерируемая переменная для подсчета степени), зато можем убрать неэлегантное перебирание с конца, если будем разворачивать строку на ходу. Это можно сделать с помощью среза `[::-1]`. Ну и остальные строчки можно немного сократить:
    
```python
sample_bin = '1100000011110'
dec_number = 0

for i in range(len(sample_bin)):
    number = int(sample_bin[::-1][i])
    dec_number += number*2**(i)
print(dec_number)
```
</details>
</p>

## **Более крутой способ форматировать строки**

Вам не казалось, что складывание строк через
``` python
'Сегодня ' + str(degrees) + ' градусов по Цельсию' 
```
выглядит немного громоздким? Это правда, и можно форматировать строки более элегантно сразу тремя разными способами.

### `f`-строки

Если добавить к строке до её начала `f`, то в неё можно вставлять числовые значения:

In [3]:
degrees = 24.2
message = f'Сегодня в Москве {degrees} градуса по Цельсию'

print(message)

Сегодня в Москве 24.2 градуса по Цельсию


<p>
<details>
<summary> ☝ ✨ <u> f-строки можно использовать для нахождения багов </u> </summary>

Можно выводить строку сразу с выражением `=` в процессе, и наиболее всего такая форма удобна для нахождения багов в коде, так как позволяет подсвечивать сразу названия переменных:

``` python
name = 'SCP-173'
count = 13
object_class = 'Euclid'
print(f'Объект {name=} класса {object_class=} нарушал условия содержания {count=} раз')
```
> `Объект name='SCP-173' класса object_class='Euclid' нарушал условия содержания count=13`
</details>
</p>

### Метод `.format()`

Очень похожий способ, проще всего проиллюстрировать его примером:

In [57]:
print('{person1} и {person2}'.format(person1='Биба', person2='Боба'))

Биба и Боба


Большой разницы в этих способах нету, можно спокойно использовать оба.

### Через оператор `%`

Раньше основным способом был:

In [4]:
pi = 3.141592653589793 # и так далее

print('Значения числа π примерно равно %5.3f.' % pi)

Значения числа π примерно равно 3.142.


Но сейчас его почти не используют, чтобы не путать с оператором остатка от деления, да и `f`-строки просто более читаемые.

<p>
<details>
<summary> ☝ ✨ <u> Что за 5.3f? </u> </summary>

Это формативанный вывод (или ввод). Раньше, в низкоуровневых языках (`C` или `FORTRAN`) вывод мог быть только с указанием типа переменной (`f` - float) и длиной поля. Первое число до (5) означает полное количество знаков, которое будет занято выводом числа, а второе число (3) означает число выведенных знаков после запятой. 

Может показаться, что это уже очень устаревшая форма записи, однако иногда данные записаны именно в таком виде: они не разделяются запятыми или пробелами, а имеют фиксированную длину поля. Зато, зная форму записи, можно всегда легко прочитать данные и не ошибиться!

</details>
</p>

# **Работа с файлами в python**

До этого мы хранили всю информацию в строчках кода. В реальности все данные всегда хранятся в файлах! Давайте разберем, как их считывать и что с ним делать.

Простейший способ открытия текстового файла выглядит так: 

In [5]:
f = open('data/russian_cities.txt')
russian_cities = f.read()
f.close()

print(russian_cities) # данные с координатами Российских городов

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147


Каждый раз, открывая файл, мы создаем специальную переменную *файлового потока*. После использования файла, эту переменную нужно закрыть, иначе могут возникнуть [разные неприятные последствия](https://stackoverflow.com/questions/25070854/why-should-i-close-files-in-python). Часть люди забывают закрывать файл, да и выглядит это не очень читаемо, поэтому была придумана следующая схема:

In [19]:
with open('data/russian_cities.txt') as f:
    russian_cities = f.read()

print(russian_cities) # данные с координатами Российских городов

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147


Она закрывает файл сразу же после окончания отступа.

> ☝ Строго говоря, ключевое слово `with` используется и для [других целей](https://stackoverflow.com/questions/3012488/what-is-the-python-with-statement-designed-for), но в абсолютном большинстве случаев его используют именно для открытия/закрытия файлов.

Теперь посмотрим на разные методы для считывания файлов:
- `.read()` считывает файл полностью в виде строки
- `.readline()` считывает только одну строку и сохраняет положение курсора: если вызвать еще раз, то считает уже следующую строку
- `.readlines()` считывает все строки и записывает в массив: каждый элемент массива — это новая строка 

In [7]:
with open('data/russian_cities.txt') as f:
    russian_cities = f.readlines()

print(russian_cities)

['Moscow 55.7558 37.6178\n', 'SaintPetersburg 59.9500 30.3167\n', 'Novosibirsk 55.0333 82.9167\n', 'Yekaterinburg 56.8356 60.6128\n', 'NizhniyNovgorod 56.3269 44.0075\n', 'Kazan 55.7964 49.1089\n', 'Chelyabinsk 55.1500 61.4000\n', 'Omsk 54.9667 73.3833\n', 'Samara 53.2028 50.1408\n', 'Rostov 47.2333 39.7000\n', 'Ufa 54.7261 55.9475\n', 'Krasnoyarsk 56.0089 92.8719\n', 'Voronezh 51.6717 39.2106\n', 'Perm 58.0139 56.2489\n', 'Volgograd 48.7086 44.5147']


> ☝ Символ `\n` обозначает начало новой строки, а сам механизм разделения строк может работать немного по-разному на разных системах

При желании, мы можем сделать (почти) то же самое с помощью:

In [8]:
with open('data/russian_cities.txt', mode='r') as f:
    russian_cities = f.read()
    russian_cities_lines = russian_cities.split('\n')

print(russian_cities_lines) 

['Moscow 55.7558 37.6178', 'SaintPetersburg 59.9500 30.3167', 'Novosibirsk 55.0333 82.9167', 'Yekaterinburg 56.8356 60.6128', 'NizhniyNovgorod 56.3269 44.0075', 'Kazan 55.7964 49.1089', 'Chelyabinsk 55.1500 61.4000', 'Omsk 54.9667 73.3833', 'Samara 53.2028 50.1408', 'Rostov 47.2333 39.7000', 'Ufa 54.7261 55.9475', 'Krasnoyarsk 56.0089 92.8719', 'Voronezh 51.6717 39.2106', 'Perm 58.0139 56.2489', 'Volgograd 48.7086 44.5147']


### Запись в файлы

Для того, чтобы записывать строчки в файл, нужно использовать другой режим:

In [9]:
with open('data/duplicate_cities.txt', mode='w') as f:
    f.write(russian_cities)

%cat data/duplicate_cities.txt # лайфхак для вывода (может не работать на Windows)

Moscow 55.7558 37.6178
SaintPetersburg 59.9500 30.3167
Novosibirsk 55.0333 82.9167
Yekaterinburg 56.8356 60.6128
NizhniyNovgorod 56.3269 44.0075
Kazan 55.7964 49.1089
Chelyabinsk 55.1500 61.4000
Omsk 54.9667 73.3833
Samara 53.2028 50.1408
Rostov 47.2333 39.7000
Ufa 54.7261 55.9475
Krasnoyarsk 56.0089 92.8719
Voronezh 51.6717 39.2106
Perm 58.0139 56.2489
Volgograd 48.7086 44.5147

> ☝️ Можно использовать и другой вариант записания пути до файла. Он называется абсолютным, у меня он выглядит так:
> ``` python
> with open('/Users/teimy42/py_geohse/Lectures/Lecture4/data/duplicate_cities.txt', mode='w') as f:
>    f.writelines(russian_cities_lines)
> ```
> На `windows` он выглядел бы примерно так:
> ``` python
> with open('C:/Users/teimy42/py_geohse/Lectures/Lecture4/data/duplicate_cities.txt', mode='w') as f:
>    f.writelines(russian_cities_lines)
> ```
> Подробнее об абсолютных и относительных путях можно прочитать [здесь](https://thecode.media/path/). В абсолютном большинстве случае я рекоммедую работать с относительными путями!

В целом, все очень похоже:
- `.write()` запишет всю строку в текстовый файл
- `.writelines()` запишет список из строк построчно в файл

### Функция `input()`

Функция `input()` позволяет считать данные прямо с клавиатуры и записать их в переменную. Выполните следующую ячейку, чтобы попробовать:

In [11]:
inp = input()
print(f'Мы ввели {inp}')

Мы ввели тест


# **Вопросы?**

## **Кортежи**

Кортежи (*tuples*) очень похожи на списки, но их нельзя изменять. Например:

In [15]:
cities_names = ('Moscow', 'SaintPetersburg', 'Novosibirsk', 'Yekaterinburg',
                'NizhniyNovgorod', 'Kazan', 'Chelyabinsk', 'Omsk', 'Samara', 'Rostov',
                'Ufa', 'Krasnoyarsk', 'Voronezh', 'Perm')
cities_names[0] = 'Not Moscow'

TypeError: 'tuple' object does not support item assignment

<p>
<details>
<summary> ☝️ ✨✨ <u> С помощью сильного колдунства можно сгенрировать такой список прямо из файла </u> </summary>

```python
with open('data/russian_cities.txt') as f:
    russian_cities = f.read()
cities_names = tuple([element.split()[0] for element in russian_cities.split('\n')][:-1])
 
```

</details>
</p>

Зачем нужны *кортежи*, если они (казалось бы) напрямую хуже списков? Потому что они более эффективно используются в вычислениях, и это сделано для оптимизации внутренних процессов. Если у вас нет четкого понимания, что конкретно вы хотите сделать, **никогда не используйте кортежи в вашем коде**. 

<p>
<details>
<summary> ☝ ✨✨ <u> Как проверить насколько кортежи быстрее? (+ как проверить скорость выполнения кода!) </u> </summary>

Как описано в [этом ответе](https://stackoverflow.com/questions/2174124/why-do-we-need-tuples-in-python-or-any-immutable-data-type), можно проверить замерив скорость выполнения кода с помощью встроенных команд `ipython`. Сделайте две новых ячейки, в одну из них напишите:
``` python
%timeit ["fee", "fie", "fo", "fum"]
```
А в другую:
``` python
%timeit ("fee", "fie", "fo", "fum")
```
В зависимости от процессора и системы, результаты будут разными, но можно ожидать следующее:
`1000000 loops, best of 3: 0.432 usec per loop` для первого случая, и `10000000 loops, best of 3: 0.0563 usec per loop` для второго.

</details>
</p>

## Разбираем задачи

### Котик ватру4шка 12вареник?

- Считываются строки через пробел до тех пор, пока не введен `0`
- Для каждой вводимой строки сделать проверку: если она состоит только из букв и ее длина менее 7 символов, то ее нужно добавить в список
- Напечатать получишийся список

In [20]:
input1 = 'котик ватру4шка 12вареник? 14623 морковка лук вода подушка лупа 0'
input2 = '129 морковка1 морковка2 луковка0 редиска12 0'

# Ваш код 

### Что-то не так (или так?)

- На первой строке вводится слово
- Затем вводится последовательность букв
- Если слово начинается с введенной последовательности и его длина больше 5 символов, то печатается строка "подходит"

In [18]:
input1 = 'лисичка'
input2 = 'ли1'

# Пишем код