# Основы программирования в Python

*Алла Тамбовцева*

## Чтение и запись txt-файлов

### Введение: знакомство с функцией `open()`

Для работы с txt-файлами (неважно, хотим ли мы считывать содержимое файла или, наоборот, записывать туда что-то новое), нам понадобится функция `open()`. У этой функции есть разные аргументы, основные такие:

* аргумент `file`: название файла или путь к нему в виде обычной строки;
* аргумент `mode`: режим работы с файлом;
* аргумент `encoding`:  кодировка файла.

**Режим работы с файлом.** Есть три основных режима: `'r'` (от *read*) – открыть файл только для чтения; `'a'` (от *append*) – открыть файл для добавления к нему строк; `'w'` (от *write*) – открыть файл для записи с нуля, то есть создать новый пустой текстовый файл.

*Важный момент 1.* Если файл с некоторым названием уже существует, при создании нового файла с таким названием в режиме `'w'` старый файл молча сотрется и заменится новым. Существует режим `'x'`, он позволяет создать новый файл, но если файл с таким названием уже существует, будет возвращена ошибка (более безопасный вариант *write*).

*Важный момент 2.* Если при открытии файла не указать режим, по умолчанию он будет открыт только для чтения.

**Кодировка.** По умолчанию на Unix-системах (Linux, Mac) используется кодировка UTF-8, на Windows возможны варианты, чаще всего кодировка CP-1251, по крайней мере, для файлов на кириллице. Если файл был создан на Mac/Linux, и он содержит текст не на английском (точнее, не на простой латинице, на языках, где есть диакритические знаки вроде ударений или умляутов), при открытии такого файла на Windows без указания кодировки будут проблемы. В обратную сторону это тоже работает: файл, созданный на Windows, не будет корректно считываться на Mac/Linux. Поэтому кодировку лучше всегда указывать или, по крайней мере, знать, что если Python выдает ошибку с сообщением о том, что он не может что-то декодировать, то аргумент с кодировкой надо добавить.

*Важный момент.* Функция `open()` работает только с локальными файлами, то есть с теми, что есть на компьютере. Находить и открывать файл по ссылке она не умеет.

### Чтение txt-файла

Поработаем с файлом `intro.txt`. Там сохранен отрывок из трагедии У.Шекспира «Макбет». Для начала откроем его просто для чтения:

In [1]:
# файл создан на Mac, кодировка UTF-8
# чтение, режим r

file01 = open("intro.txt", "r", encoding = "utf-8")

Если мы посмотрим на объект `file01`, ничего особенного мы не увидим:

In [2]:
file01

<_io.TextIOWrapper name='intro.txt' mode='r' encoding='utf-8'>

Это объект типа «файл», который представляет собой открытое соединение с файлом. К этому соединению можно применять методы для чтения или записи текста. Для чтения содержимого файла есть методы `.readline()` и `.readlines()`. Метод `.readline()` считывает файл построчно, одна строка за один раз.

In [3]:
# запускаем один раз
# первая строка

file01.readline()

'Пустынное место. Гром и молния.\n'

In [4]:
# запускаем один раз
# вторая строка

file01.readline()

'                             Входят три ведьмы.\n'

Технически, если мы знаем число строк в файле, считать все строки можно, применив цикл `for`. Но это, конечно, не очень удобно. Поэтому воспользуемся другим методом – методом `.readlines()`, он считывает сразу все строки и возвращает их список:

In [5]:
file01.readlines()

['\n',
 '                               Первая ведьма\n',
 '\n',
 '                     Когда средь молний, в дождь и гром\n',
 '                     Мы вновь увидимся втроем?\n',
 '\n',
 '                               Вторая ведьма\n',
 '\n',
 '                     Когда один из воевод\n',
 '                     Другого в битве разобьет.\n',
 '\n',
 '                               Третья ведьма\n',
 '\n',
 '                     Заря решит ее исход.\n',
 '\n',
 '                               Первая ведьма\n',
 '\n',
 '                     Где нам сойтись?\n',
 '\n',
 '                               Вторая ведьма\n',
 '\n',
 '                                      На пустыре.\n',
 '\n',
 '                               Третья ведьма\n',
 '\n',
 '                     Макбет там будет к той поре\n',
 '\n',
 '                               Первая ведьма\n',
 '\n',
 '                     Мурлычет кот, зовет. Иду!\n',
 '\n',
 '                               Третья ведьма\n',
 '\n',
 '      

Тут есть две особенности. Во-первых, методы срабатывают последовательно, то есть считывают строки с того места, на котором мы остановились. Поэтому в списке выше нет первых нескольких строк файла, которые мы пролистали через `.readline()` ранее. Во-вторых, метод `.readlines()` прочитывает весь файл до конца и останавливается на последней строке. Поэтому, если мы применим его еще раз, мы получим пустой список – до этого мы дошли до конца файла, строки закончились:

In [6]:
file01.readlines()

[]

Эта проблема решаема – откроем файл заново и сохраним строки сразу в список:

In [7]:
file01 = open("intro.txt", "r", encoding = "utf-8")
lines = file01.readlines()
print(lines)

['Пустынное место. Гром и молния.\n', '                             Входят три ведьмы.\n', '\n', '                               Первая ведьма\n', '\n', '                     Когда средь молний, в дождь и гром\n', '                     Мы вновь увидимся втроем?\n', '\n', '                               Вторая ведьма\n', '\n', '                     Когда один из воевод\n', '                     Другого в битве разобьет.\n', '\n', '                               Третья ведьма\n', '\n', '                     Заря решит ее исход.\n', '\n', '                               Первая ведьма\n', '\n', '                     Где нам сойтись?\n', '\n', '                               Вторая ведьма\n', '\n', '                                      На пустыре.\n', '\n', '                               Третья ведьма\n', '\n', '                     Макбет там будет к той поре\n', '\n', '                               Первая ведьма\n', '\n', '                     Мурлычет кот, зовет. Иду!\n', '\n', '     

Уберем в каждой строке лишние отступы (пробелы вначале и символ `\n` для перехода на новую строку) через метод `.strip()`:

In [8]:
new = [line.strip() for line in lines]
print(new) # уже получше

['Пустынное место. Гром и молния.', 'Входят три ведьмы.', '', 'Первая ведьма', '', 'Когда средь молний, в дождь и гром', 'Мы вновь увидимся втроем?', '', 'Вторая ведьма', '', 'Когда один из воевод', 'Другого в битве разобьет.', '', 'Третья ведьма', '', 'Заря решит ее исход.', '', 'Первая ведьма', '', 'Где нам сойтись?', '', 'Вторая ведьма', '', 'На пустыре.', '', 'Третья ведьма', '', 'Макбет там будет к той поре', '', 'Первая ведьма', '', 'Мурлычет кот, зовет. Иду!', '', 'Третья ведьма', '', 'Зов жабы слышу я в пруду.', '', 'Все вместе', '', 'Зло есть добро, добро есть зло.', 'Летим, вскочив на помело!']


### Дозапись уже существующего txt-файла

Теперь попробуем что-то дозаписать в этот файл. Для дозаписи одной строки пригодится метод `.write()`:

In [9]:
file01.write("Исчезают.")

UnsupportedOperation: not writable

Однако файл был открыт только для чтения, поэтому мы получили ошибку *not writable*. Откроем его в режиме `'a'` для дозаписи (*append*):

In [11]:
file02 = open("intro.txt", "a", encoding = "utf-8")
file02.write("Исчезают.") # дозаписалось 9 символов

9

По идее, теперь в конце файла должна быть фраза "Исчезают.". Но если мы откроем файл, ее там не окажется (на некоторых системах может записаться, но это нестабильная ситуация, если будем записывать что-то много раз, в какой-то случайный момент это может не сработать). Почему? Изменения нужно сохранить, закрыв файл!

In [12]:
file02.close()

Теперь все на месте, можно проверить. Вот так должны выглядеть последние строки файла, если вы не применяли метод `.write()` несколько раз:

```
                 Зло есть добро, добро есть зло.
                 Летим, вскочив на помело!
Исчезают.
```

Метод `.write()` имеет ограничения. Во-первых, он принимает на вход ровно одну строку (не число и не список строк). Во-вторых, он сам не добавляет никаких пробелов и переходов на новую строку, просто доклеивает новый текст «как есть». Посмотрим на проблемы, связанные с этими ограничениями.

In [13]:
# ошибка! но по другой причине,
# файл уже закрыли через close()

file02.write("123")

ValueError: I/O operation on closed file.

Снова открываем файл и пытаемся дозаписать в него числа от 0 до 9:

In [14]:
file02 = open("intro.txt", "a", encoding = "utf-8")
for i in range(0, 10):
    file02.write(i)
file02.close()

TypeError: write() argument must be str, not int

Ошибка вызвана неверным типом аргумента. Превратим каждое число в строку:

In [15]:
file02 = open("intro.txt", "a", encoding = "utf-8")
for i in range(0, 10):
    file02.write(str(i))
file02.close()

Работает, но все числа записались слитно:

```
                     Зло есть добро, добро есть зло.
                     Летим, вскочив на помело!
Исчезают.0123456789
```

Перейдем к квадратам чисел и добавим после каждой переход на новую строку:

In [16]:
file02 = open("intro.txt", "a", encoding = "utf-8")
for i in range(0, 10):
    file02.write(str(i ** 2) + "\n")
file02.close()

Получилось, теперь в файле помимо исходного текста есть текст, содержащий числа разного вида.

```
                     Зло есть добро, добро есть зло.
                     Летим, вскочив на помело!
Исчезают.01234567890
1
4
9
16
25
36
49
64
81
```

### Запись нового txt-файла

В заключение создадим новый текстовый файл с нуля в режиме `'w'` (от *write*):

In [19]:
# новый файл, пока пустой
# encoding можно опустить – кодировка будет такой, как в системе

file03 = open("myfile.txt", "w", encoding = "utf-8")

Впишем в этот файл строки из списка `new`, который мы получили ранее. Для этого возьмем метод `.writelines()`, он принимает на вход список строк, склеивает их и добавляет в файл одной строкой:

In [20]:
file03.writelines(new)
file03.close()

```
Пустынное место. Гром и молния.Входят три ведьмы.Первая ведьмаКогда средь молний, в дождь и громМы вновь увидимся втроем?Вторая ведьмаКогда один из воеводДругого в битве разобьет.Третья ведьмаЗаря решит ее исход.Первая ведьмаГде нам сойтись?Вторая ведьмаНа пустыре.Третья ведьмаМакбет там будет к той пореПервая ведьмаМурлычет кот, зовет. Иду!Третья ведьмаЗов жабы слышу я в пруду.Все вместеЗло есть добро, добро есть зло.Летим, вскочив на помело!
```

Обратите внимание: если мы хотим записать каждый элемент списка с новой строки, придется к каждому из них доклеить `"\n"`, а затем такой обновленный список подать на вход `.writelines()`.

Итак, мы рассмотрели основные методы для чтения и записи txt-файлов. В заключение посмотрим на альтернативный способ записи строк в файл. На самом деле, осуществлять запись строк в файл можно с помощью обычной функции `print()`, если указать в ней аргумент `file`.

В отличие от `.write()`, эта функция «всеядна», она примет на вход и строку, и число, и список. Плюс, сама по себе эта функция при выводе объектов по умолчанию осуществляет переход на новую строку, безо всяких добавлений `"\n"`.

In [21]:
# числа – не надо никаких str(i)

file04 = open("numbers.txt", "w")
for i in range(0, 10):
    print(i ** 2, file = file04)
file04.close()

```
0
1
4
9
16
25
36
49
64
81
```

In [22]:
file04 = open("numbers.txt", "a")
print(["каждый", "охотник", "желает", "знать"], file = file04)
file04.close()

```
0
1
4
9
16
25
36
49
64
81
['каждый', 'охотник', 'желает', 'знать']
```