## Работа с файлами в Python

*Для анализа данных, как правило, используются такие высокоуровневые средства, как функция `pandas.read_csv()`.*

### Функция `open`

Для открытия файлов в режиме чтения и записи используется функция `open`, которая принимает относительный или абсолютный путь.

```
path = 'examples/segismundo.txt'
f = open(path, encoding='utf-8')
```

По умолчанию файл открывается только для чтения - в режиме `'r'`. Описатель файла `f` можно рассматривать как список строк.

У строк, прочитанный из файлов, сохраняется признак конца строки (EOL), поэтому часто можновстретить код, который их удаляет:

`lines = [x.rstrip() for x in open(path, encoding='utf-8')]`

Если для создания объекта файла использовалась функция `open`, то следует явно закрывать файл при помощи `f.close()`.
Упростить эту процедуру можно с помощью конструкции `with`:
```
with open(path) as f:
    lines = [x.rstrip() for x in f]
```

Если бы мы написали `f = open(path, 'w')`, то был бы создан **новый** файл examples/ segismundo.txt (будьте осторожны!), а **старый был бы перезаписан**. Существует также режим `'x'`, в котором создается допускающий запись файл, но лишь в том случае, если его еще не существует, а в противном случае возбуждается исключение.

**Все режимы открытия файла**
| Режим | Описание |
|:-----:|:---------|
| r | Режим чтения |
| w | Режим записи. Создается новый файл, старый с тем же именем удаляется |
| x | Режим записи. Создается новый файл, но возникает ошибка, если файл с таким же именем существует|
| a | Дописывает в конец существующего файла (если файл не существует, он создается) |
 r+ | Чтение и запись |
| b | Уточнение режима для двоичных файлов 'rb' или 'wb' |
| t | Текстовый режим. Подразумевается по умолчанию |

При работе с файлами чаже всего используются методы `read`, `seek`, `tell`.
Метод `read` возвращает определенное число символов из файла. Если файл открыт в двоичном режиме, то под символами понимаются байты.

In [4]:
path = 'datasets/files_and_os_poem.txt'

lines = [x.rstrip() for x in open(path, encoding='utf-8')]

lines

['Sueña el rico en su riqueza,',
 'que más cuidados le ofrece;',
 'sueña el pobre que padece,',
 'su miseria y su pobreza;',
 'sueña el que a medrar empieza,',
 'sueña el que afana y pretende,',
 'sueña el que agravia y ofende,',
 'y en el mundo, en conclusión,',
 'todos sueñan lo que son,',
 'aunque ninguno lo entiende.']

In [6]:
f1 = open(path, encoding='utf-8')

f1.read(10)

'Sueña el r'

Метод `read` продвигает указатель файла вперед на количество прочитанных байтов. Метод `tell` сообщает текущую позицию:

In [7]:
f1.tell()

11