# Работа с файлами в Python

Функции и объекты, рассмотренные сегодня,  позволят нам сохранять данные между вызовами программы, а также обмениваться данными между программами.


Python поддерживает множество различных типов файлов, но условно их можно разделить на два вида: 
**текстовые** и **бинарные**. 

Текстовые файлы - это файлы, которые сохраняют информацию в текстовом виде, например, файлы с расширением **cvs, txt, html** и т.д.

Бинарные файлы - это изображения, аудио и видеофайлы и т.д. 

В зависимости от типа файла работа с ним может немного отличаться.

При работе с файлами необходимо соблюдать некоторую последовательность операций:

1. Открытие файла с помощью метода **open()**
2. Чтение файла с помощью метода **read()** или запись в файл посредством метода **write()**
3. Закрытие файла методом **close()**

## Открытие и закрытие файла

Чтобы начать работу с файлом, его надо открыть с помощью функции **open()**, которая имеет следующее формальное определение:
```
open(file, mode, encoding)
```
Первый параметр функции (**file**) представляет путь к файлу. Путь файла может быть абсолютным, то есть начинаться с буквы диска, например, **C://somedir/somefile.txt**. 


При указании пути к каталогу используется `/`(прямая обратная черта, слэш, правый слэш), не обсуждая какая операционная система используется. 
Windows использует `\` (обратную косую черту, обратный слэш, слэш влево) для указания пути к каталогам.
Операционные системы Linux и MacOS используют `/`(прямая обратная черта, слэш, правый слэш). 
В Python прямой слэш просто работает всегда, даже на Windows. 


Если путь каталога не начинается с косой черты (слэша) или буквы, это называется **относительным путем**. 

Например, `somedir/somefile.txt` - в этом случае поиск файла будет идти относительно расположения запущенного скрипта Python.

Файл не обязательно должен находиться на локальных дисках. Вы можете использовать сетевые диски. Этот файл может быть объектом виртуальной файловой системы (`/proc в linux`). 

Если ваш компьютер считает это за файл и даёт возможность обращаться к этому как к файлу, то Python сможет открыть этот файл.


Второй передаваемый аргумент - `mode` устанавливает режим открытия файла в зависимости от того, что мы собираемся с ним делать. 
Существует 4 общих режима: 
- `r` (Read), 
- `w` (Write), 
- `a` (Append), 
- `b` (Binary). 


`r (Read)`. Файл открывается для чтения. Если файл не найден, то генерируется исключение `FileNotFoundError`.

`w (Write)`. Файл открывается для записи. Если файл отсутствует, то он создается. Если подобный файл уже есть, то он создается заново, и соответственно старые данные в нем стираются.

`a (Append)`. Файл открывается для дозаписи. Если файл отсутствует, то он создается. Если подобный файл уже есть, то данные записываются в его конец.

`b (Binary)`. Используется для работы с бинарными файлами. Применяется вместе с другими режимами - w или r.


Режимы могут быть объединены, то есть, к примеру, `rb` - чтение в двоичном режиме. 

По умолчанию режим равен `rt`.

Последний аргумент, `encoding`, нужен только в текстовом режиме чтения файла. Этот аргумент задает кодировку.

После завершения работы с файлом его обязательно нужно закрыть методом `close()`. Данный метод освободит все связанные с файлом используемые ресурсы.


## Открытие текстового файла

Например, откроем для чтения текстовый файл «my.txt":

In [3]:
fin = open('my.txt')
print(fin)
fin.close()

<_io.TextIOWrapper name='my.txt' mode='r' encoding='cp1251'>


Например, откроем для записи текстовый файл "hello.txt":

In [1]:
fout = open('hello.txt', 'w')

## Чтение текстового файла

Для чтения файла он открывается с режимом r (Read), и затем мы можем считать его содержимое различными методами:
- `read()` считывает все содержимое файла в одну строку

- `readline()` считывает одну строку из файла

- `readlines()` считывает все строки файла в список


Первый метод `read` читает весь файл целиком, если был вызван без аргументов.

In [2]:
fin = open('my.txt',encoding='utf-8')
s = fin.read()
print(s)
fin.close()

Наш первый текстовый документ.
Hello World!
Python
Привет


Необходимо понимать, что на самом деле строка s имеет вид 

`"Наш первый текстовый документ.\nHello World!\nPython\nПривет"`

Символ `\n` это символ новой строки.


In [8]:
print("Наш первый текстовый документ.\nHello World!\nPython\nПривет")

Наш первый текстовый документ.
Hello World!
Python
Привет


Метод `read()` читает `n` символов, если был вызван с аргументом (целым числом n).


In [3]:
fin = open('my.txt',encoding='utf-8')
s = fin.read(3)
print(s)
s = fin.read(3)
print(s)
fin.close()

Наш
 пе


Ещё один способ прочитать содержимое файла – прочитать файл построчно, воспользовавшись циклом `for`:


In [4]:
fin = open('my.txt',encoding='utf-8')
for line in fin:
    print(line)

Наш первый текстовый документ.

Hello World!

Python

Привет


In [5]:
fin = open('my.txt',encoding='utf-8')
for line in fin:
    print(line.strip())

Наш первый текстовый документ.
Hello World!
Python
Привет


In [7]:
fin = open('my.txt')
text = [x.strip() for x in fin]
print(text)

['РќР°С€ РїРµСЂРІС‹Р№ С‚РµРєСЃС‚РѕРІС‹Р№ РґРѕРєСѓРјРµРЅС‚.', 'Hello World!', 'Python', 'РџСЂРёРІРµС‚']


Метод `readline` считывает символы из файла, пока не встретит символ новой строки (т.е. считывает одну строку), и возвращает результат как `string`. 


In [8]:
fin = open('my.txt',encoding='utf-8')
s = fin.readline()
print(s)

Наш первый текстовый документ.



При этом символ новой строки `\n` остаётся в конце прочитанной строки и отсутствует при чтении последней строки файла только если файл не оканчивается пустой строкой.


За счёт этого возвращаемое значение становится недвусмысленным: 
- если `f.readline()` возвращает пустую строку — достигнут конец файла, 
- незаполненная строка, представленная посредством '\n', содержит лишь символ новой строки.


Объект `file` следит за тем, где производится чтение. 
Интерпретатор как будто оставляет закладку в том месте файла, так что каждый следующий вызов `read()` или `readline()` начинается оттуда, где завершил работу предыдущий. 


Поэтому если вызвать метод `readline` снова, то получим данные из следующей строки:

In [9]:
s = fin.readline()
print(s)
s = fin.readline()
print(s)
s = fin.readline()
print(s)
fin.close()

Hello World!

Python

Привет


Еще один способ работы с отдельными строками текстового файла – использование метода `readlines()`, читающего текстовый файл в список, элементами которого являются строки. 

In [10]:
fin = open('my.txt')
text = fin.readlines()
print(type(text))
print(text)
fin.close()
text = [x.strip() for x in text]
print(text)

<class 'list'>
['РќР°С€ РїРµСЂРІС‹Р№ С‚РµРєСЃС‚РѕРІС‹Р№ РґРѕРєСѓРјРµРЅС‚.\n', 'Hello World!\n', 'Python\n', 'РџСЂРёРІРµС‚']
['РќР°С€ РїРµСЂРІС‹Р№ С‚РµРєСЃС‚РѕРІС‹Р№ РґРѕРєСѓРјРµРЅС‚.', 'Hello World!', 'Python', 'РџСЂРёРІРµС‚']


Теперь переменная `text` ссылается на список, в котором каждый элемент совпадает с одной строкой исходного текстового файла. Список `text`  - обычный список. 

Можно найти его длину и даже перебрать его элементы с помощью цикла:

In [28]:
print(len(text))
for line in text:
    print(line.strip())

4
РќР°С€ РїРµСЂРІС‹Р№ С‚РµРєСЃС‚РѕРІС‹Р№ РґРѕРєСѓРјРµРЅС‚.
Hello World!
Python
РџСЂРёРІРµС‚


## Использование оператора «with»

В Python имеется встроенный инструмент, применяя который мы можем упростить чтение и редактирование файлов. 
Оператор `with` создает диспетчер контекста в Python, который автоматически закрывает файл, по окончанию работы в нем. 


In [11]:
with open('my.txt') as fin:
    print(fin.readline())

РќР°С€ РїРµСЂРІС‹Р№ С‚РµРєСЃС‚РѕРІС‹Р№ РґРѕРєСѓРјРµРЅС‚.



Можем выполнять все стандартные операции ввода\вывода, в привычном порядке, пока находимся в пределах блока кода. 

После того, как покинем блок кода, файловый дескриптор закроет его, и его уже нельзя будет использовать. 

Т.е. нам не нужно закрывать дескриптор файла, так как оператор делает это автоматически. 


In [12]:
fin.readline()

ValueError: I/O operation on closed file.

## Перехват ошибок

Ошибки будут получены:
- если у нас нет доступа к файлу,
- если мы попытаемся открыть директорию для чтения,
- ошибки обработки данных.

Для предотвращения подобных ошибок мы можем пользоваться специальными функциями, но это может отнимать много времени и кода для проверки  всех возможных вероятных ошибок.

В подобных случаях гораздо лучше просто продолжать выполнение, а с ошибками разбираться, если они появятся. 


In [17]:
try:
    fin = open('my.txt')
    s = fin.readline()
    print(len(s))
    print(s[len(s)-2])

except FileNotFoundError:
    print('Не удается найти файл')
except PermissionError:
    print('Нет разрешения доступа')
except:
    print('Произошла какая-то ошибка')

57
.


In [46]:
try:
    with open('my1.txt') as fin:
        print(fin.readline())
except FileNotFoundError:
    print('Не удается найти файл')
except PermissionError:
    print('Нет разрешения доступа')
except:
    print('Произошла какая-то ошибка')

Не удается найти файл


### Почему информацию нельзя хранить в том виде, в котором мы привыкли ее видеть в программе.

In [2]:
with open('01.txt') as f:
    s = f.read()
    print(type(s))
    print(s)
    print(s[0], s[3], s[7])

<class 'str'>
[1, 2, 'hello', [5, 6, 7], 0, ['python', 'hello']]
[   '
