# Файлы

В жизни довольно редко информация остается внутри программы. Мы пишем программу, чтобы упростить обработку каких-то данных, а значит, получаем на вход данные откуда-то извне и после обработки должны отдать их миру.

В компьютере любая информация хранится в файлах самых разнообразных форматов. Обычно файлы делятся на две группы:


*   ***текстовые*** (txt, csv, xlsx, doc, html и др.) - в них хранится информация, которую может прочитать человек.
*   ***двоичные*** - в них хранится любая не текстовая информация, т.к. если информация не является текстом, то хранится в закодированном виде. Это фильмы, музыка, изображения, программы и многое другое.



# Этапы работы с файлами





1.   Открытие файла
2.   Запись в файл
2.   Чтение из файла
3.   Закрытие файла





###Открытие файла

Первое, что нужно сделать с файлом, чтобы как-то с ним работать - это открыть файл. Неважно, читаете вы информацию из файла или записываете, существовал раньше файл или нет - первым делом его надо открыть.

Для открытия файла существует функция **`open()`**. Она принимает два обязательных параметра - путь к файлу и режим открытия.

***Путь к файлу*** - указывает на место хранения файла в файловой системе компьютера.

Путь к файлу можно указать двумя способами:


1.   ***Абсолютный*** - начинается с буквы диска и содержит полный путь по каталогам к файлу. Имеет такой вид: `Диск:/Папка1/Папка2/Папка3/название_файла.расширение`. Пример: `C:/PycharmProjects/AIP/tasks/main.py`.
2.   ***Относительный*** - поиск файла ведется начиная с каталога, в котором лежит файл программы. Пример: `tasks/main.py`, если мы уже находимся в каталоге `C:/PycharmProjects/AIP`.

Относительный путь используется чаще, т.к. абсолютный адрес меняется в тот момент, когда перемещается файл или папка, в котором он лежит. Заранее невозможно предугадать, где окажется файл.

> Относительные пути поддерживают переход в верхнюю папку, для этого нужно указать две точки `..` как название папки.





***Режим открытия файла*** - определяет, как файл будет использоваться в программе.

Существует 4 основных режима откртия файлов:


1.   **`r`** - чтение файла
2.   **`w`** - очистка содержимого файла и запись в него
3.   **`a`** - запись в конец файла и его создание при необходимости
4.   **`x`** - создание нового файла и запись в него (ошибка, если файл уже существует)

Есть еще три дополнительных режима, которые можно комбинировать с основными и друг с другом:



1.   **`t`** - открыть файл как текстовый (по умолчанию)
2.   **`b`** - открыть файл как двоичный
3.   **`+`** - открыть файл как на чтение, так и на запись





In [1]:
file = open("data1.txt", "x", encoding="utf-8")

## Запись в файл

Самый простой способ записать что-то в файл - использовать метод **`write()`**.

In [3]:
file = open("data1.txt", "w")

file.write("Hello World!\n")
file.write("Hello Universe!")

file.close()

Чтобы добавить перенос строки, надо использовать спецсимвол.

Для записи в файл списка строк, можно использовать метод **`writelines()`**.

In [4]:
file = open("data1.txt", "w")
file.writelines(["world\n", "universe"])
file.close()

Еще в файл можно записвать с помощью функции **`print()`**, указав именованный аргумент **`file`**. Указывать в нем нужно переменную, а не путь.

In [7]:
data = open("data1.txt", "w")

print("February", file=data)
print(int(input()), file=data)

data.close()

46541654


Как видим, можно не добавлять перенос строки. 
Функция **`print()`** работает точно так же, как для вывода информации на экран.Удобно.

In [8]:
data = open("data1.txt", "w")

print("Январь", "Февраль", "Март", "Апрель", "Май", sep="\n", file=data)

data.close()

## Чтение из файла

Чтобы прочитать весь файл сразу, можно использовать метод **`read()`**.

In [9]:
data = open("data1.txt", "r")
content = data.read()
data.close()
print(content)

Январь
Февраль
Март
Апрель
Май



Этот метод не удобно использовать, если в файле больше одной строки, т.к. для обработки строки придется самостоятельно разбивать.
Чтобы прочитать файл в список строк, есть метод **`readlines()`**.

In [None]:
data = open("data1.txt", "r")
content = data.readlines()
data.close()
print(content)

['Январь\n', 'Февраль\n', 'Март\n', 'Апрель\n', 'Май\n']


Единственный минус - метод читает перенос на новую строку как символ и оставляет его в строке. Но у нас есть метод **`rstrip()`**, который поможет это исправить.

In [10]:
data = open("data1.txt", "r")
content = [line.rstrip() for line in data.readlines()]
data.close()
print(content)

['Январь', 'Февраль', 'Март', 'Апрель', 'Май']


Методы **`read()`** и **`readlines()`** удобны для работы с небольшими файлами. Но если файл занимает гигабайты памяти, то чтение всего содержимого файла сразу переполнит оперативную память. Значит, надо читать файлы построчно.


*   можно воспользоваться циклом **`for`**
*   можно воспользоваться методом **`readline()`**



In [11]:
data = open("data1.txt", "r")

for line in data:
  print(line)

data.close()

Январь

Февраль

Март

Апрель

Май



Лишний **`\n`** никуда не исчез, поэтому не забываем про **`rstrip()`**.

In [None]:
data = open("data.txt", "r")

for line in data:
  print(line.rstrip())

data.close()

Январь
Февраль
Март
Апрель
Май


In [12]:
data = open("data1.txt", "r")

jan = data.readline().rstrip()
feb = data.readline().rstrip()

print(jan, feb)

data.close()

Январь Февраль


## Закрытие файла

Когда работа с файлом завершена, файл нужно закрыть. Таким образом мы говорим, что файл больше никак не связан с программой. Закрыть файл можно с помощью метода **`close()`**.

In [None]:
file = open("data1.txt", "r")
file.close()


> Если не закрыть файл, часть данных может в него не записаться.

> В закрытый файл нельзя ничего записать.

Проверить, закрыт ли файл, можно при помощи свойства **`closed`**.




In [None]:
file = open("data1.txt", "r")
print(file.closed)

False


In [None]:
file.close()
print(file.closed)

True
