# Файлы

Часто данные в программу поступают в виде текста, в том числе из текстовых файлов.<br>
В Python работа с файлами строится через **файловую переменную**, которая связывает файл на жестком диске с какой-либо переменной в программе.

Для дальнейшей работы создайте файл *products_list.txt* рядом с программой.<br>
Файл должен быть в кодировке **UTF-8** и содержать следующий текст:<br>
хлеб<br>
картошка<br>
масло<br>

#### Быстрое создание файла products_list.txt с помощью Python
Выполните код ниже, чтобы быстро создать файл с нужными данными:

In [1]:
open("products_list.txt", "w+", encoding="utf-8").write("хлеб\nкартошка\nмасло")

19

## Чтение данных из файла

In [2]:
product_file = open("products_list.txt")  # Создаем файловую переменную
products = product_file.read() # Читаем данные из файла и сохраняем их в переменной products
print(products) # Выводим данные из файл

хлеб
картошка
масло


## Работа с кодировками
По умолчанию Python считает, что текстовые файлы находятся в кодировке **UTF-8**. Но иногда файлы находятся в других кодировках, так в Windows-системах распространены **windows-1251** или **cp-1251**. Чтобы открыть файл в другой кодировке, нужно добавить в функцию `open()` атрибут `encoding`. 

> Без параметра `encoding` Python считает, что текстовые файлы находятся в кодировке, которая по умолчанию используется в операционной системе. Обычно это **UTF-8** (по крайней мере в MacOS, Linux и последних версиях Windows). Однако в старых версиях Windows кодировка по умолчанию может быть иной.

#### Быстрое создание файла products_list_cp1251.txt с помощью Python
Выполните код ниже, чтобы быстро создать файл в кодировке windows 1251 с нужными данными:

In [4]:
open("products_list_cp1251.txt", "w+", encoding="cp1251").write("хлеб\nкартошка\nмасло")

19

Попытка открыть файл *products_list_cp1251.txt* используя кодировку **UTF-8**

In [7]:
product_file = open("products_list_cp1251.txt")
products = product_file.read()
print(products)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf5 in position 0: invalid start byte

Программа завершилась с ошибкой UnicodeDecodeError.

Попытка открыть файл *products_list_cp1251.txt* используя кодировку **cp1251**

In [8]:
product_file = open("products_list_cp1251.txt", encoding="cp1251")
products = product_file.read()
print(products)

хлеб
картошка
масло


Попытка открыть файл products_list.txt (файл в **UTF-8**) используя кодировку **cp1251**

In [9]:
product_file = open("products_list.txt", encoding="cp1251")
products = product_file.read()
print(products)

С…Р»РµР±
РєР°СЂС‚РѕС€РєР°
РјР°СЃР»Рѕ


Программа вывела непонятные симолы, так как неправилно обработала кодировку.