## 1. Введение в работу с файлами (1 час)

**Цель:** Познакомить с основными принципами работы с файлами в Python, включая открытие, чтение, запись и закрытие файлов.

### Что такое файл в контексте программирования?

**Файл** — это основная единица хранения данных на компьютере, представляющая собой последовательность байтов, которые могут быть организованы в соответствии с определенным форматом. Файлы позволяют сохранять информацию на долговременной основе, т.е. даже после завершения работы программы или выключения компьютера данные остаются доступными.

В программировании, файл — это абстракция для работы с данными, которая позволяет программистам взаимодействовать с информацией, сохраняя и извлекая её в/из внешнего хранилища (например, на жестком диске, SSD, USB-накопителе и т.д.).

Данные внутри файла организованы в виде последовательности байтов, которые можно интерпретировать различными способами в зависимости от типа файла. Эта последовательность может быть представлена как:

1. **Текстовые данные**: символы, слова, строки.
2. **Бинарные данные**: числа, изображения, аудио, видео и т.д.

Каждый файл имеет определенные атрибуты, такие как имя, размер, тип (расширение файла), дата создания и модификации, права доступа. Например, файл с именем `example.txt` может хранить текстовые данные, такие как строки или предложения.

#### Различия между текстовыми и бинарными файлами

**1. Текстовые файлы:**

Текстовый файл — это файл, содержащий данные в виде читаемых человеком символов, записанных с использованием определенной кодировки (например, ASCII, UTF-8). Каждый символ в текстовом файле представлен одним или несколькими байтами, которые интерпретируются программами как символы.

- **Примеры текстовых файлов:** `.txt`, `.csv`, `.html`, `.xml`, `.json`.
- **Использование:** Текстовые файлы используются для хранения данных, которые должны быть читаемыми человеком, например, документы, исходный код программ, данные в формате CSV.

- **Организация данных:**
  - Данные разделены на строки, каждая из которых заканчивается символом новой строки (`\n`).
  - Символы представлены с использованием конкретной кодировки (например, UTF-8).
  - Обычно эти файлы можно открыть и прочитать в текстовом редакторе.

**2. Бинарные файлы:**

Бинарный файл содержит данные в виде последовательности байтов, которые не обязательно должны быть интерпретированы как символы. Это может быть любой тип данных, включая числа, изображения, аудио, видео, а также скомпилированный код программы.

- **Примеры бинарных файлов:** `.jpg`, `.png`, `.exe`, `.mp3`, `.bin`, `.pdf`.
- **Использование:** Бинарные файлы используются для хранения данных, которые не предназначены для прямого чтения человеком, таких как изображения, музыка, видео, исполняемые программы.

- **Организация данных:**
  - Данные организованы в форме, специфичной для конкретного формата файла (например, структура изображения, структура звукового файла).
  - Бинарные файлы могут содержать заголовки, метаданные, а также данные, представленные в виде сырой двоичной информации.
  - Эти файлы обычно невозможно прочитать в текстовом редакторе, их содержимое кажется случайным набором символов.


### Примеры:

- **Текстовый файл:**  
  Представляет собой последовательность символов. Например, файл `notes.txt` может содержать:
  ```
  This is a simple text file.
  It contains lines of text.
  ```

- **Бинарный файл:**  
  Содержит данные в формате, который не является текстом. Например, файл `image.jpg` содержит байты, представляющие изображение. Попытка открыть его в текстовом редакторе покажет непонятные символы, потому что эти байты не интерпретируются как текст.

### Работа с файлами

#### Разбор синтаксиса: `open(filename, mode)`

Функция `open()` в Python используется для открытия файла и получения объекта файла, с которым можно работать. Синтаксис этой функции выглядит следующим образом:

```python
file_object = open(filename, mode)
```

- **`filename`**: Имя файла, который нужно открыть. Это может быть как полный путь к файлу, так и относительный путь от текущей директории. Например, `"example.txt"`, `"C:/Users/Username/Documents/file.txt"`.
  
- **`mode`**: Режим, в котором файл будет открыт. Режим определяет, как файл будет использоваться (например, только для чтения, для записи и т.д.). Режим может включать несколько символов, комбинируя их для задания конкретного способа открытия файла.

Результатом вызова `open()` является объект файла, через который осуществляется взаимодействие с самим файлом.

### Пояснение режимов работы с файлами

Режимы работы с файлами определяют, как именно будет осуществляться взаимодействие с файлом. Ниже приведены основные режимы:

- **`r` - чтение (read)**
  - Файл открывается только для чтения.
  - <span style="color: red;">Если файл не существует, будет вызвано исключение `FileNotFoundError`.</span>
  - Указатель находится в начале файла, и можно считывать данные с самого начала.

- **`w` - запись (write)**
  - Файл открывается только для записи.
  - Если файл уже существует, его содержимое будет полностью удалено (файл будет очищен).
  - Если файл не существует, он будет создан заново.
  - Указатель находится в начале файла, и запись начнётся с начала.

- **`a` - добавление (append)**
  - Файл открывается для добавления данных.
  - Если файл уже существует, запись будет происходить в конец файла, без удаления существующего содержимого.
  - Если файл не существует, он будет создан заново.
  - Указатель находится в конце файла, и новые данные добавляются после существующих.

- **`b` - бинарный режим (binary)**
  - Этот режим используется в комбинации с другими режимами (`r`, `w`, `a`) для работы с бинарными файлами (например, изображениями, видеофайлами).
  - Например, `rb` означает чтение в бинарном режиме, а `wb` — запись в бинарном режиме.

- **`+` - чтение и запись (update)**
  - Этот режим добавляется к основному режиму (`r`, `w`, `a`), чтобы разрешить как чтение, так и запись.
  - Например, `r+` открывает файл для чтения и записи, но файл должен существовать, иначе будет вызвано исключение.
  - `w+` позволяет читать и записывать, но очищает файл при открытии.
  - `a+` открывает файл для добавления, при этом можно также читать данные из файла.

**Примеры использования разных режимов:**

```python
# Открытие файла для чтения
file = open('example.txt', 'r')

# Открытие файла для записи (удаляет существующие данные)
file = open('example.txt', 'w')

# Открытие файла для добавления данных в конец
file = open('example.txt', 'a')

# Открытие бинарного файла для чтения
file = open('image.jpg', 'rb')

# Открытие файла для чтения и записи
file = open('example.txt', 'r+')
```

### Чтение данных из файла

После того как файл открыт, его содержимое можно считать несколькими способами, в зависимости от задач:

- **`read()` — чтение всего содержимого файла**
  - Этот метод считывает всё содержимое файла в одну строку.
  - Если файл очень большой, использование `read()` может быть неэффективным, так как вся информация загружается в память.

  ```python
  with open('example.txt', 'r') as file:
      content = file.read()
      print(content)
  ```

- **`readline()` — чтение одной строки**
  - Считывает одну строку за раз, что полезно для работы с большими файлами, где нужно обрабатывать данные построчно.
  - Указатель перемещается на следующую строку после вызова `readline()`.

  ```python
  with open('example.txt', 'r') as file:
      first_line = file.readline()
      print(first_line)
  ```

- **`readlines()` — чтение всех строк в список**
  - Возвращает список, где каждая строка файла является отдельным элементом.
  - Используется, когда нужно обработать файл построчно, но все строки должны быть сразу доступны.

  ```python
  with open('example.txt', 'r') as file:
      lines = file.readlines()
      for line in lines:
          print(line)
  ```


### Запись данных в файл

Для записи данных в файл используются следующие методы:

- **`write()` — запись строки или байтовых данных в файл**
  - Записывает строку в файл. Если файл открыт в текстовом режиме, требуется передавать строковые данные.
  - В бинарном режиме (`wb`) в `write()` передаются байтовые данные.
  - При использовании `write()` важно помнить, что файл в режиме `w` очищается перед записью, поэтому все данные будут перезаписаны.


In [1]:
with open('example.txt', 'w') as file:
    file.write("Hello, World!")

- **`writelines()` — запись последовательности строк**
  - Метод записывает последовательность строк в файл. Это может быть список строк или любой другой итерируемый объект, содержащий строки.
  - В отличие от `write()`, `writelines()` не добавляет символы новой строки автоматически, поэтому если нужно, это нужно делать вручную.

In [2]:
with open('example.txt', 'w') as file:
    lines = ["First line\n", "Second line\n", "Third line\n"]
    file.writelines(lines)

### Закрытие файла и управление ресурсами

После завершения работы с файлом важно закрыть его, чтобы освободить ресурсы, которые использовались для работы с ним. В Python файл можно закрыть вручную или автоматически при выходе из контекстного менеджера.

- **Важность вызова метода `close()` для освобождения ресурсов**
  - Когда файл открыт, операционная система выделяет ресурсы для его обработки. Если файл не закрыть после использования, эти ресурсы остаются занятыми, что может привести к утечкам памяти и другим проблемам.
  - Метод `close()` закрывает файл и освобождает все связанные с ним ресурсы.

  ```python
  file = open('example.txt', 'r')
  # Работа с файлом
  file.close()  # Файл закрывается вручную
  ```

- **Потенциальные проблемы при пропуске закрытия файла (утечки памяти)**
  - Если не закрывать файлы, это может привести к исчерпанию лимита открытых файлов для приложения, что вызовет ошибки.
  - Утечка ресурсов может негативно сказаться на производительности приложения, особенно если часто открываются и закрываются файлы.

- **Использование контекстного менеджера `with` для автоматического закрытия файла**
  - Конструкция `with` автоматически закрывает файл после завершения работы с ним, даже если в процессе работы произошло исключение.
  - Это является лучшей практикой, так как уменьшает вероятность ошибок, связанных с незакрытыми файлами.

  ```python
  with open('example.txt', 'r') as file:
      content = file.read()
  # После выхода из блока with файл автоматически закрывается
  ```



### **ВАЖНО!!!**

Работа с файлами в Python включает несколько этапов: 

- открытие файла с использованием функции `open()`, 

- чтение или запись данных и закрытие файла. 

- Выбор правильного режима работы с файлом и корректное управление ресурсами помогают избежать множества проблем, таких как утечки памяти или повреждение данных. 

- Контекстные менеджеры `with` делают работу с файлами более безопасной и удобной, автоматически заботясь о закрытии файла.

### **Работа с контекстными менеджерами**

#### Использование конструкции `with`

##### Понятие контекстного менеджера и его роль в управлении ресурсами

Контекстный менеджер в Python — это объект, который управляет ресурсами, обеспечивая корректное их открытие и закрытие, даже в случае возникновения исключений. Контекстные менеджеры обычно используются для работы с ресурсами, которые требуют явного освобождения после использования, такими как файлы, сетевые соединения, блокировки потоков и другие.

При использовании контекстного менеджера, выполнение определенного кода «внутри» менеджера происходит в специальном блоке, ограниченном ключевым словом `with`. Вход в этот блок выполняется через метод `__enter__()`, а выход — через метод `__exit__()`. Например, в случае с файлами контекстный менеджер открывает файл при входе в блок и закрывает его при выходе, гарантируя тем самым освобождение ресурсов.

##### Преимущества использования `with` для автоматического закрытия файла

Использование конструкции `with` для работы с файлами в Python обладает рядом преимуществ:

1. **Автоматическое управление ресурсами:** Конструкция `with` автоматически закрывает файл, когда выполнение кода покидает блок `with`, даже если в процессе работы произошло исключение. Это устраняет необходимость явного вызова метода `close()`.

2. **Безопасность:** Использование `with` снижает вероятность ошибок, связанных с незакрытыми файлами. В традиционном подходе легко забыть закрыть файл, что может привести к утечке ресурсов и другим проблемам.

3. **Удобство и читаемость кода:** Конструкция `with` упрощает код, делая его более кратким и понятным. Весь код, связанный с работой с файлом, находится в одном блоке, что повышает читаемость и упрощает отладку.

##### Пример использования конструкции `with` для чтения и записи






**Пример 1: Чтение из файла**

В этом примере файл открывается для чтения, и его содержимое считывается и выводится на экран. После выполнения кода файл автоматически закрывается.

In [7]:
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)

First line
Second line
Third line



- Файл `example.txt` открывается в режиме чтения (`r`).
- После выполнения `file.read()` файл автоматически закрывается благодаря конструкции `with`.

**Пример 2: Запись в файл**

В этом примере файл открывается для записи, и в него записывается строка текста. Файл также автоматически закрывается после выполнения записи.


In [4]:
with open('example.txt', 'w') as file:
    file.write('Hello, World!')


- Файл `example.txt` открывается в режиме записи (`w`).
- Строка `"Hello, World!"` записывается в файл, и после выхода из блока `with` файл закрывается.

### **Рассмотрение возможных ошибок**

#### Обработка исключений при работе с файлами

Работа с файлами может сопровождаться различными ошибками и исключениями, такими как:

- <span style="color: red;">**FileNotFoundError:**</span> Возникает, если файл, который пытаются открыть в режиме чтения, не существует.
- <span style="color: red;">**PermissionError:**</span> Возникает, если у программы нет прав доступа на выполнение операции (например, запись в защищённый файл).
- <span style="color: red;">**IsADirectoryError:**</span> Возникает, если пытаются открыть директорию как файл.

Эти исключения можно обрабатывать с помощью конструкции `try-except`, чтобы обеспечить надлежащую обработку ошибок и избежать аварийного завершения программы.

In [8]:
# В этом примере, если файл не существует, программа не завершится с ошибкой, а выведет сообщение "The file does not exist."
try:
    with open('non_existent_file.txt', 'r') as file:
        content = file.read()
except FileNotFoundError:
    print("The file does not exist.")
except PermissionError:
    print("You don't have permission to access this file.")

The file does not exist.


#### Использование конструкции `try-except-finally` в традиционном подходе без `with`

Если по каким-то причинам не используется конструкция `with`, можно использовать традиционный подход с `try-except-finally`, чтобы гарантировать закрытие файла даже в случае возникновения исключений. Это полезно, если нужно контролировать процесс открытия и закрытия файла более явно.

In [9]:
file = None
try:
    file = open('example.txt', 'r')
    content = file.read()
    print(content)
except FileNotFoundError:
    print("The file does not exist.")
except Exception as e:
    print(f"An error occurred: {e}")
finally:
    if file:
        file.close()

First line
Second line
Third line



- **`try:`** — блок, в котором пытаются выполнить код, который может вызвать исключение.
- **`except:`** — блок, который перехватывает и обрабатывает исключение, если оно произошло.
- **`finally:`** — блок, который выполняется в любом случае, независимо от того, произошло ли исключение. Здесь файл закрывается, если он был успешно открыт.

**Основные моменты:**

- Конструкция `finally` гарантирует, что файл будет закрыт в конце выполнения блока `try`, независимо от того, возникло исключение или нет.
- Такой подход более громоздкий, чем использование `with`, и более подвержен ошибкам, если, например, файл не был открыт, а в `finally` пытаются его закрыть.

### **ВАЖНО**

Контекстные менеджеры и конструкция `with` обеспечивают удобное и безопасное управление ресурсами в Python, минимизируя вероятность ошибок, связанных с незакрытыми файлами. Они автоматизируют процесс открытия и закрытия файлов, упрощая код и делая его более устойчивым к ошибкам. В то же время, традиционный подход с `try-except-finally` предоставляет более явный контроль, но требует дополнительного внимания для правильного закрытия ресурсов.