# Основы работы с файлами

## Введение в работу с файлами
Работа с файлами — важная часть программирования, поскольку данные часто хранятся во внешних файлах. Python позволяет создавать, читать, изменять и удалять файлы.  
### Почему важно уметь работать с файлами?
1. Хранение данных
   * Файлы позволяют сохранять информацию между запусками программы.
   * Например, конфигурационные файлы, базы данных, отчёты.
2. Обмен данными  
   * Файлы используются для передачи данных между программами (CSV, JSON, XML).
   * Например, работа с логами или загрузка файлов в веб-приложениях.
3. Обработка больших объёмов информации
   * Данные могут быть слишком объёмными для хранения в оперативной памяти.
   * Файлы позволяют считывать информацию по частям.
4. Автоматизация работы с документами  
   * Скрипты могут автоматически создавать и изменять файлы, избавляя от ручной работы.
   * Например, генерация отчётов, обработка логов, создание резервных копий.


### Типы файлов: текстовые и бинарные
Все файлы в операционной системе делятся на два типа: текстовые и бинарные.  
***1. Текстовые файлы*** 
   * Хранят информацию в виде обычного текста (читаемого человеком).
   * Используют кодировки (UTF-8, CP1251 и др.).
   * Примеры: .txt, .csv, .json, .html, .py.
      * Пример текстового файла data.txt:
      ```
      Имя, Возраст
      Анна, 25
      Иван, 30
      ```
***2. Бинарные файлы***  
   * Хранят данные в двоичном формате (не читаемом человеком).
   * Используются для хранения изображений, видео, исполняемых файлов, баз данных.
   * Примеры: .jpg, .png, .mp4, .exe, .zip.
   * Пример бинарного файла (image.jpg):
      * \xFF\xD8\xFF\xE0\x00\x10JFIF\x00\x01\x01\x00\x00\x01\x00\x01\x00\x00


## Функция open
Функция `open()` используется для работы с файлами в Python. Она позволяет открывать файлы для чтения и записи данных, включая текстовую и бинарную информацию. Функция возвращает объект файла.  
Синтаксис:  
`open(file, mode="mode", encoding="encoding")`

* `file` – путь к файлу (относительный или абсолютный).
* `mode` (необязательный) – режим работы с файлом ("r", "w", "a", "b" и др.).
* `encoding` (необязательный) – кодировка текста ("utf-8", "cp1251" и др.). Используется только для текстовых файлов.


### Режимы работы с файлами
При открытии файла с помощью `open()` необходимо указать режим работы.  
По умолчанию файл открывается в режиме "rt" (чтение текста).


![image.png](attachment:bbcc9837-96e2-4bfc-98ec-5fd05df9fc67.png)

Важно: Режимы можно комбинировать, например:   
* "rb" – чтение в бинарном режиме.   
* "wt" – запись в текстовом режиме.   
* "a+" – добавление и чтение.  

### Параметр encoding
Параметр encoding в функции open() используется для указания кодировки текста при чтении или записи файлов. Он особенно важен при работе с файлами, содержащими символы, отличные от стандартных ASCII.


### Почему encoding важен?
1. Обеспечивает правильное чтение и запись файлов
   * Без указания кодировки могут возникнуть ошибки при работе с текстами, содержащими кириллицу, умлауты, азиатские символы и т. д.
2. Универсальность кода
   * Разные системы могут использовать разные кодировки по умолчанию. Например, Windows часто использует cp1251 для русского текста, а Linux/macOS – utf-8.
3. Предотвращает ошибки UnicodeDecodeError
   * Если файл записан в одной кодировке, но читается в другой, может возникнуть ошибка.


#### Популярные кодировки

![image.png](attachment:2805b2b5-c4f1-42b4-9da4-00742c435706.png)", "a+", "x+").


#### Особенности encoding
* Если encoding не указан, Python использует кодировку по умолчанию, которая зависит от операционной системы.
* Используется только для текстовых файлов (при "rb" и "wb" encoding не нужен).
* Неверная кодировка может вызвать UnicodeDecodeError.


### Функция close
Функция close() используется для закрытия файла после его открытия с помощью open(). Закрытие файла необходимо для освобождения ресурсов и предотвращения возможных ошибок при повторном доступе к нему.

In [None]:
# Можно указать просто "r", а не mode="r"
file = open("example.txt", "r", encoding="utf-8")  # Открываем файл для чтения
content = file.read()  # Читаем содержимое файла
print(content)
file.close()  # Закрываем файл вручную

#### Зачем закрывать файл?
1. Освобождение системных ресурсов
   * Открытые файлы занимают память и могут блокировать доступ к файлу для других программ.
2. Гарантированное сохранение данных
   * В некоторых случаях изменения могут не записаться сразу, а только при закрытии файла.
3. Предотвращение ошибок доступа
   * В Windows файл может оставаться заблокированным, если его не закрыть явно.


#### Контекстный менеджер with as
Контекстный менеджер with open() as используется для безопасной работы с файлами, автоматически закрывая файл после выхода из блока. Это предпочтительный способ работы с файлами в Python.


#### Зачем использовать with open()?
1. Автоматическое закрытие файла
   * Файл закрывается даже в случае ошибки в блоке with, предотвращая утечки ресурсов.
2. Код становится чище
   * Не нужно вручную вызывать close(), что уменьшает вероятность ошибок.  
*Синтаксис*
```
with open(file, mode="mode", encoding="encoding") as variable:
    # Операции с файлом
```

* variable – переменная, представляющая объект файла внутри блока with.


In [None]:
with open("example.txt", "r", encoding="utf-8") as file:
    content = file.read()
    print(content)


#### Особенности:
* Файл открывается только внутри блока with.
* После выхода из блока файл автоматически закрывается.


## Чтение из файла
Python предоставляет несколько способов чтения данных из файла. Когда файл открывается, указатель устанавливается в начало файла, и по мере чтения он смещается вперёд.  

***Указатель файла*** — это позиция, с которой выполняется следующее чтение или запись.


***1. Чтение всего содержимого файла***  
Метод `read()` позволяет считать весь текст из файла в одну строку.


In [1]:
with open("example.txt", "r", encoding="utf-8") as file:
    content = file.read()
    print(type(content))
    print(content)


FileNotFoundError: [Errno 2] No such file or directory: 'example.txt'

#### Особенности:
* Читает весь файл целиком.
* Если файл большой, может занять много памяти.
* Указатель после чтения перемещается в конец файла.
* Переносы строк указываются как \n.


***2. Чтение первых n символов***  
Метод `read(n)` позволяет считать указанное количество символов.


In [None]:
with open("example.txt", "r", encoding="utf-8") as file:
    content = file.read(10)  # Читаем первые 10 символов
    print(content)


#### Особенности:
* Позволяет контролировать объём загружаемых данных.
* Полезно при чтении больших файлов по частям.


***3. Чтение построчно***  
Метод `readline()` читает одну строку за вызов.


In [None]:
with open("example.txt", "r", encoding="utf-8") as file:
    print(file.readline())
    print(file.readline())
    print(file.readline())


#### Особенности:
* Читает одну строку из файла.
* Каждый вызов readline() перемещает указатель дальше.
* Если в файле несколько строк, можно вызывать readline() повторно.


***4. Чтение всех строк***  
Метод `readlines()` загружает все строки файла в список.


In [None]:
with open("example.txt", "r", encoding="utf-8") as file:
    lines = file.readlines()
    print(type(lines))
    print(lines)


##### Особенности:
* Возвращает список, где каждая строка – отдельный элемент.
* Учитывает символ \n в конце строк.


***5. Чтение файла в цикле***   
Файл является итерируемым объектом, поэтому можно перебирать его содержимое построчно в цикле без необходимости загружать весь файл в память.


In [None]:
with open("example.txt", "r", encoding="utf-8") as file:
    for line in file:
        print(line, end="")

##### Особенности:
* Читает файл по одной строке, не загружая всё в память.
* Подходит для обработки больших файлов.


## Запись в файл
Для записи в файл также представлено несколько методов.  

***1. Запись строки в файл (write())***   
Метод `write()` записывает строку в файл.


In [2]:
with open("users.txt", "w", encoding="utf-8") as file:
    file.write("ID: 201 | Name: John | Age: 25 | Status: Active\n")


##### Особенности:
* Создаёт файл, если его нет.
* Удаляет старые данные в файле.
* write() не добавляет символ \n автоматически.


***2. Запись нескольких строк (writelines())***  
Метод writelines() записывает список строк.


In [None]:
data = [
    "ID: 202 | Name: Alice | Age: 30 | Status: Inactive\n",
    "ID: 203 | Name: Bob | Age: 27 | Status: Active\n"
]


with open("users.txt", "w", encoding="utf-8") as file:
    file.writelines(data)


##### Особенности:
* Принимает список строк и записывает их подряд.
* \n нужно добавлять вручную, иначе строки сольются.


### Другие популярные режимы
***1. Режим "a" – добавление в файл***  
Этот режим позволяет сохранять существующее содержимое файла и дописывать данные в конец.


In [None]:
with open("users.txt", "a", encoding="utf-8") as file:
    file.write("Дополнительная строка\n")


##### Особенности:
* Создаёт файл, если его нет.
* Записывает данные в конец файла, а не перезаписывает его.


***2. Режим "r+" – чтение и запись***  
Позволяет и читать, и записывать данные в файл без удаления содержимого.


In [None]:
with open("users.txt", "r+", encoding="utf-8") as file:
    content = file.read()  # Читаем текущие данные
    file.write("\nДобавленный текст")  # Записываем новые данные


##### Особенности:
* Файл должен существовать, иначе возникнет ошибка.
* Чтение начинается с начала файла.
* Запись начинается с текущей позиции указателя, что может привести к частичной перезаписи данных.


***3. Режим "x" – создание нового файла***  
Используется, если нужно гарантированно создать новый файл и избежать перезаписи существующих данных.


In [3]:
try:
    with open("new_file.txt", "x", encoding="utf-8") as file:
        file.write("Этот файл создан в режиме 'x'.\n")
except FileExistsError:
    print("Файл уже существует.")


##### Особенности:
* Если файл уже существует, возникает FileExistsError.
* Полезно, если важно не перезаписывать существующие данные.


### Контекстный менеджер с несколькими файлами
Можно открывать несколько файлов одновременно.


In [4]:
with (open("example.txt", "r", encoding="utf-8") as infile, 
      open("output.txt", "w", encoding="utf-8") as outfile):
    for line in infile:
        outfile.write(line.upper())  # Записываем в верхнем регистре


FileNotFoundError: [Errno 2] No such file or directory: 'example.txt'

##### Особенности:
* Открывает сразу два файла.
* Читает из input.txt и записывает изменённый текст в output.txt.


### Практические задания
***Подсчёт частоты слов в файле***  
Напишите программу, которая подсчитывает, сколько раз каждое слово встречается в файле (не учитывая регистр).  
Программа запрашивает имя файла и количество популярных слов для вывода.  
Если указанный файл не существует, программа должна вывести ошибку.  
Используйте файл text.txt.  

*Пример ввода:*  
Введите имя файла: text.txt  
Введите количество популярных слов: 3  

*Пример вывода:*  
Популярные слова:  
python: 4  
is: 3  
in: 2  


In [5]:
from collections import Counter


filename = input("Введите имя файла: ")


def count_words_in_file(filename):
    with open(filename, "r", encoding="utf-8") as file:
        text = file.read().lower()


    punctuation = '.,!?;:"-'
    for char in punctuation:
        text = text.replace(char, " ")


    return Counter(text.split())




try:
    word_counts = count_words_in_file(filename)
    num_words = int(input("Введите количество популярных слов: "))


    print("\nПопулярные слова:")
    for word, count in word_counts.most_common(num_words):
        print(f"{word}: {count}")


except FileNotFoundError:
    print("Ошибка: Файл не найден.")
except ValueError:
    print("Ошибка: Введите целое число для количества популярных слов.")


Введите имя файла:  7


Ошибка: Файл не найден.


***Удаление пустых строк***  
Напишите программу, которая удаляет пустые строки из указанного пользователем файла и записывает результат в новый файл.  
Имя нового файла формируется автоматически по шаблону <oldname>_cleaned.txt.  
Если указанный файл не существует, программа должна вывести ошибку.  
Используйте файл tasks.txt.

*Пример ввода:*  
Введите имя файла: tasks.txt  

*Пример вывода:*  
Пустые строки удалены, сохранено в tasks_cleaned.txt.


In [6]:
import os


filename = input("Введите имя файла: ")


# Генерация имени нового файла
new_filename = f"{os.path.splitext(filename)[0]}_cleaned.txt"
# # Или изученным способом
# old_name = filename.rsplit('.', 1)
# new_filename = f"{old_name[0]}_cleaned.{old_name[1]}"


try:
    with (open(filename, "r", encoding="utf-8") as infile,
          open(new_filename, "w", encoding="utf-8") as outfile):
        for line in infile:
            if line.strip():
                outfile.writelines(line)
    print(f"Пустые строки удалены, сохранено в {new_filename}.")
except FileNotFoundError:
    print(f"Ошибка: файл '{filename}' не найден.")


Введите имя файла:  7


Ошибка: файл '7' не найден.
