<a href="https://colab.research.google.com/github/Alexandre77777/python_programming/blob/main/4.%20%D0%9A%D0%BE%D0%B4%20%D1%81%20%D0%B7%D0%B0%D0%BD%D1%8F%D1%82%D0%B8%D0%B9/6.%20%D0%9A%D0%BE%D0%B4_%D1%81_%D0%BF%D0%B0%D1%80%D1%8B_20_10_2023_Text.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Работа с текстовыми файлами в Python**

## **0. БАЗА**

### **Чтение из файла**

Формируем файл с текстом:

In [None]:
new_text = open("Words.txt", mode='w', encoding='utf8')
word_list = ['Ромашка\n', 'Репа\n', 'Капуста\n', 'Орех\n', 'Картофель']
new_text.writelines(word_list)
new_text.close()

In [None]:
# Чтение из файла

text = open('Words.txt', mode='r', buffering=-1, encoding=None,
          errors=None, newline=None, closefd=True, opener=None)
    #
    # -> https://docs-python.ru/tutorial/vstroennye-funktsii-interpretatora-python/funktsija-open/
    # :param file: абсолютное или относительное значение пути к файлу или файловый дескриптор открываемого файла.
    #               Параметр file есть обязательным в функции open(). Все другие параметры являются необязательными
    # :param mode: необязательно, строка, которая указывает режим, в котором открывается файл. По умолчанию 'r',
    #              это означает что файл открывается в текстовом режиме для чтения.
    # :param buffering: необязательно, целое число, используемое для установки политики буферизации.
    #                   Понятие «буферизация» означает, что при чтении (записи) информации из файла (в файл) эта информация
    #                   предварительно записывается в специальный участок памяти – буфер (buffer).
    #                   Таким образом, информация дублируется в буфере заданного размера.
    #                   Правильно подобранное значение размера буфера позволяет ускорить выполнение программы,
    #                   которая интенсивно использует работу с файлами.
    # :param encoding: необязательно, кодировка, используемая для декодирования или кодирования файла
    # :param errors: необязательно, строка, которая указывает, как должны обрабатываться ошибки кодирования и декодирования.
    #                 Не используется в -бинарном режиме
    # :param newline: необязательно, режим перевода строк. Варианты: None, '\n', '\r' и '\r\n'.
    #                 Следует использовать только для текстовых файлов
    # :param closefd: необязательно, bool, флаг закрытия файлового дескриптора.
    # :param opener: необязательно, пользовательский объект, возвращающий открытый дескриптор файла.
    # :return: файловый объект (поток).
print(type(text)) # io.TextIOWrapper() - буферизованный текстовый поток
text.close() # Закрывает открытый файл, освобождая ресурсы системы
             # Важно! Все открытые файлы нужно обязательно закрывать, т. к. из за незакрытых файлов
             # может произойти превышение лимита открытых дескрипторов в системе, что может повлечь сбой системы.

<class '_io.TextIOWrapper'>


In [None]:
text = open('Words.txt', encoding='utf8') # Открытие файла с параметрами по умолчанию (для чтения)
print(text)

<_io.TextIOWrapper name='Words.txt' mode='r' encoding='utf8'>


In [None]:
print(text.read()) # Считывает все содержимое файла как одну строку

Ромашка
Репа
Капуста
Орех
Картофель


In [None]:
print('Текущая позиция курсора:', text.tell()) # Возвращает текущую позицию курсора (указателя) в файле в (байтах!)

Текущая позиция курсора: 66


In [None]:
text.seek(0) # Устанавливает курсор в начало файла
print('Текущая позиция курсора:', text.tell()) # Возвращает текущую позицию курсора (указателя) в файле в (байтах!)

Текущая позиция курсора: 0


In [None]:
print(text.readline()) # Считывает только одну строку из файла и возвращает ее
text.seek(0) # Устанавливает курсор на начало файла

Ромашка



0

In [None]:
print(text.readlines()) # Возвращает все строки в файле в виде списка
text.seek(0) # Устанавливает курсор на начало файла

['Ромашка\n', 'Репа\n', 'Капуста\n', 'Орех\n', 'Картофель']


0

In [None]:
word_list = text.read().splitlines() # возвращает список строк, текста str, разделенного по универсальным разрывам строк.
print(word_list)

['Ромашка', 'Репа', 'Капуста', 'Орех', 'Картофель']


In [None]:
word_list = [i.upper() for i in word_list] # Перевод всех слов из списка в верхний регистр
print(word_list)

['РОМАШКА', 'РЕПА', 'КАПУСТА', 'ОРЕХ', 'КАРТОФЕЛЬ']


In [None]:
text.close() # Закрываем файл

print(text.closed) # Проверяем закрыт ли файл

True


### **Альтернативный способ открытия файла через контекстный менеджер**

In [None]:
# Альтернативный способ открытия файла через контекстный менеджер

with open('Words.txt', encoding='utf8') as text: # по смыслу аналогично text = open('Words.txt')
    word_list = text.read().splitlines()
    word_list = [i.upper() for i in word_list]
# После выполнения кода в теле конструкции with - файл закрывается автоматически!

print(word_list)

['РОМАШКА', 'РЕПА', 'КАПУСТА', 'ОРЕХ', 'КАРТОФЕЛЬ']


### **Запись в файл**

In [None]:
# Запись в файл

new_text = open("new_text.txt", mode='w', encoding='utf8') # Режим доступа 'w' - Открывает файл только для записи.
                                          # Перезаписывает файл, если файл существует.
                                          # Если файл не существует, создает новый файл для записи.
new_text.write('New_line_1') # Записывает переданную строку в файл
new_text.write('New_line_2') # Записывает переданную строку в файл
new_text.write('New_line_3') # Записывает переданную строку в файл

In [None]:
new_text.writelines(word_list) # Записывает список строк в файл

new_text.close()

In [None]:
new_text = open("new_text.txt", mode='a') # Режим доступа 'a' - Открывает файл для ДОЗАПИСИ.
                                          # Указатель файла находится в конце файла, если файл существует.
                                          # То есть файл находится в режиме добавления.
                                          # Если файл не существует, он создает новый файл для записи.
new_text.write('New_line_MOD_"a"')
new_text.close()

### **Смешанные режимы для чтения и записи файла одновременно**



In [None]:
# Смешанные режимы для чтения и записи файла одновременно

# Режим доступа 'r+'
new_text = open("new_text.txt", mode='r+') # 'r+' - Открывает файл для чтения и записи.
                                           # Указатель файла помещается в начало файла.
new_text.write('WRITE_MOD_"r+"')
new_text.close()

In [None]:
# Режим доступа 'w+'
new_text = open("new_text.txt", mode='w+') # 'w+' - Открывает файл для чтения и записи.
                                           # Перезаписывает существующий файл, если файл существует.
                                           # Если файл не существует, создается новый файл для чтения и записи.
                                           # -> Стирает всю информацию из файла в случае записи
new_text.write('WRITE_MOD_"w+"')
new_text.close()

In [None]:
# Режим доступа 'a+'
new_text = open("new_text.txt", mode='a+') # 'a+' - Открывает файл для добавления и чтения.
                                           # Указатель файла находится в конце файла, если файл существует.
                                           # Файл открывается в режиме добавления.
                                           # Если файл не существует, он создает новый файл для чтения и записи.
new_text.write('WRITE_MOD_"a+"')
new_text.close()

## **1. Краткая теория**

Работа с файлами является фундаментальной частью программирования на Python. Возможность читать данные из файлов и записывать данные в файлы позволяет создавать приложения, которые взаимодействуют с внешними источниками данных, сохраняют результаты работы, обрабатывают текстовые данные и многое другое.

В данном разделе мы рассмотрим:

- Как открывать файлы с помощью функции `open()`.
- Режимы открытия файлов и их особенности.
- Чтение данных из файлов.
- Запись данных в файлы.
- Использование контекстного менеджера `with` для безопасной работы с файлами.
- Обработка ошибок при работе с файлами.
- Работа с путями файлов и модулем `os`.
- Особенности работы с кодировками и бинарными файлами.

## **2. Функция `open()` и режимы открытия файлов**

### **2.1. Синтаксис функции `open()`**

Функция `open()` используется для открытия файлов в Python и имеет следующий синтаксис:

In [None]:
open(file, mode='a+', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

Основные параметры:

- `file`: путь к файлу (строка).
- `mode`: режим открытия файла (по умолчанию `'r'`).

### **2.2. Основные режимы открытия файлов**

Режимы открытия файлов определяют операции, которые вы можете выполнять с файлом:

- `'r'`: чтение (файл должен существовать).
- `'w'`: запись (создаёт новый файл или перезаписывает существующий).
- `'a'`: добавление (запись в конец файла).
- `'r+'`: чтение и запись (файл должен существовать).
- `'w+'`: чтение и запись (создаёт новый файл или перезаписывает существующий).
- `'a+'`: чтение и добавление (файл создаётся, если не существует).

Для работы с бинарными файлами используются аналогичные режимы с добавлением `'b'`, например, `'rb'`, `'wb'`.

## **3. Чтение из файла**

### **3.1. Открытие файла для чтения**

Пример открытия и чтения содержимого файла:

In [None]:
# Открываем файл в режиме чтения
with open('example.txt', 'r', encoding='utf-8') as file:
    content = file.read()
    print(content)

Я к вам пишу — чего же боле?
Что я могу еще сказать?
Теперь, я знаю, в вашей воле
Меня презреньем наказать.
Но вы, к моей несчастной доле
Хоть каплю жалости храня,
Вы не оставите меня.
Сначала я молчать хотела;
Поверьте: моего стыда
Вы не узнали б никогда,
Когда б надежду я имела
Хоть редко, хоть в неделю раз
В деревне нашей видеть вас,
Чтоб только слышать ваши речи,
Вам слово молвить, и потом
Все думать, думать об одном
И день и ночь до новой встречи.
Но, говорят, вы нелюдим;
В глуши, в деревне всё вам скучно,
А мы… ничем мы не блестим,
Хоть вам и рады простодушно.
Зачем вы посетили нас?
В глуши забытого селенья
Я никогда не знала б вас,
Не знала б горького мученья.
Души неопытной волненья
Смирив со временем (как знать?),
По сердцу я нашла бы друга,
Была бы верная супруга
И добродетельная мать.
Другой!.. Нет, никому на свете
Не отдала бы сердца я!
То в вышнем суждено совете…
То воля неба: я твоя;
Вся жизнь моя была залогом
Свиданья верного с тобой;
Я знаю, ты мне послан богом,
До гроб

### **3.2. Методы чтения из файла**

- `read(size=-1)`: чтение всего файла или указанного количества символов.
- `readline()`: чтение одной строки.
- `readlines()`: чтение всех строк в список.

Пример использования:

In [None]:
with open('example.txt', 'r', encoding='utf-8') as file:
    # Читаем первую строку
    line = file.readline()
    print(line)

    # Читаем все строки
    lines = file.readlines()
    for line in lines:
        print(line.strip())

Я к вам пишу — чего же боле?

Что я могу еще сказать?
Теперь, я знаю, в вашей воле
Меня презреньем наказать.
Но вы, к моей несчастной доле
Хоть каплю жалости храня,
Вы не оставите меня.
Сначала я молчать хотела;
Поверьте: моего стыда
Вы не узнали б никогда,
Когда б надежду я имела
Хоть редко, хоть в неделю раз
В деревне нашей видеть вас,
Чтоб только слышать ваши речи,
Вам слово молвить, и потом
Все думать, думать об одном
И день и ночь до новой встречи.
Но, говорят, вы нелюдим;
В глуши, в деревне всё вам скучно,
А мы… ничем мы не блестим,
Хоть вам и рады простодушно.
Зачем вы посетили нас?
В глуши забытого селенья
Я никогда не знала б вас,
Не знала б горького мученья.
Души неопытной волненья
Смирив со временем (как знать?),
По сердцу я нашла бы друга,
Была бы верная супруга
И добродетельная мать.
Другой!.. Нет, никому на свете
Не отдала бы сердца я!
То в вышнем суждено совете…
То воля неба: я твоя;
Вся жизнь моя была залогом
Свиданья верного с тобой;
Я знаю, ты мне послан богом,
До гро

## **4. Запись в файл**

### **4.1. Открытие файла для записи**

Запись данных в новый файл или перезапись существующего:

In [None]:
# Открываем файл в режиме записи
with open('new_file.txt', 'w', encoding='utf-8') as file:
    file.write('Первая строка\n')
    file.write('Вторая строка\n')

### **4.2. Добавление данных в файл**

Добавление данных в конец существующего файла:

In [None]:
# Открываем файл в режиме добавления
with open('new_file.txt', 'a', encoding='utf-8') as file:
    file.write('Добавленная строка\n')

## **5. Режимы чтения и записи**

- **`'r+'`**: чтение и запись без удаления существующего содержимого. Указатель находится в начале файла.
- **`'w+'`**: чтение и запись с предварительным удалением содержимого файла.
- **`'a+'`**: чтение и добавление. Указатель находится в конце файла.

Пример использования режима `'r+'`:

In [None]:
with open('example.txt', 'r+', encoding='utf-8') as file:
    content = file.read()
    file.seek(0)
    file.write('Новая строка\n' + content)

## **6. Контекстный менеджер `with`**

Использование `with` гарантирует, что файл будет закрыт корректно после завершения работы с ним, даже если возникнет ошибка.

In [None]:
with open('example.txt', 'r', encoding='utf-8') as file:
    # Работа с файлом
    pass
# Файл автоматически закрывается здесь

## **7. Обработка исключений при работе с файлами**

Важно обрабатывать возможные ошибки, такие как отсутствие файла или ошибки ввода-вывода:

In [None]:
try:
    with open('nonexistent_file.txt', 'r', encoding='utf-8') as file:
        content = file.read()
except FileNotFoundError:
    print("Файл не найден.")
except IOError:
    print("Ошибка ввода-вывода.")

Файл не найден.


## **8. Работа с путями файлов и модулем `os`**

### **8.1. Модуль `os`**

Модуль `os` предоставляет функции для работы с операционной системой:

In [None]:
import os

# Текущая рабочая директория
current_dir = os.getcwd()
print("Текущая директория:", current_dir)

# Смена рабочей директории
os.chdir('/path/to/directory')

### **8.2. Модуль `os.path`**

Работа с путями файлов:

In [None]:
import os

# Объединение путей
file_path = os.path.join(current_dir, 'data', 'example.txt')

# Проверка существования файла
if os.path.exists(file_path):
    print("Файл существует.")
else:
    print("Файл не найден.")

Файл не найден.


## **9. Работа с кодировками**

При работе с текстовыми файлами важно учитывать кодировку, чтобы избежать проблем с отображением символов:

In [None]:
with open('example.txt', 'r', encoding='utf-8') as file:
    content = file.read()

## **10. Чтение и запись бинарных файлов**

Для работы с бинарными файлами используются режимы `'rb'`, `'wb'`, `'ab'`:

In [None]:
# Чтение бинарного файла
with open('image.jpg', 'rb') as file:
    data = file.read()

**Бинарные файлы** — это файлы, содержащие данные в формате, который не предназначен для прямого чтения человеком. В отличие от текстовых файлов, где данные хранятся в виде читаемых символов и строк, бинарные файлы могут содержать любую информацию: изображения, видео, аудио, исполняемые программы, данные в структурированном формате и многое другое.
**Бинарные файлы** хранят данные в двоичной форме, то есть в виде последовательности байтов. Это позволяет хранить данные более компактно и эффективно работать с ними при помощи программ.

## **11. Дополнительные методы работы с файлами**

- **`file.tell()`**: возвращает текущую позицию указателя в файле.
- **`file.seek(offset, whence)`**: перемещает указатель в файле.

Пример:

In [None]:
with open('example.txt', 'r', encoding='utf-8') as file:
    file.seek(10)  # Перемещаемся на 10 байт от начала файла
    print(file.read())

 строка
Я к вам пишу — чего же боле?
Что я могу еще сказать?
Теперь, я знаю, в вашей воле
Меня презреньем наказать.
Но вы, к моей несчастной доле
Хоть каплю жалости храня,
Вы не оставите меня.
Сначала я молчать хотела;
Поверьте: моего стыда
Вы не узнали б никогда,
Когда б надежду я имела
Хоть редко, хоть в неделю раз
В деревне нашей видеть вас,
Чтоб только слышать ваши речи,
Вам слово молвить, и потом
Все думать, думать об одном
И день и ночь до новой встречи.
Но, говорят, вы нелюдим;
В глуши, в деревне всё вам скучно,
А мы… ничем мы не блестим,
Хоть вам и рады простодушно.
Зачем вы посетили нас?
В глуши забытого селенья
Я никогда не знала б вас,
Не знала б горького мученья.
Души неопытной волненья
Смирив со временем (как знать?),
По сердцу я нашла бы друга,
Была бы верная супруга
И добродетельная мать.
Другой!.. Нет, никому на свете
Не отдала бы сердца я!
То в вышнем суждено совете…
То воля неба: я твоя;
Вся жизнь моя была залогом
Свиданья верного с тобой;
Я знаю, ты мне послан богом,

## **12. Практический пример: подсчет слов в файле**

Программа для подсчета количества слов в файле:

In [None]:
def count_words_in_file(filename):
    try:
        with open(filename, 'r', encoding='utf-8') as file:
            content = file.read()
        words = content.split()
        print(f"Количество слов в файле '{filename}': {len(words)}")
    except FileNotFoundError:
        print(f"Файл '{filename}' не найден.")

count_words_in_file('example.txt')

Количество слов в файле 'example.txt': 377


## **13. Заключение**

Работа с файлами в Python является неотъемлемой частью многих приложений. Умение открывать, читать, записывать и управлять файлами позволяет создавать мощные и гибкие программы. Используя различные режимы открытия файлов, методы чтения и записи, а также учитывая кодировки и возможные ошибки, вы сможете эффективно работать с файловой системой в Python.

## **14. Дополнительные советы**

- Всегда закрывайте файлы или используйте `with` для автоматического закрытия.
- Обрабатывайте возможные исключения, чтобы ваша программа была устойчивой к ошибкам.
- Пользуйтесь модулями `os` и `os.path` для работы с файловой системой независимо от операционной системы.
- Помните о безопасности данных: режим `'w'` перезаписывает файл, будьте осторожны при его использовании.