✍ В этом юните мы с вами поговорим об основных принципах работы с файлами в языке Python — какие встроенные методы используются для открытия, закрытия, чтения, построчного чтения и так далее.

На самом деле файлы, как и всё в Python, являются объектами класса. Причём этот класс встроен в Python. У файлов есть свои атрибуты и методы.

Давайте на примере работы с файлами разберём, как работают классы, реализованные «под капотом» в Python

### Путь к файлу

**Путь** (от англ. **path**) — набор символов, показывающий расположение файла или каталога в файловой системе.

В операционных системах UNIX разделительным знаком при записи пути является «/» (слеш), в Windows — «\» (обратный слеш). Эти знаки служат для разделения названия каталогов, составляющих путь к файлу. Все вы видели, например, такой путь на ОС Windows: C:\Program Files. Это и есть путь до папки Program Files.

Существует два типа пути:

- **абсолютный**;
- **относительный**.
- 
Абсолютный путь всегда считается от «корня», той папки, откуда потом «вырастают» все остальные папки. Для Windows это диск С:, D: и т. д., для Unix это “/”. Абсолютный путь всегда уникальный.

Абсолютный путь — это путь, который указывает на одно и то же место в файловой системе, вне зависимости от текущего рабочего каталога или других обстоятельств. Его ещё называют полным.

<div align="center">
    <img src=img/FPW_C3.4._1.png width="50%" height="50%">
</div>

Относительный путь — это путь по отношению к текущему рабочему каталогу пользователя.

Чтобы поработать с путями, есть модуль **os**. 

Функция **os.chdir()** позволяет нам изменить директорию, которую мы в данный момент используем. Если вам нужно знать, какой путь вы в данный момент используете, для этого нужно вызвать **os.getcwd()**.

In [3]:
import os

# получить текущий путь
start_path = os.getcwd()
print(start_path) 

c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug


In [4]:
#Далее попробуем подняться на директорию выше:

os.chdir("..") # подняться на один уровень выше
print(os.getcwd()) # '/home/nbuser'

c:\Users\washe\Documents\SF_Training_DS


In [5]:
#Теперь вернемся в ту директорию, из которой стартовали. Изначально мы сохраняли её в переменной start_path.
os.chdir(start_path)
os.getcwd() # '/home/nbuser/library'

'c:\\Users\\washe\\Documents\\SF_Training_DS\\Module_15_OOP_Debug'

In [6]:
# С помощью функции os.listdir() можно получить весь список файлов, находящихся в директории. 
# Если не указать никаких аргументов, то будет взята текущая директория.

# список файлов и директорий в папке
print(os.listdir())

if 'tmp.py' not in os.listdir():
    print("Файл отсутствует в данной директории")

['archive', 'data', 'helpers', 'img', 'test.py', 'test.txt', 'Введение.ipynb', 'Объекты и Классы.ipynb', 'Принципы ООП.ipynb', 'Работа с файлами ОС.ipynb']
Файл отсутствует в данной директории


Для того чтобы склеивать пути с учётом особенностей ОС, следует использовать функцию **os.path.join()**. Это связано с тем, что в разных операционных системах могут быть разные разделители каталогов, например в ОС Windows этим разделителем является «\», а в Linux — «/», как мы и говорили в начале юнита. Поэтому, чтобы поиск файла проходил гладко в обеих системах (ведь ваш скрипт могут запускать на любой системе в связи с кросс-платформенностью Python), лучше всё-таки использовать **os.path.join()**.

In [7]:
# соединяет пути с учётом особенностей операционной системы

print(start_path)
print(os.path.join(start_path, 'test'))

# /home/nbuser/library
# /home/nbuser/library/test

c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug
c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\test


In [8]:
# Сделайте функцию, которая принимает от пользователя путь и выводит всю информацию о содержимом этой папки. 
# Для реализации используйте функцию встроенного модуля os.walk(). 
# Если путь не указан, то сравнение начинается с текущей директории.

import os

def walk_desc(path=None):
    start_path = path if path is not None else os.getcwd()

    for root, dirs, files in os.walk(start_path):
        print("Текущая директория", root)
        print("---")

        if dirs:
            print("Список папок", dirs)
        else:
            print("Папок нет")
        print("---")

        if files:
            print("Список файлов", files)
        else:
            print("Файлов нет")
        print("---")

        if files and dirs:
            print("Все пути:")
        for f in files:
            print("Файл ", os.path.join(root, f))
        for d in dirs:
            print("Папка ", os.path.join(root, d))
        print("===")

walk_desc()

Текущая директория c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug
---
Список папок ['archive', 'data', 'helpers', 'img']
---
Список файлов ['test.py', 'test.txt', 'Введение.ipynb', 'Объекты и Классы.ipynb', 'Принципы ООП.ipynb', 'Работа с файлами ОС.ipynb']
---
Все пути:
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\test.py
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\test.txt
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\Введение.ipynb
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\Объекты и Классы.ipynb
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\Принципы ООП.ipynb
Файл  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\Работа с файлами ОС.ipynb
Папка  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\archive
Папка  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\data
Папка  c:\Users\washe\Documents\SF_Training_DS\Module_15_OOP_Debug\helpe

### Работа с файлами

Python «из коробки» располагает достаточно широким набором инструментов для работы с файлами. Для того чтобы начать работать с файлом, надо его открыть с помощью команды специальной функции open.
```python
f = open('path/to/file', 'filemode', encoding='utf8')
```
Результатом этой операции будет файл, в котором указатель текущей позиции поставлен на начало или конец файла.

Перед тем, как мы начнём разбирать аргументы, хотелось бы заранее отметить, что указателем называется скорее метка, которая указывает на определённое место в файле. Указателей в классическом понимании программиста, как, например, в C или C++ в Python нет!

Давайте по порядку разберём все аргументы:

1. **path/to/file** — путь к файлу может быть относительным или абсолютным. Можно указывать в Unix-стиле (path/to/file) или в Windows-стиле (path\to\file).

2. **filemode** — режим, в котором файл нужно открывать.
Записывается в виде строки, может принимать следующие значения:
- **r** — открыть на чтение (по умолчанию);
- **w** — перезаписать и открыть на запись (если файла нет, то он создастся);
- **x** — создать и открыть на запись (если уже есть — исключение);
- **a** — открыть на дозапись (указатель будет поставлен в конец);
- **t** — открыть в текстовом виде (по умолчанию);
- **b** — открыть в бинарном виде.

3. **encoding** — указание, в какой кодировке файл записан (utf8, cp1251 и т. д.) По умолчанию стоит utf-8. При этом можно записывать кодировку как через дефис, так и без: utf-8 или utf8.

Открытие файла на запись является блокирующей операцией, то есть она останавливает работу нашей программы до того, пока файл не откроется.

#### Теперь давайте поговорим про то, как записывать какую-либо информацию в файл.

При открытии файла внутри него ставится указатель текущей позиции для чтения. При открытии в режиме чтения ('r') или записи ('w') указатель ставится на начало, в режиме 'a' (добавление новых записей в конец файла) — в конец.

Откроем файл на запись и с помощью метода write запишем в него строку. В качестве результата метод write возвращает количество записанных символов.

In [9]:
f = open('test.txt', 'w', encoding='utf8')

# Запишем в файл строку
f.write("This is a test string\n")
f.write("This is a new string\n")

21

После вызова команды write ваши данные не сразу попадут и сохранятся в файл. Связано это с особенностями внутренней работы операционных систем. Если для вас критично своевременное попадание информации на жесткий диск компьютера, то после записи вызывайте f.flush() или закрывайте файл. Закрыть файл можно с помощью метода close().

In [10]:
# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()

In [11]:
# Теперь давайте посмотрим, как читать данные из файла.
#Откроем файл для чтения, в который только что записали две строки:
f = open('test.txt', 'r', encoding='utf8')

После того, как файл открыт для чтения, мы можем читать из него данные.

f.read(n) — операция, читающая с текущего места n символов, если файл открыт в t режиме, или n байт, если файл открыт в b режиме, и возвращающая прочитанную информацию.

In [12]:
print(f.read(10)) # This is a 

This is a 


После прочтения указатель на содержимое остается на той позиции, где чтение закончилось. Если n не указать, будет прочитано «от печки», то есть от текущего места указателя и до самого конца файла.

In [13]:
# считали остаток файла
f.read() # test string\nThis is a new string\n

'test string\nThis is a new string\n'

In [14]:
#После работы обязательно закрываем файл:

# обязательно закрываем файл
f.close()

### Чтение и запись построчно

Зачастую с файлами удобнее работать построчно, поэтому для этого есть отдельные методы:

- **writelines** — записывает список строк в файл;
- **readline** — считывает из файла одну строку и возвращает её;
- **readlines** — считывает из файла все строки в список и возвращает их.
-  Метод **f.writelines(sequence)** не будет сам за вас дописывать символ конца строки ('\n'), поэтому при необходимости его нужно прописать вручную.

In [15]:
f = open('test.txt', 'a', encoding='utf8') # открываем файл на дозапись

sequence = ["other string\n", "123\n", "test test\n"]
f.writelines(sequence) # берет строки из sequence и записывает в файл (без переносов)

f.close()

In [16]:
#Попробуем теперь построчно считать файл с помощью readlines:

f = open('test.txt', 'r', encoding='utf8')

print(f.readlines()) # считывает все строки в список и возвращает список

f.close()

['This is a test string\n', 'This is a new string\n', 'other string\n', '123\n', 'test test\n']


Метод **f.readline()** возвращает строку (символы от текущей позиции до символа переноса строки \n, который остаётся в конце строки и опускается только в последней строке файла, если файл не заканчивается новой строкой):

In [17]:
f = open('test.txt', 'r', encoding='utf8')

print(f.readline()) # This is a test string
print(f.read(4)) # This
print(f.readline()) # is a new string

f.close()

This is a test string

This
 is a new string



### Файл как итератор

Объект файл является итератором, поэтому его можно использовать в цикле for.

?Для чего это нужно?

Итераторы представляют собой такой объект, который вычисляет какие-то действия на каждом шаге, а не все сразу. На примере файла это выглядит примерно так. Предположим, у вас есть огромный текстовый файл, который весит несколько гигабайт. Если попытаться разом считать его полностью с помощью f.readlines(), то он будет загружен в вашу программу, в то время как переменная, в которую будет записан файл, станет весить столько же, сколько и объём считанного файла.

В большинстве задач с обработкой текста он весь сразу не нужен, поэтому мы можем, например, считывать его построчно, обрабатывать строку и забывать из нашей программы, чтобы считать новую. Тогда весь файл огромного объема не будет «висеть» в памяти компьютера.

Не стоит считывать файл полностью — в большинстве задач с обработкой текста весь файл разом читать не требуется. В таком случае с файлом работают построчно.

In [18]:
f = open('test.txt')  # можно перечислять строки в файле
for line in f:
    print(line, end='')

# This is a test string
# This is a new string
# other string
# 123
# test test

f.close()

# Цикл for, как мы помним, — это цикл, который перебирает по очереди.

This is a test string
This is a new string
other string
123
test test


### Менеджер контекста with

После работы с файлом его необходимо закрыть с помощью метода close(). Файл освобождается для операционной системы (если он был открыт для записи), и другие приложения могут получать к нему доступ. Если не закрыть файл явно, то информация, записываемая в него, может быть утеряна, или файл может повредиться.

Для явного указания места работы с файлом, а также чтобы не забывать закрывать файл после обработки, существует менеджер контекста with.

In [19]:
# В блоке менеджера контекста открытый файл «жив» и с ним можно работать, при выходе из блока - файл закрывается.
with open("test.txt", 'rb') as f:
    a = f.read(10)
    b = f.read(23)

f.read(3) # Error!

ValueError: read of closed file

Тело менеджера контекста определяется одним отступом вправо относительно отступов ключевого слова with. Менеджер контекста неявно вызывает закрытие файла после работы, что освобождает вас от забот о том, закрыли ли вы файл или нет. Закрытие файла происходит при любом стечении обстоятельств, даже если внутри with будет ошибка. 

В дальнейшем мы научимся писать собственные структуры, работающие похожим образом.

In [None]:
#Задание 7.4
#Создайте любой файл на операционной системе под название input.txt и построчно перепишите его в файл output.txt.

with open('data/input.txt', 'r', encoding='cp1251') as f_in:
    with open('data/output.txt','w', encoding='cp1251') as f_out:
        for str_in in f_in:
            f_out.writelines(str_in)

In [None]:
#Задание 7.5
#Дан файл numbers.txt, компоненты которого являются действительными числами (файл создайте самостоятельно и заполните любыми числам, в одной строке одно число). 
# Найдите сумму наибольшего и наименьшего из значений и запишите результат в файл output.txt.

with open('data/numbers.txt','r',encoding='cp1251') as num_in:
    l_numbers = num_in.readlines()
    l_numbers = list(map(lambda x: int(x),l_numbers))
    
    res_value = min(l_numbers) + max(l_numbers)
    with open('data/output.txt','w',encoding='cp1251') as num_out:
        num_out.write(str(res_value))

#Решение от SkilBox

filename = 'numbers.txt'
output = 'output.txt'

with open(filename) as f:
    min_ = max_ = float(f.readline())  # считали первое число
    for line in f:
        num =  float(line)
        if num > max_:
            max_ = num
        elif num < min_:
            min_ = num

    sum_ = min_ + max_

with open(output, 'w') as f:
    f.write(str(sum_))
    f.write('\n')

In [None]:
# Задание 7.6
#В текстовый файл построчно записаны фамилии и имена учащихся класса и их оценки за контрольную. 
# Подсчитайте количество учащихся, чья оценка меньше 3 баллов. Cодержание файла:

#import os
#os.chdir('C:/Users/washe/Documents/SF_Training_DS/Module_15_OOP_Debug')
res_value = 0

with open('data/res_balls.txt','r',encoding='cp1251') as balls:
    for line in balls:
        cur_data = line
        cur_ball = int(cur_data.replace('\n','')[-1])
        if cur_ball < 3:
            res_value += 1

print(res_value)


#Вариант SkillBox

count = 0
for line in open('data/res_balls.txt','r',encoding='cp1251'):
    points = int(line.split()[-1])
    if points < 3:
        count += 1

4


In [None]:
#Задание 7.7
#Выполните реверсирование строк файла (перестановку строк файла в обратном порядке).

with open("input.txt", "r") as input_file:
    with open("output.txt", "w") as output_file:
        for line in reversed(input_file.readlines()):
            output_file.write(line)