## Применение ООП для работы с файлами

В операционных системах UNIX разделительным знаком при записи пути является «/» (слеш), в Windows — «\» (обратный слеш). например, такой путь на ОС Windows: C:\Program Files.
Существует два типа пути:
* абсолютный;
* относительный.
Абсолютный путь всегда считается от «корня», той папки, откуда потом «вырастают» все остальные папки. 
Для Windows это диск С:, D: и т. д., для Unix это “/”. Абсолютный путь всегда уникальный.

Абсолютный путь — это путь, который указывает на одно и то же место в файловой системе, вне зависимости от текущего рабочего каталога
Его ещё называют полным.
Относительный путь — это путь по отношению к текущему рабочему каталогу пользователя.

Чтобы поработать с путями, есть модуль os. 
Функция os.chdir() позволяет нам изменить директорию, которую мы в данный момент используем. 
Если вам нужно знать, какой путь вы в данный момент используете, для этого нужно вызвать os.getcwd().

In [None]:
# получить текущий путь
start_path = os.getcwd()
print(start_path) 

d:\


In [None]:
os.chdir("..") # подняться на один уровень выше
os.getcwd() 

'd:\\'

In [None]:
# вернемся в ту директорию, из которой стартовали. 
# Изначально мы сохраняли её в переменной start_path.

os.chdir(start_path)
os.chdir("d:\IDE\SF_DST\Python-15")
os.getcwd() 

'd:\\IDE\\SF_DST\\Python-15'

In [None]:
# С помощью функции os.listdir() можно получить весь список файлов, находящихся в директории. Если не указать никаких аргументов, то будет взята текущая директория.

# список файлов и директорий в папке
import os

print(os.listdir()) # ['SnapchatLoader', 'FBLoader', 'tmp.py', '.gitignore', 'venv', '.git']

if 'tmp.py' not in os.listdir():
    print("Файл отсутствует в данной директории")

['archive', 'DST_OOP.ipynb']
Файл отсутствует в данной директории


In [None]:
# вернемся в ту директорию, из которой стартовали. 
# Изначально мы сохраняли её в переменной start_path.

os.chdir(start_path)
os.chdir("d:\IDE\SF_DST\Python-15")
os.getcwd() 

'd:\\IDE\\SF_DST\\Python-15'

Для того чтобы склеивать пути с учётом особенностей ОС, следует использовать функцию os.path.join(). 

In [None]:
# соединяет пути с учётом особенностей операционной системы
print(start_path)
print(os.path.join(start_path, 'test'))


d:\
d:\test


In [None]:
# функция, которая принимает от пользователя путь 
# и выводит всю информацию о содержимом этой папки. 
# Для реализации используйте функцию встроенного модуля os.walk(). 
# Если путь не указан, то сравнение начинается с текущей директории.

import os

def walk_desc(path=None):
    start_path = path if path is not None else os.getcwd()

    for root, dirs, files in os.walk(start_path):
        print("Текущая директория", root)
        print("---")

        if dirs:
            print("Список папок", dirs)
        else:
            print("Папок нет")
        print("---")

        if files:
            print("Список файлов", files)
        else:
            print("Файлов нет")
        print("---")

        if files and dirs:
            print("Все пути:")
        for f in files:
            print("Файл ", os.path.join(root, f))
        for d in dirs:
            print("Папка ", os.path.join(root, d))
        print("===")

walk_desc()

Текущая директория d:\IDE\SF_DST\Python-15
---
Список папок ['archive']
---
Список файлов ['DST_OOP.ipynb']
---
Все пути:
Файл  d:\IDE\SF_DST\Python-15\DST_OOP.ipynb
Папка  d:\IDE\SF_DST\Python-15\archive
===
Текущая директория d:\IDE\SF_DST\Python-15\archive
---
Папок нет
---
Список файлов ['22-12-03.pkl']
---
Файл  d:\IDE\SF_DST\Python-15\archive\22-12-03.pkl
===


## РАБОТА С ФАЙЛАМИ

Для того чтобы начать работать с файлом, надо его открыть с помощью команды специальной функции open.
f = open('path/to/file', 'filemode', encoding='utf8')
Результатом этой операции будет файл, в котором указатель текущей позиции поставлен на начало или конец файла.

Давайте по порядку разберём все аргументы:

* path/to/file — путь к файлу может быть относительным или абсолютным. Можно указывать в Unix-стиле (path/to/file) или в Windows-стиле (path\to\file).
* filemode — режим, в котором файл нужно открывать.

Записывается в виде строки, может принимать следующие значения:
* r — открыть на чтение (по умолчанию);
* w — перезаписать и открыть на запись (если файла нет, то он создастся);
* x — создать и открыть на запись (если уже есть — исключение);
* a — открыть на дозапись (указатель будет поставлен в конец);
* t — открыть в текстовом виде (по умолчанию);
* b — открыть в бинарном виде.


* encoding — указание, в какой кодировке файл записан (utf8, cp1251 и т. д.) По умолчанию стоит utf-8. 
При этом можно записывать кодировку как через дефис, так и без: utf-8 или utf8.

__Открытие файла на запись является блокирующей операцией, то есть она останавливает работу нашей программы до того, пока файл не откроется.__

In [6]:
# Откроем файл на запись и с помощью метода write запишем в него строку. 
# В качестве результата метод write возвращает количество записанных символов.

f = open('test.txt', 'w', encoding='utf8')
print(f.tell())
# Запишем в файл строку
print(f.write("This is a test string\n"))
print(f.tell())
print(f.write("This is a new string\n"))
print(f.tell())

0
22
23
21
45


После вызова команды write ваши данные не сразу попадут и сохранятся в файл. 
Если для вас критично своевременное попадание информации на жесткий диск компьютера, то после записи вызывайте f.flush() или закрывайте файл.
 Закрыть файл можно с помощью метода close().

In [7]:
# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()

In [9]:
# Откроем файл для чтения, в который только что записали две строки:

f = open('test.txt', 'r', encoding='utf8')

f.read(n) — операция, читающая с текущего места n символов, если файл открыт в t режиме, 
или n байт, если файл открыт в b режиме, и возвращающая прочитанную информацию.

In [10]:
print(f.read(10)) # This is a 

This is a 


После прочтения указатель на содержимое остается на той позиции, где чтение закончилось. 
Если n не указать, будет прочитано «от печки», то есть от текущего места указателя и до самого конца файла.

In [11]:
# считали остаток файла
f.read() # test string\nThis is a new string\n

'test string\nThis is a new string\n'

In [12]:
# обязательно закрываем файл
f.close()

Смещение указателя
f.seek(offset, from_what=0)
offset - смещение
from_what:
* 0 - с начала (по умолчанию)
* 1 - с текущего места (только режим b)
* 2 - с конца (только режим b)



## ЧТЕНИЕ И ЗАПИСЬ ПОСТРОЧНО

Зачастую с файлами удобнее работать построчно, поэтому для этого есть отдельные методы:

* writelines — записывает список строк в файл;
* readline — считывает из файла одну строку и возвращает её;
* readlines — считывает из файла все строки в список и возвращает их.

Метод f.writelines(sequence) не будет сам за вас дописывать символ конца строки ('\n'), поэтому при необходимости его нужно прописать вручную.

In [13]:
f = open('test.txt', 'a', encoding='utf8') # открываем файл на дозапись

sequence = ["other string\n", "123\n", "test test\n"]
f.writelines(sequence) # берет строки из sequence и записывает в файл (без переносов)

f.close()

In [14]:
# Попробуем теперь построчно считать файл с помощью readlines:

f = open('test.txt', 'r', encoding='utf8')

print(f.readlines()) # считывает все строки в список и возвращает список

f.close()

['This is a test string\n', 'This is a new string\n', 'other string\n', '123\n', 'test test\n']


In [15]:
# Метод f.readline() возвращает строку (символы от текущей позиции до символа переноса строки):

f = open('test.txt', 'r', encoding='utf8')

print(f.readline()) # This is a test string
print(f.read(4)) # This
print(f.readline()) # is a new string

f.close()

This is a test string

This
 is a new string



## ФАЙЛ КАК ИТЕРАТОР

Объект файл является итератором, поэтому его можно использовать в цикле for.

Не стоит считывать файл полностью — в большинстве задач с обработкой текста весь файл разом читать не требуется. 
В таком случае с файлом работают построчно.

In [16]:
f = open('test.txt')  # можно перечислять строки в файле
for line in f:
    print(line, end='') # чтобы не было два переноса строки

# This is a test string
# This is a new string
# other string
# 123
# test test

f.close()

This is a test string
This is a new string
other string
123
test test


## МЕНЕДЖЕР КОНТЕКСТА WITH

Для явного указания места работы с файлом, а также чтобы не забывать закрывать файл после обработки, существует менеджер контекста with.

In [18]:
# В блоке менеджера контекста открытый файл «жив» и с ним можно работать, при выходе из блока - файл закрывается.
with open("test.txt", 'rb') as f:
    a = f.read(10)
    b = f.read(23)

# f.read(3) # Error!

Тело менеджера контекста определяется __одним__ отступом вправо относительно отступов ключевого слова with. 
Менеджер контекста неявно вызывает закрытие файла после работы, что освобождает вас от забот о том, закрыли ли вы файл или нет. 
Закрытие файла происходит при любом стечении обстоятельств, даже если внутри with будет ошибка. 

In [33]:
# Создайте любой файл на операционной системе под название input.txt 
# и построчно перепишите его в файл output.txt.

with open("test.txt", "r") as input_file:
    with open("output4.txt", "w") as output_file:
        for line in input_file:
            output_file.write(line)

In [35]:
# Дан файл numbers.txt, компоненты которого являются действительными числами
# (файл создайте самостоятельно и заполните любыми числам, 
# в одной строке одно число). 
# Найдите сумму наибольшего и наименьшего из значений 
# и запишите результат в файл output.txt.

filename = 'numbers.txt'
output = 'output.txt'

with open(filename) as f:
    min_ = max_ = float(f.readline())  # считали первое число
    for line in f:
        num =  float(line)
        if num > max_:
            max_ = num
        elif num < min_:
            min_ = num

    sum_ = min_ + max_

with open(output, 'w') as f:
    f.write(str(sum_))
    f.write('\n')

In [37]:
# В текстовый файл построчно записаны фамилии и имена учащихся класса 
# и их оценки за контрольную. 
# Подсчитайте количество учащихся, чья оценка меньше 3 баллов
count = 0
filename = 'input.txt'

with open(filename) as f:
    for line in f:
        points = int(line.split()[-1])
        if points < 3:
            count += 1

UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 1: character maps to <undefined>

In [30]:
# Выполните реверсирование строк файла (перестановку строк файла в обратном порядке).

with open("input.txt", "r") as input_file:
    with open("output2.txt", "w") as output_file:
        for line in reversed(input_file.readlines()):
            output_file.write(line)

UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 1: character maps to <undefined>