# ООП

> Когда мы говорим о классе, мы имеем в виду то, какими свойствами и поведением будет обладать объект (например, ходить на двух ногах, говорить).

> А объект — это экземпляр с собственным состоянием этих свойств (то, что будет отличать одного человека от другого), любой предмет, существо, явление. Иными словами, это всё, что называется именем существительным, о чём можно сказать «это что-то» или «это кто-то».

В этом модуле мы узнаем, как использовать ООП в Python. Мы обсудим:

* что такое **объект** и **класс**, как их определять и из каких элементов они состоят;
* несколько практических примеров, где ООП помогает эффективнее решать задачу;
* как организовать хранение классов во многих файлах.

Объекты класса обладают *свойствами* и *поведением* (методами).

## Принципы ООП

* **НАСЛЕДОВАНИЕ**  
Этот принцип базируется на том, что новый класс описывается на основе уже существующего (родительского), то есть не только перенимает все свойства родительского класса, но ещё и получает новые.

	
* **АБСТРАКЦИЯ**  
Абстракция означает выделение главных, наиболее значимых характеристик предмета и, наоборот, отбрасывание второстепенных, незначительных. 

* **ИНКАПСУЛЯЦИЯ**  
Это свойство системы, позволяющее объединить данные и методы, работающие с ними, в классе и скрыть детали реализации от пользователя. Инкапсуляция также означает ограничение доступа к данным и возможностям их изменения.

* **ПОЛИМОРФИЗМ**  
Это свойство системы, позволяющее иметь множество реализаций одного интерфейса. 

## Объекты и классы

### Объекты

Некоторые данные и действия над ними могут объединяться вместе в единый объект. В Python всё по сути является объектом. Объект числа хранит своё значение — данные, мы можем вызвать его методы, совершать действия. 

In [1]:
number = 2.5
# Вызовем метод is_integer. Он скажет нам, является ли number целым числом  
number.is_integer()
# => False  

False

In [3]:
# Давайте попробуем представить number как обыкновенную дробь  
number.as_integer_ratio()
# => (5, 2)  
# Действительно 2.5 = 5/2 

(5, 2)

Посмотрим на **список**: он хранит данные своих элементов, мы можем совершать над ними действия встроенными методами.

In [5]:
people = ["Vasiliy", "Stanislav", "Alexandra", "Vasiliy"]  
# Посчитаем число Василиев с помощью метода count 
print(people.count("Vasiliy"))  
# => 2  

# Теперь отсортируем 
people.sort()
print(people)
# => ['Alexandra', 'Stanislav', 'Vasiliy', 'Vasiliy'] 

2
['Alexandra', 'Stanislav', 'Vasiliy', 'Vasiliy']


### Классы

У всех встроенных объектов есть свой класс. В примере для числа 2.5 мы видим класс действительных чисел (`float`), для списка — класс списка (`list`). Класс — это некая заготовка или чертёж, которая описывает общую структуру, свойства и действия для объектов.  

In [6]:
number  = 2.5
print(number.__class__)

<class 'float'>


In [7]:
people = ["Vasiliy", "Stanislav", "Alexandra", "Vasiliy"]  
print(people.__class__) 

<class 'list'>


Определим пустой класс: он не делает ничего, но позволит нам посмотреть на синтаксис.

In [8]:
# Используем ключевое слово class, за которым идёт название класса, 
# в примере это SalesReport  
class SalesReport():
    pass

# Сравните это с определением пустой функции  
# Команда pass не делает ничего; на её месте могли быть другие инструкции  
# Мы используем её только потому, что синтаксически python требует, чтобы там было хоть что-то  
def build_report():
    pass

# И давайте определим ещё один класс  
# Для имён классов традиционно используются имена в формате CamelCase, где начала слов отмечаются большими буквами  
# Это позволяет легко отличать их от функций, которые пишутся в формате snake_case  

class SkillfactoryStudent():
    pass

### Объекты из классов

Мы написали свой первый класс — давайте создадим по нему объект. Вызываем класс и получаем новый объект аналогично тому, как вызывается функция. Получаем результат.

In [9]:
class SalesReport():
    pass

# создаем объект по классу
report = SalesReport()

# можно создать множество объектов по одному классу
report_2 = SalesReport()

# это будут разные объекты
print(report == report_2)

False


Созданный таким образом объект часто называют экземпляром класса (instance). Такое название вы будете часто встречать в статьях и книгах.

## Атрибуты и методы

Мы создали объект по пустому классу. Давайте добавим ему данные. Сделаем класс для отчётов по продажам SalesReport. Пусть у нас в компании есть менеджеры по продажам, которые заключают сделки, и мы хотим посчитать для них метрики общего объёма продаж.

In [10]:
# создаем пустой класс
class SalesReport():
    pass

# создаем первый отчет по продажам
report = SalesReport()

# Мы добавим новый атрибут объекту.  
# Для этого через точку напишем имя атрибута и дальше как с обычной переменной 
report.amount = 10

# то же самое делаем для второго отчета
report_2 = SalesReport()
report_2.amount = 20

# Создадим вспомогательную функцию, она будет печатать общую сумму из отчёта  
def print_report(report):
    print('Total amount:', report.amount)
    
print_report(report)
print_report(report_2)

Total amount: 10
Total amount: 20


Функция print_report делает операцию над отчётом. Так как классы увязывают данные и действия над ними, положим print_report внутрь класса.

In [11]:
class SalesReport():
    # Наш новый метод внутри класса.  
    # Мы определяем его похожим образом с обычными функциями,  
    #   но только помещаем внутрь класса и первым аргументом передаём self
    def print_report(self):
        print('Total amount:', self.amount)
        
# Дальше мы применяем report так же, как и в примере выше
report = SalesReport()
report.amount = 10

report_2 = SalesReport()
report_2.amount = 20

# используем новые методы
report.print_report()
report_2.print_report()

Total amount: 10
Total amount: 20


> Методы в целом похожи на обычные функции, но их ключевое отличие — доступ к самому объекту. 

Давайте для примера определим ещё пару методов:

In [15]:
class SalesReport():
    # позволим добавлять много разных сделок
    def add_deal(self, amount):
        # на первой сделке создадим список для храненния всех сделок
        if not hasattr(self, 'deals'):
            self.deals = []
        # добавим текущую сделку
        self.deals.append(amount)
        
    # посчитаем сумму всех сделок
    def total_amount(self):
        return sum(self.deals)
    
    def print_report(self):
        print('Total sales:', self.total_amount())
        
report = SalesReport()
report.add_deal(10_000)
report.add_deal(30_000)
report.print_report()

Total sales: 40000


### Метод `_INIT_`

> Если мы вызовем `total_amount` до `add_deal`, то список сделок ещё не будет создан, и мы получим ошибку. Также проверка на наличие списка в методе `add_deal` не кажется оптимальным решением, потому что создать список нужно один раз, а проверять его наличие мы вынуждены на каждой сделке.

In [29]:
report = SalesReport()  
report.total_amount()  
# => AttributeError

AttributeError: 'SalesReport' object has no attribute 'deals'

Обе проблемы решились бы, если задавать атрибутам исходное значение. Для этого у классов есть метод инициализации `__init__`. Если мы определим метод с таким именем, код в нём вызовется при создании объекта.

In [30]:
class SalesReport():
    def __init__(self):
        self.deals = []
    
    def add_deal(self, amount):
        self.deals.append(amount)
    
    def total_amount(self):
        return sum(self.deals)
    
    def print_report(self):
        print('Total sales:', self.total_amount())
        
report = SalesReport()
print(report.deals)
report.total_amount()
    

[]


0

`__init__` — это технический метод, поэтому его имя начинается и заканчивается двумя подчёркиваниями. Он получает первым аргументом сам объект, в нём могут выполняться любые операции. Оставшиеся аргументы он получает из вызова при создании: если мы напишем `report = SalesReport("Info", 20)`, то вторым и третьим аргументом в `__init__` передадутся "Info" и 20.

In [31]:
class SalesReport():
    def __init__(self, manager_name):
        self.deals = []
        self.manager_name = manager_name
    
    def add_deal(self, amount):
        self.deals.append(amount)
        
    def total_amount(self):
        return sum(self.deals)
    
    def print_report(self):
        print('Manager:', self.manager_name)
        print('Total sales:', self.total_amount())
        
        
report = SalesReport('Ivan Taranov')
report.add_deal(10_000)
report.add_deal(30_000)
report.print_report()

Manager: Ivan Taranov
Total sales: 40000


In [37]:
class DepartmentReport():

    def __init__(self, company):
        """
        Метод инициализации класса. 
        Создаёт атрибуты revenues и company
        """
        self.revenues = []
        self.company = company
    
    def add_revenue(self, amount):
        """
        Метод для добавления выручки отдела в список revenues.
        Если атрибута revenues ещё не существует, метод должен создавать пустой список перед добавлением выручки.
        """
        self.revenues.append(amount)
    
    def average_revenue(self):
        from numpy import mean
        """
        Вычисляет average_revenue — среднюю выручку по отделам — округляя до целого.
        Метод возвращает строку в формате:
        'Average department revenue for <company>: <average_revenue>'
        """
        average = round(mean(self.revenues))
        return f'Average department revenue for {self.company}: {average}'

In [38]:
report = DepartmentReport("Danon")
report.add_revenue(1_000_000)
report.add_revenue(400_000)

print(report.average_revenue())

Average department revenue for Danon: 700000


In [40]:
# определяем класс для пользователей
class User():
    # базовые данные
    def __init__(self, email, password, balance):
        self.email = email
        self.password = password
        self.balance = balance
    
    # функция принимает мэйл и пароль, они должны совпадать с аттрибутами    
    def login(self, email, password):
        return email == self.email and password == self.password
    
    # функция изменяющая баланс на счету
    def update_balance(self, amount):
        self.balance += amount

In [44]:
user = User("gosha@roskino.org", "qwerty", 20_000)
user.login("gosha@roskino.org", "qwerty123")
# => False
user.login("gosha@roskino.org", "qwerty")
# # => True
user.update_balance(200)
user.update_balance(-500)
print(user.balance)
# # => 19700

19700


### Комбинация операций

Классы могут пригодиться, если вы регулярно делаете над данными одну и ту же последовательность разноплановых функций. Вы можете упаковать их в класс и в дальнейшем сразу получать результат по загруженным данным.

In [52]:
import statistics

class DataFrame():
    def __init__(self, column, fill_value=0):
        # инициализируем аттрибуты
        self.column = column
        self.fill_value = fill_value
        # заполним пропуски
        self.fill_missed()
        # конвертируем все элементы в числа
        self.to_float()
        
    def fill_missed(self):
        for i, value in enumerate(self.column):
            if value is None or value == '':
                self.column[i] = self.fill_value
                
    def to_float(self):  
        self.column = [float(value) for value in self.column]  
        
    def median(self):
        return statistics.median(self.column)
    
    def mean(self):
        return statistics.mean(self.column)
    
    def deviation(self):
        return round(statistics.stdev(self.column), 2)

In [54]:
df = DataFrame(["1", 17, 4, None, 8])

print(df.column)
print(df.deviation())
print(df.median())

[1.0, 17.0, 4.0, 0.0, 8.0]
6.89
4.0


#### Задание 5.2

In [55]:
# определяем класс
class IntDataFrame():
    # инициализируем аттрибуты
    def __init__(self, column):
        self.column = column
        self.to_int()
    
    # метод, приводящий все числа к целым    
    def to_int(self):
        self.column = [int(value) for value in self.column]
        
    # метод, считающий количество ненулевых элементов
    def count(self):
        count = 0
        for i in self.column:
            if i != 0:
                count += 1
        return count
    
    # метод, считающий количество уникальных элементов
    def unique(self):
        return len(set(self.column))

In [61]:
df = IntDataFrame([4.7, 4, 3, 0, 2.4, 0.3, 4])
print(df.column)
print(df.count())
print(df.unique())

[4, 4, 3, 0, 2, 0, 4]
5
4


### Класс-обертка

> Классы можно использовать тогда, когда у вас есть процесс, который требует сложной конфигурации, повторяющейся из раза в раз. Можно написать класс-обёртку, который сведёт этот процесс к одному-двум методам.

In [62]:
import pickle
from datetime import datetime
from os import path

class Dumper():
    def __init__(self, archive_dir='archive/'):
        self.archive_dir = archive_dir
        
    def dump(self, data):
        # Библиотека pickle позволяет доставать и класть объекты в файл
        with open(self.get_file_name(), 'wb') as file:
            pickle.dump(data, file)
            
    def load_for_day(self, day):
        file_name = path.join(self.archive_dir, day + '.pkl')
        with open(file_name, 'rb') as file:
            sets = pickle.load(file)
        return sets
    
    # возвращает корректное имя для файла
    def get_file_name(self):
        today = datetime.now().strftime("%y-%m-%d")
        return path.join(self.archive_dir, today + '.pkl')
    
    
# пример использования
data = {
    'perfomance': [10, 20, 10],  
    'clients': {"Romashka": 10, "Vector": 34}  
}

dumper = Dumper()

# сохраним данные
dumper.dump(data)

In [64]:
# восстановим для сегодняшней даты
file_name = datetime.now().strftime('%y-%m-%d')
restored_data = dumper.load_for_day(file_name)
print(restored_data)

{'perfomance': [10, 20, 10], 'clients': {'Romashka': 10, 'Vector': 34}}


> Сохранение и восстановление работает в пару строк. В результате мы можем приводить достаточно сложные операции к простому виду.

#### Задание 5.3

In [65]:
# создаем класс сборщика технических сообщений
class OwnLogger():
    # инициализируем аттрибуты
    def __init__(self):
        self.logs = {
            'info': None,
            'warning': None,
            'error': None,
            'all': None,
        }
    
    def log(self, message, level):
        self.logs[level] = message
        self.logs['all'] = message
        
    def show_last(self, level='all'):
        return self.logs[level]

In [69]:
logger = OwnLogger()
logger.log("System started", "info")
print(logger.show_last("error"))

logger.log("Connection instable", "warning")
logger.log("Connection lost", "error")

print(logger.show_last())

print(logger.show_last("info"))

None
Connection lost
System started


### Импорт и организация кода

> Классы, как и библиотечные функции, можно **импортировать** в другие программы. Для этого нужно положить класс в отдельный файл в корне проекта и использовать ключевое слово **import**.

## 7. Применение ООП для работы с файлами

### Путь к файлу

> Путь (от англ. path) — набор символов, показывающий расположение файла или каталога в файловой системе.

Чтобы поработать с путями, есть модуль `os`. Функция `os.chdir()` позволяет нам изменить директорию, которую мы в данный момент используем. Если вам нужно знать, какой путь вы в данный момент используете, для этого нужно вызвать `os.getcwd()`.

In [77]:
import os

In [78]:
# получить текущий путь
start_path = os.getcwd()
print(start_path)

d:\documents\1_projects\DATA SCIENCE\IDE\practice\Python-15 OOP


In [79]:
# пробуем подняться на директорию выше
os.chdir('..') # подняться на один уровень выше
os.getcwd()

'd:\\documents\\1_projects\\DATA SCIENCE\\IDE\\practice'

In [80]:
# возвращаемся в ту директорию, от которой стартовали
os.chdir(start_path)
os.getcwd()

'd:\\documents\\1_projects\\DATA SCIENCE\\IDE\\practice\\Python-15 OOP'

In [81]:
# получим список папок и директорий в папке
print(os.listdir())

['archive', 'intro.ipynb']


In [82]:
if 'tmp.py' not in os.listdir():
    print('File not in this directory')

File not in this directory


Для того чтобы склеивать пути с учётом особенностей ОС, следует использовать функцию `os.path.join()`.

In [83]:
# соединяем пути с учетом операционной системы
print(start_path)
print(os.path.join(start_path, 'test'))

d:\documents\1_projects\DATA SCIENCE\IDE\practice\Python-15 OOP
d:\documents\1_projects\DATA SCIENCE\IDE\practice\Python-15 OOP\test


In [100]:
import os
def path_info(path=None):
    start_path = path if path is not None else os.getcwd()
    
    for root, dirs, files in os.walk(start_path):
        print('Current dir:', root)
        print('---')

        if dirs:
            print('Dirs list:', dirs)
        else:
            print('No dirs')
        print('---')
        
        if files:
            print('Files list:', files)
        else:
            print('No files')
        print('---')
        
        if files and dirs:
            print('All paths:')
        for f in files:
            print('File', os.path.join(root, f))
        for d in dirs:
            print('Dir', os.path.join(root, d))
        print('===')

### Работа с файлами

Python «из коробки» располагает достаточно широким набором инструментов для работы с файлами. Для того чтобы начать работать с файлом, надо его открыть с помощью команды специальной функции `open`.

`path/to/file` — путь к файлу может быть относительным или абсолютным. Можно указывать в *Unix-стиле* (`path/to/file`) или в *Windows-стиле* (`path\to\file`).

`filemode` — режим, в котором файл нужно открывать.

Записывается в виде строки, может принимать следующие значения:
* `r` — открыть на чтение (по умолчанию);
* `w` — перезаписать и открыть на запись (если файла нет, то он создастся);
* `x` — создать и открыть на запись (если уже есть — исключение);
* `a` — открыть на дозапись (указатель будет поставлен в конец);
* `t` — открыть в текстовом виде (по умолчанию);
* `b` — открыть в бинарном виде.

`encoding` — указание, в какой кодировке файл записан (`utf8`, `cp1251` и т. д.) По умолчанию стоит `utf-8`. При этом можно записывать кодировку как через дефис, так и без: `utf-8` или `utf8`.

> Открытие файла на запись является блокирующей операцией, то есть она останавливает работу нашей программы до того, пока файл не откроется.

In [103]:
f = open('test.txt', 'w', encoding='utf8')
# запишем в файл строку
f.write("This is a test string\n")
f.write("This is a new string\n")
# закрываем файл
f.close()

In [106]:
# открываем файл для чтения
f = open('test.txt', 'r', encoding='utf8')
# читаем 10 символов от начала
print(f.read(10))
# читаем остаток файла
print(f.read())
f.close()

This is a 
test string
This is a new string



### Чтение и запись построчно

Зачастую с файлами удобнее работать построчно, поэтому для этого есть отдельные методы:

* `writelines` — записывает список строк в файл;
* `readline` — считывает из файла одну строку и возвращает её;
* `readlines` — считывает из файла все строки в список и возвращает их.

In [107]:
# открываем файл на дозапись
f = open('test.txt', 'a', encoding='utf8')
sequence = ["other string\n", "123\n", "test test\n"]

f.writelines(sequence) # берет строки из sequence и записывает в файл без переносов
f.close()

In [108]:
# построчно считываем файл
f = open('test.txt', 'r', encoding='utf8')
print(f.readlines())
f.close()

['This is a test string\n', 'This is a new string\n', 'other string\n', '123\n', 'test test\n']


>Метод `f.readline()` возвращает строку (символы от текущей позиции до символа переноса строки):

In [110]:
f = open('test.txt', 'r', encoding='utf8')
print(f.readline())
print(f.read(4))
print(f.readline())

f.close()

This is a test string

This
 is a new string



### Файл как итератор

> Объект файл является итератором, поэтому его можно использовать в цикле for.

Не стоит считывать файл полностью — в большинстве задач с обработкой текста весь файл разом читать не требуется. В таком случае с файлом работают построчно.

In [112]:
f = open('test.txt') # можно перечислять строки в файле
for line in f:
    print(line, end='')
    
f.close()

This is a test string
This is a new string
other string
123
test test


### Менеджер контекста with

In [114]:
with open('test.txt', 'rb') as f:
    a = f.read(10)
    b = f.read(23)
    
# f.read(3)

b'This is a '


> Тело менеджера контекста определяется одним отступом вправо относительно отступов ключевого слова `with`. Менеджер контекста неявно вызывает закрытие файла после работы, что освобождает вас от забот о том, закрыли ли вы файл или нет. Закрытие файла происходит при любом стечении обстоятельств, даже если внутри `with` будет ошибка. 

In [115]:
with open('input.txt', 'w', encoding='utf8') as f:
    f.write('Some info\n')
    f.write('More info\n')

#### Задание 7.4

In [116]:
# открываем файл, из которого берем данные
with open('input.txt', 'r', encoding='utf8') as f:
    # открываем файл, в который записываем данные
    with open('output.txt', 'a', encoding='utf8') as out:
        # для каждой строки из исходных данных
        for line in f:
            # добавляем строку в выходной файл
            out.write(line)

#### Задание 7.5

In [118]:
# создаем файл, содержащий действительные числа
with open('numbers.txt', 'w') as num:
    num.write('1\n')
    num.write('4\n')
    num.write('5\n')
    num.write('7\n')
    


In [130]:
# нужно найти сумму наибольшего и наименьшего значений
# открываем файл на чтение
with open('numbers.txt', 'r') as num:
    nums = []
    for line in num:
        nums.append(float(line.rstrip()))
        nums.sort()
        result = nums[0] + nums[-1]
    with open('output.txt', 'w') as out:
        out.write(str(result))

### Исключения

> Исключения — это такие ошибки, которые возникают не во время компиляции программы, а в процессе её исполнения, в случаях, если что-то идёт не так.

Ошибки бывают двух видов:

* отлавливаемые — все, что наследуются от класса Exception;
* не отлавливаемые — `SystemExit`, `KeyboardInterrupt` и т. д.

конструкция `try-except`

In [132]:
try:  # Добавляем конструкцию try-except для отлова нашей ошибки
    print("Перед исключением")
    # теперь пользователь сам вводит числа для деления
    a = int(input("a: "))
    b = int(input("b: "))
    c = a / b  # здесь может возникнуть исключение деления на ноль
    print(c)  # печатаем c = a / b если всё хорошо
except ZeroDivisionError as e: # Добавляем тип именно той ошибки, которую хотим отловить.     
    print(e)  # Выводим информацию об ошибке
    print("После исключения")
 
print("После После исключения")

Перед исключением
division by zero
После исключения
После После исключения


In [133]:
try:
    print("Перед исключением")
    a = int(input("a: "))
    b = int(input("b: "))
    c = a / b
    print(c)  # печатаем c = a / b если всё хорошо
except ZeroDivisionError as e:
    print("После исключения")
else:  # код в блоке else выполняется только в том случае, если код в блоке try выполнился успешно (т.е. не вылетело никакого исключения).
    print("Всё ништяк")
finally:  # код в блоке finally выполнится в любом случае, при выходе из try-except
    print("Finally на месте")
 
print("После После исключения")

Перед исключением
После исключения
Finally на месте
После После исключения


Конечно, мы можем вызывать ошибки самостоятельно с помощью конструкции `raise`. Используется это, как правило, для отладки кода и остановки программы в критических ситуациях.

In [136]:
age = int(input("Сколько тебе лет?"))

 
if age > 100 or age <= 0:
    raise ValueError("Тебе не может быть столько лет")
 
print(f"Тебе {age} лет!") # Возраст выводится только если пользователь ввёл правильный возраст.

Тебе 5 лет!


#### Задание 8.7

In [144]:
# принимает на вход строку
try:
    a = float(input('Введите число:\t'))
except ValueError as e:
    print('Вы ввели неправильное число')
else:
    print(f'Вы ввели {a}')
finally:
    print('Выход из программы')

Вы ввели 4.0
Выход из программы


#### Задание 9.5

In [156]:
class NonPositiveDigitException(ValueError):
    pass

class Square():
    def __init__(self, side):
        if side <= 0:
            raise NonPositiveDigitException('Неправильно указана сторона квадрата')
        else:
            self.sq = side**2
            self.per = side*4
            

In [158]:
square = Square(20)
print(square.sq)
print(square.per)

400
80
