# Основы ООП

## 1. Введение в ООП


### 1.1 Что такое объектно-ориентированное программирование


Объектно-ориентированное программирование (ООП) — это подход, в котором программа строится из **объектов**.  

**Объект** = данные (состояние) + функции (поведение), объединённые в единую сущность.  

Каждый объект создаётся по **классу** — шаблону, который определяет, *какие* данные и *какие* функции в нём будут.

> 🔍 **Аналогия:** чертёж автомобиля — это класс, а каждый реальный автомобиль, со своим номером и пробегом, — объект.

### 1.2 Почему ООП важно в контексте машинного обучения  

* **Инкапсуляция состояния модели.** После `fit()` модель хранит выученные параметры внутри объекта, и мы можем вызывать `predict()` без глобальных переменных.  
* **Унифицированный API.** В том же Scikit-learn любая модель поддерживает методы `fit`, `predict`, `score` — благодаря единому базовому классу. Это облегчает эксперименты и автоматизацию.  
* **Композиция.** Пайплайны (`Pipeline`, `ColumnTransformer`) собирают объекты-шаги в единый объект-процедуру обучения.  
* **Расширяемость.** Нам легко добавить собственную модель, переопределив пару методов, вместо переписывания библиотеки.  

### 1.3 Основные принципы ООП 

| Принцип | Идея в одном предложении | Пример из ML |
|---------|--------------------------|--------------|
| **Инкапсуляция** | Прячем внутреннее устройство объекта и открываем только нужный интерфейс. | `StandardScaler` скрывает формулы нормировки, показывая `fit` и `transform`. |
| **Наследование** | Дочерний класс автоматически получает всё от родительского и может добавлять/менять поведение. | `LogisticRegression` → `SGDClassifier`, который расширяет обучение стохастическим градиентом. |
| **Полиморфизм** | Разные классы можно использовать одинаковым образом, если у них общий интерфейс. | Функция `cross_val_score(model, X, y)` принимает любой объект с `fit/predict`. |
| **Абстракция** | Выделяем главное, скрывая детали реализации. | Термин «модель» объединяет линейные, деревья, нейронные сети, - мы работаем с ними через одинаковые абстракции. |

### 1.4 Абстракция — что это и зачем нужна  


Абстракция — это выбор **минимального, но достаточного** набора свойств и действий, который описывает объект с точки зрения текущей задачи.  
Мы сознательно опускаем всё лишнее, чтобы:

* работать с объектом, не вглядываясь в детали его реализации;
* свободно изменять «то, что под капотом», не затрагивая внешний код, который этим объектом пользуется.

Приложенный к объектам интерфейс (методы и публичные поля) служит «контрактом»: всё остальное остаётся скрытым.

#### Пример — класс *DataScientist*  
Для рабочего контекста дата-сайентиста достаточно атрибутов  

```python
stack = {"Python", "SQL", "pandas", "scikit-learn"}
domain_knowledge = "финтех"
experience_years = 3
```

Дополнительные детали вроде `размер_обуви` или `любимое_телешоу` не помогают решать аналитические задачи и потому остаются за рамками модели.  

Таким образом, мы абстрагируемся, оставляя лишь характеристики, критичные для решения задач машинного обучения и анализа данных.

## 2. Классы и объекты в Python  

### 2.0 **Классы и объекты**

**Ключевая идея:**  
> **Класс** — это шаблон (чертёж), в котором описывается, *что* умеют объекты и *какие* данные они могут хранить.  
> **Объект** — это конкретный-конкретный экземпляр, «изготовленный» по этому чертежу.

### 2.1 Класс как шаблон  



* Определяет **имя** (новый «тип данных»).  
* Описывает **атрибуты** (данные и поведение), которые появятся у каждого созданного объекта.  
* Существует в единственном экземпляре в памяти программы.


### 2.2 Объект как экземпляр  


* Создаётся вызовом класса, как функции: `obj = MyClass()`.  
* Получает собственное, изолированное **состояние**.  
* С ним можно работать привычными операциями «точка-нотация»: `obj.attribute`.

### 2.3 Синтаксис создания классов  

In [3]:
# Пустой класс-шаблон
class Car:
    pass        # пока ничего внутри

# Создание объектов
car_1 = Car()     # первый автомобиль
car_2 = Car()     # второй автомобиль


*Ключевые элементы*  
1. `class` + ИмяКласса + `:` — объявление.  
2. Внутри блока (отступы!) описываются атрибуты/методы.  
3. Если пока нечего писать, используют `pass`.

> После этой строки `Car` становится **новым типом** (как `int` или `str`), а `car1`, `car2` — его экземпляры.

### 2.4 Простые примеры (без методов)

#### Пример 1: общие (классовые) атрибуты  

In [6]:
class Planet:
    galaxy = "Milky Way"      # атрибут класса (общий для всех объектов)

earth = Planet()
mars  = Planet()

print(earth.galaxy)   # Milky Way
print(mars.galaxy)    # Milky Way

Milky Way
Milky Way


Атрибут `galaxy` хранится один раз у класса; объекты читают его «по ссылке».

#### Пример 2: добавляем уникальные атрибуты «на лету»  


In [7]:
class Student:
    pass                 # пока пустой

nick = Student()
nick.name  = "Nick"      # создаём поле только у nick
nick.grade = 90

kate = Student()
kate.name  = "Kate"
kate.grade = 95

print(kate.grade - nick.grade)   # 5

5



Так делать можно, но позже мы покажем более структурированный способ создавать
и инициализировать объекты (нам понадобится специальный метод — о нём в пункте 4).


### 2.5 Итоги раздела  


| Понятие | Коротко | Иллюстрация |
|---------|---------|-------------|
| **Класс** | Шаблон/чертёж | `class Car:` |
| **Объект (экземпляр)** | Конкретный «предмет» | `my_car = Car()` |
| **class-атрибут** | Общий для всех объектов | `Car.wheels = 4` |
| **dot-нотация** | Доступ к атрибутам | `my_car.color = "red"` |

## 3. Поля (атрибуты) и методы класса


### 3.1  Атрибуты (поля)


| Где объявляем | Для кого действует | Когда появляется |
|--------------|-------------------|------------------|
| **Внутри тела класса** | для **всех** объектов сразу | при создании класса |
| **Прямо у объекта** (через точку) или внутри метода | только для **данного** экземпляра | в момент присваивания |


Пример:
> Применительно к ML-темам: у «точек» координаты разные, но размерность (`dim = 2`) общая.


### 3.2  Методы

Метод — это функция, объявленная **внутри** класса.  
Метод умеет обращаться к данным конкретного объекта.

### 3.3  Роль параметра `self`  


* Первый параметр **каждого** метода экземпляра.  
* Ссылается на **тот объект**, который вызвал метод.  
* Позволяет читать/менять его атрибуты.  
* Передаётся Python-ом автоматически — в вызове мы его не пишем.

```python
def move(self, dx, dy):   # self ← точка, от чьего имени вызван метод
    ...
```



### 3.4  Пример: создаём и используем "точку" - `Point`


In [10]:
# Создание класса с атрибутами и методами
class Point:
    dim = 2                    # атрибут класса (общий)

    # метод, который «заводит» координаты
    def set_coords(self, x, y):
        self.x = x             # атрибуты объекта (индивидуальные)
        self.y = y

    # сдвиг точки
    def move(self, dx, dy):
        self.x += dx
        self.y += dy

    # вычисление расстояния до начала координат
    def distance_to_origin(self):
        return (self.x**2 + self.y**2) ** 0.5

In [11]:
# Работа с классом
p1 = Point()                    # пока координат нет
p1.set_coords(3, 4)             # создаём x и y
print(p1.distance_to_origin())

5.0


In [12]:
p2 = Point()
p2.set_coords(-1, 2)
p2.move(4, -2)
print(p2.x, p2.y)

3 0


In [13]:
print(Point.dim)           # 2  ← общий атрибут читается через класс

2


In [14]:
p1.dim

2

In [15]:
Point.move(p2, 1, 1)
print(p2.x, p2.y)

4 1


*Заметьте: координаты появляются только после вызова `set_coords`, а не сразу при создании объекта — автоматическую инициализацию мы введём позднее с помощью `__init__`.*

### 3.5  Итоги раздела

| Понятие | Как записываем | Пример |
|---------|----------------|--------|
| **Атрибут класса** | внутри тела класса | `dim = 2` |
| **Атрибут объекта** | `self.имя` внутри метода **или** `obj.имя = …` снаружи | `self.x`, `p1.y` |
| **Метод** | функция в классе, первый параметр `self` | `def move(self, dx, dy): …` |
| **`self`** | ссылка на «текущий» объект | `self.x += dx` |

## 4. Магические (dunder) методы в Python  

> **Магический метод** — это метод, имя которого окружено двойным подчёркиванием (`__name__`).  

Python вызывает их **автоматически**, когда объект участвует в определённой операции: создание, печать, сложение, сравнение и т.д.  
Благодаря им класс «ведёт себя» как встроенные типы.

Dunder-методы — это не просто «магия», а **интерфейсы** для взаимодействия с объектами.  

Dunder - **double underscore**.



### 4.1  `__init__(…)` — инициализация объекта  



In [16]:
class Point:
    dim = 2                        # общий атрибут

    def __init__(self, x: float, y: float):
        self.x = x                 # уникальные атрибуты
        self.y = y


*Что происходит?*  
1. Python резервирует память под новый `Point`.  
2. Сразу после этого вызывает `__init__`, передавая свежесозданный объект в `self`.  
3. Мы заполняем внутреннее состояние (`x`, `y`).  



In [17]:
p = Point(3, 4)        # координаты готовы сразу


In [18]:
p.x

3

In [19]:
p.y

4

### 4.2  `__str__` и `__repr__` — человеко-читаемое представление  


| Метод | Когда вызывается | Цель |
|-------|------------------|------|
| `__str__(self)` | print(obj), str(obj) | «Красиво» показать пользователю |
| `__repr__(self)` | repr(obj), интерактивная консоль | Однозначное, отладочное представление |

In [30]:
class Point:
    dim = 2

    def __init__(self, x, y):
        self.x, self.y = x, y

    def __repr__(self):
        return f"Point({self.x}; {self.y})"
    
    def __str__(self):
        return f"({self.x}, {self.y})"

p = Point(3, 4)


In [31]:
print(p)        # (3; 4)        __str__

(3, 4)


In [32]:
p               # Point(3, 4)   __repr__

Point(3; 4)


### 4.3  Другие часто-используемые магические методы  *(нужно знать «в лицо» — писать при необходимости)*  

| Метод | Триггер | Тип полезной операции для `Point` |
|-------|---------|-----------------------------------|
| `__len__(self)`        | `len(obj)` | размерность (могли бы вернуть `2`) |

* Математические операции которые мы пройдем на следующем занятии: `__add__`, `__sub__`, `__mul__` — для сложения, вычитания, умножения и т.д. 



## 5. Инкапсуляция  




> **Инкапсуляция** — это принцип ООП, который отделяет «как объект устроен внутри» от того «как им пользоваться».  

Пользователь видит *интерфейс* (методы / поля, которые можно трогать), а детали «под капотом» прячутся, чтобы:
  
* не дать случайно сломать состояние объекта;  
* сохранить единый способ работы, даже если реализация поменяется.
* упростить использование, не нагружая лишними деталями.


### 5.1  Зачем это нужно в ML-коде  

* После `fit()` модель хранит обученные параметры; внешнему коду не нужно (и опасно) менять их напрямую.  
* У трансформеров (например, `StandardScaler`) статистика (`mean_`, `var_`) доступна только «на чтение»; изменение допустимо лишь через новые вызовы `fit`.  


### 5.2  Уровни «видимости» по договорённости Python  



| Запись | Как трактуется | Можно ли обратиться снаружи? | Пример (класс `Point`) |
|--------|---------------|------------------------------|------------------------|
| `attribute` | **Public** (общедоступный) | Да, свободно. | `p.x`, `p.y` |
| `_attribute` | **Protected** (для внутреннего пользования) | Можно, но «на свой страх и риск»; имя подчёркивает, что трогать *не рекомендуется*. | `_cached_norm` |
| `__attribute` | **Private** (скрытый) | Прямого доступа нет — Python *переименовывает* это поле в `_ClassName__attribute` (name mangling). | `__id` |

🔎 Замечание: 
>Это **конвенции**, а не строгие правила. Но их придерживаются все крупные библиотеки (включая scikit-learn, PyTorch, TensorFlow).



### 5.3  Пример  


In [34]:
class Point:
    dim = 2

    def __init__(self, x, y):
        self.x = x                  # public
        self.y = y
        self._cached_norm = None    # protected
        self.__id = id(self)        # private

    def norm(self):
        """Евклидова норма. Кэшируем результат в _cached_norm."""
        if self._cached_norm is None:
            self._cached_norm = (self.x**2 + self.y**2) ** 0.5
        return self._cached_norm


In [36]:
p = Point(3, 4)
print(p.norm())        # 5.0

5.0


In [37]:
print(p.x)             # 3  ← public: ok

3


In [38]:
print(p._cached_norm)  # 5.0 ← возможно, но по соглашению «не трогать»

5.0


In [39]:
print(p.__id)        # AttributeError!

AttributeError: 'Point' object has no attribute '__id'

In [40]:
print(p._Point__id)    # доступ только через «mangled name» (_Point__id) — делать так не стоит

140378860239184


### 5.4  Итоги раздела  




* Инкапсуляция помогает защитить внутреннее состояние и поддерживать стабильный интерфейс.  
* В Python её обеспечивают **именовые соглашения**:  
  * без подчёркиваний → public;  
  * один `_` → protected (используйте лишь внутри класса/подкласса);  
  * два `__` → private (скрытие через name mangling).  
* Даже если «достать» скрытое поле технически возможно, хорошим стилем считается работать только с тем, что класс явно открывает наружу.


## 6. Наследование  

### 6.1 Концепция  


> **Наследование** — механизм, позволяющий объявить новый класс (**дочерний, child**) на основе уже существующего (**родительского, base/parent**).  

* Дочерний класс **наследует** все поля и методы родителя - не нужно писать их заново.  
* При желании он **добавляет** новые возможности или **переопределяет** (заменяет) унаследованные методы.

Уточнение:  
📌 В ML-библиотеках это даёт единый интерфейс: все модели получают `fit/predict/score`, переопределяя только то, что специфично.

### 6.2 Синтаксис в Python  



```python
class Parent:
    ...

class Child(Parent):          # в скобках имя(я) родительских классов
    ...
```

* Родитель может быть один (обычно) или несколько (множественное наследование).  
* Если у класса в скобках ничего не указать, он наследует неявно от `object`.

### 6.3 `super()` — доступ к родителю  




* Внутри метода дочернего класса вызываем `super().method(...)`, чтобы использовать реализацию родителя и **расширить** её, а не дублировать.  
* Особенно важно в `__init__`, чтобы базовый конструктор инициализировал свою часть полей.

```python
class Child(Parent):
    def __init__(self, extra):
        super().__init__()     # инициализация Parent
        self.extra = extra     # добавляем своё
```


### 6.4 Мини-иерархии



| Родитель | Дочерний | Что добавили / изменили |
|----------|----------|-------------------------|
| **`Point`** | `Point3D` | ещё одна координата `z`; переопределяем `distance_to_origin()` |
| **`BaseScaler`** | `MinMaxScaler`, `StandardScaler` | каждая реализует свой `transform()`, а общий `fit()` хранит `min_`, `max_`, `mean_`, `std_` |
| **`BaseModel`** | `LinearModel`, `KNNModel` | наследуют `score()`; каждая переопределяет `fit/predict` |


### 6.5 Примеры

#### 2-D → 3-D точка  

In [41]:
class Point:
    def __init__(self, x, y):
        self.x, self.y = x, y

    def distance_to_origin(self):
        return (self.x**2 + self.y**2) ** 0.5

class Point3D(Point):
    def __init__(self, x, y, z):
        super().__init__(x, y)     # инициализируем x, y через родителя
        self.z = z                 # своё поле
        
    def distance_to_origin(self):  # переопределяем
        return (self.x**2 + self.y**2 + self.z**2) ** 0.5


In [42]:
p2d = Point(3, 4)
p3d = Point3D(3, 4, 12)
print(p2d.distance_to_origin())   # 5.0
print(p3d.distance_to_origin())   # 13.0

5.0
13.0


#### Базовый скейлер 

In [43]:
class BaseScaler:
    def fit(self, data):
        raise NotImplementedError  # обязан переопределить потомок
    
    def transform(self, data):
        raise NotImplementedError

class MinMaxScaler(BaseScaler):
    def fit(self, data):
        self.min_, self.max_ = min(data), max(data)
        return self
    
    def transform(self, data):
        rng = self.max_ - self.min_
        return [(x - self.min_) / rng for x in data]

In [None]:
scaler = MinMaxScaler()
data = [1, 2, 3, 4, 5]
scaler.fit(data)
print(scaler.transform(data))

[0.0, 0.25, 0.5, 0.75, 1.0]


*Теперь любая функция, принимающая `BaseScaler`, может работать с `MinMaxScaler` или `StandardScaler`, не заботясь о деталях реализации.*


### 6.5 Итоги раздела  

1. **Наследование** = повторное использование кода + расширяемость.  
2. `Child(Parent)` — объявление; `super()` — способ вызвать логику родителя.  
3. Часто применяем в ML-коде, чтобы создавать иерархии моделей, трансформеров, коллбэков.

## 7. Полиморфизм  

### 7.1 Идея  

> **Полиморфизм** («много форм») — возможность обращаться к объектам **разных классов** одинаковым способом, если у них совпадает интерфейс.

В Python это основывается не на типах, а на *поведении*: «если у объекта есть метод `predict`, значит, его можно обучить и вызвать предсказание». Такой подход называют **duck typing**.


### 7.2 Переопределение (override) методов  

Когда дочерний класс определяет метод **с тем же именем**, что и у родителя, версия родителя *скрывается*, и вызывается новая реализация:

```python
class Point:
    def distance_to_origin(self):
        ...
class Point3D(Point):
    def distance_to_origin(self):        # переопределяем
        ...
```

При обращении `obj.distance_to_origin()` Python смотрит на **фактический** класс объекта и вызывает соответствующее определение.




### 7.3 Мини-пример: расстояние для 2-D и 3-D точек  

In [45]:
def norm(point):
    """Принимает ЛЮБОЙ объект с методом distance_to_origin()."""
    return point.distance_to_origin()

p2 = Point(3, 4)
p3 = Point3D(3, 4, 12)

for p in (p2, p3):
    print(norm(p))          # 5.0  и  13.0

5.0
13.0


*Функция ничего не знает о классе объекта — важно лишь, что у него есть нужный метод.*  

### 7.4 Пример из ML-контекста: скейлеры  

In [46]:
class BaseScaler:
    def fit(self, data): ...
    def transform(self, data): ...

class MinMaxScaler(BaseScaler):
    ...    # собственная реализация

class StandardScaler(BaseScaler):
    ...    # своя формула


In [47]:
def scale_dataset(data, scaler: BaseScaler):
    # работает с любым наследником BaseScaler
    return scaler.fit(data).transform(data)

In [48]:
raw = [1, 2, 3, 4, 5, ...]

data_norm = scale_dataset(raw, MinMaxScaler())
data_std  = scale_dataset(raw, StandardScaler())

AttributeError: 'NoneType' object has no attribute 'transform'

Функция `scale_dataset` **полиморфна**: одинаковый код служит для двух разных классов-скейлеров.

### 7.5 Встроённые примеры полиморфизма в Python  



* `len()` работает с `list`, `dict`, `str`, `numpy.array` — каждый тип реализует собственный `__len__`.  
* Операция `+` действует по-разному для чисел, строк, списков — за счёт разных `__add__` внутри классов.


### 7.6 Важные моменты  

1. **Полиморфизм = единый интерфейс для разных реализаций.**  
2. В Python он достигается переопределением методов и duck typing.  
3. В ML-коде это даёт свободу: функции `train`, `evaluate`, пайплайн-менеджеры и т.п. принимают «что угодно», если там есть `fit`/`predict`.  

## 8. Практические примеры ООП в контексте машинного обучения  

### 8.1 Мини-иерархия «своих» моделей ML  

Посмотрим, как **наследование** + **полиморфизм** позволяют писать общий код обучения / оценки, не заботясь о конкретном алгоритме.

In [49]:
class BaseModel:                      # единый интерфейс
    def fit(self, X, y):
        raise NotImplementedError     # «контракт» для потомков
    def predict(self, X):
        raise NotImplementedError
    

class MeanRegressor(BaseModel):       # ➜ ŷ = среднее train-целей
    def fit(self, X, y):
        self.mean_ = sum(y) / len(y)
        return self
    
    def predict(self, X):
        return [self.mean_] * len(X)
    

class MajorityClassifier(BaseModel):  # ➜ класс-мода
    def fit(self, X, y):
        self.majority_ = max(set(y), key=y.count)
        return self
    
    def predict(self, X):
        return [self.majority_] * len(X)

In [50]:
def evaluate(model: BaseModel, X, y):
    model.fit(X, y)
    preds = model.predict(X)
    return sum(int(a == b) for a, b in zip(preds, y)) / len(y)

X = [1, 2, 3, 4, 5]
y_reg = [1, 2, 3, 4, 5]
y_clf = [1, 2, 2, 2, 3]

score_1 = evaluate(MeanRegressor(),  X, y_reg)
score_2 = evaluate(MajorityClassifier(), X, y_clf)

print(score_1)
print(score_2)

0.2
0.6



*Функция `evaluate` «не знает», какая именно модель придёт — важно лишь, что у неё есть `fit` и `predict`.*  


### 8.2 Как это повторяется в реальных библиотеках  


| Библиотека | Базовый класс | Что наследуют | Примеры наследников |
|------------|---------------|---------------|---------------------|
| **scikit-learn** | `BaseEstimator` | все модели, скейлеры, пайплайны | `LogisticRegression`, `RandomForestClassifier`, `StandardScaler`, `Pipeline` |
| **PyTorch** | `torch.nn.Module` | любые нейронные сети и их блоки | `Linear`, `Conv2d`, `TransformerEncoder` |
| **TensorFlow/Keras** | `tf.keras.Model`, `tf.keras.layers.Layer` | модели и слои | `Dense`, `LSTM`, `Sequential` |
| **XGBoost / LightGBM** | собственные классы-обёртки с `fit`/`predict` | бустинговые модели | `XGBClassifier`, `LGBMRegressor` |

*Во всех случаях используется один и тот же принцип:*  
1. **Наследуем** базовый класс, чтобы получить «обязательные» методы.  
2. **Переопределяем** логику (`forward`, `fit`, `transform` …).  
3. Любой внешний код (GridSearch, cross-validation, автологер, пайплайн) ждёт **только** этот интерфейс и работает «вслепую» с любым конкретным классом.

### 8.3 ООП-принципы в действии  



| Принцип | Как проявляется в ML-коде |
|---------|--------------------------|
| **Инкапсуляция** | Параметры модели (`coef_`, `mean_`, веса сети) спрятаны внутри; внешнему коду открываются безопасные методы `fit` / `predict`. |
| **Наследование** | `StandardScaler` и `MinMaxScaler` наследуют общий «скелет» `BaseEstimator`; все модели PyTorch наследуют `nn.Module`. |
| **Полиморфизм** | Функции `cross_val_score`, `Pipeline`, `Trainer` принимают *любой* объект, если у него есть нужные методы. |
| **Абстракция** | Термины «модель», «трансформер», «optimizer» описывают идеи, а не детали реализации. |



## 9. Итоги занятия

* **Объектно-ориентированное программирование** — это способ организовать код, чтобы он был удобен в использовании и расширении.
* **Классы** — это шаблоны, которые описывают, *что* умеют объекты и *какие* данные они могут хранить.
* **Объекты** — это конкретные экземпляры классов, которые хранят своё состояние и поведение.
* **Методы** — это функции, которые работают с данными объекта и могут изменять его состояние.


* **Инкапсуляция** — это принцип, который отделяет внутреннее устройство объекта от его интерфейса.
* **Наследование** — это механизм, позволяющий создавать новые классы на основе уже существующих.
* **Полиморфизм** — это возможность обращаться к объектам разных классов одинаковым образом, если у них совпадает интерфейс.
* **Абстракция** — это выделение главного, скрывая детали реализации.

* **Магические методы** — это специальные методы, которые позволяют объектам вести себя как встроенные типы (например, `__init__`, `__str__`, `__add__`).
* **Python** использует соглашения для инкапсуляции: `public`, `_protected`, `__private`.
* **В ML-коде** ООП помогает организовать модели, трансформеры и пайплайны, чтобы они были удобны в использовании и расширении.
* **Библиотеки** (scikit-learn, PyTorch, TensorFlow) используют ООП для создания моделей и трансформеров с единым интерфейсом. 

* **Принципы ООП** позволяют писать общий код для обучения и оценки моделей, не заботясь о конкретных алгоритмах.

## 10. Домашнее задание


Цель — укрепить понимание классов, наследования и полиморфизма на маленьких, но живых примерах, связанных c ML-контекстом.  

| № | Тема | Постановка задачи | Ключевые проверки |
|---|------|------------------|-------------------|
| **1** | **Создание простого класса** | **`Rectangle`**<br>1. Конструктор принимает `width`, `height`.<br>2. Метод `area()` возвращает площадь.<br>3. Метод `scale(k)` умножает обе стороны на `k`. | ✔ Поля хранятся в объекте.<br>✔ `area` даёт правильное число.<br>✔ `scale` меняет состояние. |
| **2** | **Наследование** | **`Square`**<br>1. Наследуется от `Rectangle`.<br>2. Принимает один параметр `side` и вызывает `super().__init__(side, side)`.<br>3. Метод `area()` переопределять **не нужно** — наследуется. | ✔ Используется `super()`.<br>✔ `Square(4).area()` = 16. |
| **3** | **Полиморфизм, часть 1** | Напишите функцию `surface(shape)` — принимает **любой** объект, у которого есть метод `area()`. Проверьте с `Rectangle` и `Square`. | ✔ Функция работает для обоих классов без `isinstance`. |


4 номер - Полиморфизм (мини-ML) со зввёздочкой

| Шаг | Требование | Подсказки для проверки |
|-----|------------|------------------------|
| **1** | **Базовый класс**<br>Создайте `BaseModel` с абстрактными методами<br>`fit(self, X, y)` и `predict(self, X)`.<br>Методы должны выбрасывать `NotImplementedError`. | В конструкторе ничего хранить не нужно. |
| **2a** | **MedianRegressor** ― регрессия-«по-медиане»<br>• В `fit` сохраните медиану `y` (`statistics.median`).<br>• В `predict` верните список из этой медианы той же длины, что и `X`. | Проверка: `MedianRegressor().fit(X, [1,2,10]).predict(X)` → `[2,2,…]` |
| **2b** | **PriorProbClassifier** ― максимально простой классификатор с априорным распределением.<br>• В `fit` посчитайте частоты классов и сохраните их как словарь `{label: prob}`.<br>• В `predict` для *каждого* объекта случайно выберите класс **по тем же вероятностям** (см. `random.choices`) | Проверка: частота предсказаний примерно совпадает с обучающей. |
| **3** | **evaluate(model, X, y, task='reg')**<br>• Вызывает `fit` → `predict`.<br>• Если `task='reg'`, считает **MAE** (ср. абсолютная ошибка).<br>• Если `task='clf'`, считает **accuracy**. | Для теста вызовите:<br>`evaluate(MedianRegressor(), X, y_reg, task='reg')`<br>`evaluate(PriorProbClassifier(), X, y_clf, task='clf')` |
| **4** | **Полиморфизм**<br>Убедитесь, что функция `evaluate` корректно работает с обоими классами **без изменений** своего кода. | Отсутствуют условные проверки типа `isinstance(model, …)` |

#### Подсказки по реализации

* **MedianRegressor** — классический «baseline» для MAE-метрик; медиану трудно «побить» по средней абсолютной ошибке.
* **PriorProbClassifier** — «честный» случайный базис, который учитывает несбалансированность классов и даёт интуитивный ориентир: если accuracy близка к частоте самого популярного класса, модель почти ничему не научилась.

> **Совет:** используйте стандартные модули `statistics` и `random`, чтобы не тянуть внешние зависимости.