In [None]:
# Понятие объекта в Python. Объекты как экземпляры классов.

In [None]:
# Для примера рассмотрим линейную регрессию
# LinearRegressionModel – это класс, который определяет атрибуты coefficients и intercept,
# а также методы predict и evaluate.

class LinearRegressionModel:
    def __init__(self, coefficients, intercept):
        self.coefficients = coefficients # b0, b1, bn
        self.intercept = intercept # e

    def predict(self, X):
        # Простая линейная регрессия: y = X @ coefficients + intercept
        return X @ self.coefficients + self.intercept

    def evaluate(self, X, y_true):
        y_pred = self.predict(X)
        mse = ((y_true - y_pred) ** 2).mean()
        return mse


In [None]:
# Создание экземпляра класса LinearRegressionModel
model = LinearRegressionModel(coefficients=[0.5, 1.5], intercept=2.0)


In [None]:
# Предсказание значений
import numpy as np

X = np.array([[1, 2], [3, 4], [5, 6]])
y_true = np.array([5.5, 11.5, 17.5])
predictions = model.predict(X)

print(predictions)

# Оценка модели при помощи метрики mse
mse = model.evaluate(X, y_true)
print(f"Mean Squared Error: {mse}")


In [None]:
# Визуализация истинных значений и предсказанных
import numpy as np
import matplotlib.pyplot as plt

# Визуализация matplotlib
plt.figure(figsize=(10, 6))
plt.plot(range(len(y_true)), y_true, label='Истинные значения', marker='o')
plt.plot(range(len(predictions)), predictions, label='Предсказанные значения', marker='x')
plt.xlabel('Наблюдения')
plt.ylabel('Значения')
plt.title('Сравнение истинных и предсказанных значений')
plt.legend()
plt.grid(True)
plt.show()


In [None]:
# Атрибуты и методы объектов

In [None]:
# Атрибуты
# make, model и year являются атрибутами класса Car
class Car:
    def __init__(self, make, model, year):
        self.make = make      # Атрибут марки автомобиля
        self.model = model    # Атрибут модели автомобиля
        self.year = year      # Атрибут года выпуска автомобиля

# Создание экземпляра класса Car
my_car = Car("Tesla", "X", 2020)

# Доступ к атрибутам объекта
print(my_car.make)
print(my_car.model)
print(my_car.year)


In [None]:
# Методы
# make, model и year являются атрибутами класса Car
# start_engine и stop_engine являются методами класса Car
class Car:
    def __init__(self, make, model, year):
        self.make = make
        self.model = model
        self.year = year

    def start_engine(self):
        # Метод для запуска двигателя
        print(f"{self.make} {self.model} engine started.")

    def stop_engine(self):
        # Метод для остановки двигателя
        print(f"{self.make} {self.model} engine stopped.")

# Создание экземпляра класса Car
my_car = Car("Tesla", "X", 2020)

# Вызов методов объекта
my_car.start_engine()
my_car.stop_engine()


In [None]:
# Связь атрибутов и методов
# метод deposit изменяет атрибут balance, увеличивая его на указанную сумму,
# а метод withdraw уменьшает атрибут balance, если на счету достаточно средств.
class BankAccount:
    def __init__(self, balance=0):
        self.balance = balance  # Атрибут баланса счета

    def deposit(self, amount):
        # Метод для внесения средств на счет
        self.balance += amount
        print(f"Внесено: {amount}. Новый баланс {self.balance}.")

    def withdraw(self, amount):
        # Метод для снятия средств со счета
        if amount <= self.balance:
            self.balance -= amount
            print(f"Выведено {amount}. Новый баланс {self.balance}.")
        else:
            print("Недостаточно средств.")

# Создание экземпляра класса BankAccount
my_account = BankAccount()

# Вызов методов объекта
my_account.deposit(50)
my_account.withdraw(50)
my_account.withdraw(100)


In [None]:
# Встроенные методы объектов.

In [None]:
# 1. __init__: Инициализатор (конструктор) объекта.
class Example:
    def __init__(self, value):
        self.value = value

obj = Example(10)


In [None]:
# 2.__str__: Возвращает строковое представление объекта для пользователя.
class Example:
    def __init__(self, value):
        self.value = value

    def __str__(self):
        return f"Пример со значением {self.value}"

obj = Example(10)
print(obj)


In [None]:
# 3. __repr__: Возвращает строковое представление объекта для разработчика (обычно более подробное, чем __str__).
class Example:
    def __init__(self, value):
        self.value = value

    def __repr__(self):
        return f"Пример со значением ({self.value})"

obj = Example(10)
print(repr(obj))


In [None]:
# 4. __len__: Возвращает длину объекта.
class CustomList:
    def __init__(self, elements):
        self.elements = elements

    def __len__(self):
        return len(self.elements)

clist = CustomList([1, 2, 3])
print(len(clist))


In [None]:
# 5. __getitem__(self, key)
class Library:
    def __init__(self, books):
        self.books = books

    def __getitem__(self, key):
        return self.books[key]

library = Library(['Book1', 'Book2', 'Book3'])
print(library[2])


In [None]:
# 6. __setitem__(self, key, value)
class Library:
    def __init__(self, books):
        self.books = books

    def __setitem__(self, key, value):
        self.books[key] = value

library = Library(['Book1', 'Book2', 'Book3'])
library[0] = 'New Book'
print(library.books)


In [None]:
# 7. __iter__ и __next__: Определяют поведение для итерации по объекту.
class CustomRange:
    def __init__(self, start, end):
        self.current = start
        self.end = end

    def __iter__(self):
        return self

    def __next__(self):
        if self.current >= self.end:
            raise StopIteration
        value = self.current
        self.current += 1
        return value

crange = CustomRange(1, 5)
for num in crange:
    print(num)


In [None]:
# 8. __eq__(self, other)
class Number:
    def __init__(self, value):
        self.value = value

    def __eq__(self, other):
        return self.value == other.value

num1 = Number(5)
num2 = Number(5)
num3 = Number(7)

print(num1 == num2)
print(num1 == num3)


In [None]:
# Создание классов в Python.

In [None]:
# Создание класса для решения задачи классификации при помощи LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler


class SimpleClassifier:
    def __init__(self, max_iter=100):
        self.model = LogisticRegression(max_iter=max_iter)
        self.scaler = StandardScaler()

    def train(self, X, y):
        """
        Обучает модель на тренировочных данных.
        :param X: Функции (признаки)
        :param y: Целевая переменная
        """
        X_scaled = self.scaler.fit_transform(X)
        self.model.fit(X_scaled, y)

    def predict(self, X):
        """
        Делает предсказания на новых данных.
        :param X: Новые данные
        :return: Предсказанные метки
        """
        X_scaled = self.scaler.transform(X)
        return self.model.predict(X_scaled)

    def evaluate(self, X, y):
        """
        Оценивает модель на тестовых данных.
        :param X: Тестовые функции (признаки)
        :param y: Тестовая целевая переменная
        :return: Точность модели
        """
        y_pred = self.predict(X)
        return accuracy_score(y, y_pred)


In [None]:
# Посмотрим на данные "Ирисы Фишера"
from sklearn.datasets import load_iris
import pandas as pd

# Загрузка датасета Iris
iris = load_iris()

# Признаки
X = iris.data

# Метки (виды ирисов)
y = iris.target

# Имена признаков
feature_names = iris.feature_names

# Имена видов ирисов
target_names = iris.target_names

# Создание DataFrame для удобного отображения данных
df = pd.DataFrame(data=X, columns=feature_names)
df['species'] = pd.Categorical.from_codes(y, target_names)

print(df.head())


In [None]:
# Визуализация при помощи matplotlib
import seaborn as sns
import matplotlib.pyplot as plt

# Построение парных графиков при помощи sns
sns.pairplot(df, hue='species')
plt.show()


In [None]:
# Использование класса SimpleClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

if __name__ == "__main__":
    # Загрузим данные
    iris = load_iris()
    X = iris.data
    y = iris.target

    # Разделим данные на тренировочную и тестовую выборки
    #X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, stratify=y) # равные наборы данных

    # Создадим экземпляр классификатора
    classifier = SimpleClassifier(max_iter=200)

    # Обучим модель
    classifier.train(X_train, y_train)

    # Оценим модель
    accuracy = classifier.evaluate(X_test, y_test)
    print(f"Точность модели: {accuracy:.2f}")

    # Выведем матрицу истинности
    y_pred = classifier.predict(X_test)
    cm = confusion_matrix(y_test, y_pred)
    print("Матрица истинности:")
    print(cm)

    # Выведем классификационный отчет
    cr = classification_report(y_test, y_pred, target_names=iris.target_names)
    print("Классификационный отчет:")
    print(cr)


In [None]:
# Определение класса и его структура.
# Встроенные функции в python


In [None]:
# Пример использования функции map()
numbers = [1, 2, 3, 4, 5]

# Применяем функцию, которая возводит каждое число в квадрат
squared_numbers = list(map(lambda x: x ** 2, numbers))

print("Исходный список:", numbers)
print("Список квадратов:", squared_numbers)


In [None]:
# Пример использования функции filter()
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Фильтруем только четные числа
even_numbers = list(filter(lambda x: x % 2 == 0, numbers))

print("Исходный список:", numbers)
print("Четные числа:", even_numbers)


In [None]:
from functools import reduce

# Пример использования функции reduce()
numbers = [1, 2, 3, 4, 5]

# Находим произведение всех чисел в списке
product = reduce(lambda x, y: x * y, numbers)

print("Исходный список:", numbers)
print("Произведение всех чисел:", product)


In [None]:
# Пример использования функции sorted()
numbers = [5, 2, 9, 1, 5, 6]

# Сортируем числа по возрастанию
sorted_numbers = sorted(numbers)

# Сортируем числа по убыванию
sorted_numbers_desc = sorted(numbers, reverse=True)

print("Исходный список:", numbers)
print("Отсортированный список по возрастанию:", sorted_numbers)
print("Отсортированный список по убыванию:", sorted_numbers_desc)


In [None]:
import pandas as pd

# Пример использования функции apply() в pandas
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35]
}

# Создаем DataFrame
df = pd.DataFrame(data)

# Функция для добавления 5 лет к возрасту
def add_years(age):
    return age + 5

# Применяем функцию add_years к каждому элементу столбца 'Age'
df['Age'] = df['Age'].apply(add_years)

print("Обновленный DataFrame:")
print(df)


In [None]:
# Определение класса и его структура.

In [None]:
# Импортирование библиотек

import numpy as np
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import fetch_california_housing

# Определение простой регрессии
class SimpleRegressor:
    def __init__(self):
        self.model = LinearRegression()
        self.scaler = StandardScaler()

    def train(self, X, y):
        """
        Обучает модель на тренировочных данных.
        :param X: Функции (признаки)
        :param y: Целевая переменная
        """
        X_scaled = self.scaler.fit_transform(X)
        self.model.fit(X_scaled, y)

    def predict(self, X):
        """
        Делает предсказания на новых данных.
        :param X: Новые данные
        :return: Предсказанные значения
        """
        X_scaled = self.scaler.transform(X)
        return self.model.predict(X_scaled)

    def evaluate(self, X, y):
        """
        Оценивает модель на тестовых данных.
        :param X: Тестовые функции (признаки)
        :param y: Тестовая целевая переменная
        :return: Ошибка модели
        """
        y_pred = self.predict(X)
        mse = mean_squared_error(y, y_pred)
        r2 = r2_score(y, y_pred)
        return mse, r2

    def plot_predictions(self, y_true, y_pred):
        """
        Визуализирует истинные и предсказанные значения.
        :param y_true: Истинные значения
        :param y_pred: Предсказанные значения
        """
        plt.figure(figsize=(10, 6))
        plt.scatter(range(len(y_true)), y_true, color='blue', label='Истинные значения')
        plt.scatter(range(len(y_pred)), y_pred, color='red', label='Предсказанные значения')
        plt.xlabel('Индекс')
        plt.ylabel('Стоимость жилья')
        plt.title('Истинные и предсказанные значения стоимости жилья')
        plt.legend()
        plt.show()


# Использование класса SimpleRegressor
if __name__ == "__main__":
    # Загрузим данные
    housing = fetch_california_housing()
    X = housing.data
    y = housing.target

    # Разделим данные на тренировочную и тестовую выборки
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, shuffle=False) # ,

    # Создадим экземпляр регрессора
    regressor = SimpleRegressor()

    # Обучим модель
    regressor.train(X_train, y_train)

    # Оценим модель
    mse, r2 = regressor.evaluate(X_test, y_test)
    print(f"Среднеквадратичная ошибка: {mse:.2f}")
    print(f"Коэффициент детерминации R^2: {r2:.2f}")

    # Выведем предсказанные и истинные значения для тестовых данных
    y_pred = regressor.predict(X_test)
    for true, pred in zip(y_test[:10], y_pred[:10]):
        print(f"Истинное значение: {true:.2f}, Предсказанное значение: {pred:.2f}")

    # Визуализируем истинные и предсказанные значения
    regressor.plot_predictions(y_test, y_pred)


In [None]:
# Визуализация, которая отображает только первые 20 значений
import matplotlib.pyplot as plt

def plot_predictions(y_true, y_pred, num_points=20):
    """
    Визуализирует истинные и предсказанные значения для первых num_points точек.
    :param y_true: Истинные значения
    :param y_pred: Предсказанные значения
    :param num_points: Количество точек для визуализации
    """
    plt.figure(figsize=(10, 6))
    plt.scatter(range(num_points), y_true[:num_points], color='blue', label='Истинные значения')
    plt.scatter(range(num_points), y_pred[:num_points], color='red', label='Предсказанные значения')
    plt.xlabel('Индекс')
    plt.ylabel('Стоимость жилья')
    plt.title(f'Истинные и предсказанные значения стоимости жилья (первые {num_points} точек)')
    plt.legend()
    plt.show()

# Использование функции визуализации
y_pred = regressor.predict(X_test)
plot_predictions(y_test, y_pred)


In [None]:
# Создание методов класса.

In [None]:
# Статические методы класса
class MathOperations:
    @staticmethod
    def add(a, b):
        return a + b

    @staticmethod
    def subtract(a, b):
        return a - b

    @staticmethod
    def multiply(a, b):
        return a * b

    @staticmethod
    def divide(a, b):
        if b == 0:
            return "Деление на ноль не допускается."
        return a / b

# Использование статических методов без создания экземпляра класса
print(MathOperations.add(5, 3))
print(MathOperations.subtract(5, 3))
print(MathOperations.multiply(5, 3))
print(MathOperations.divide(5, 0))
print(MathOperations.divide(5, 3))


In [None]:
# Методы экземпляра
class Car:
    def __init__(self, make, model):
        self.make = make
        self.model = model

    def display_info(self):
        print(f"Car: {self.make} {self.model}")

# Создание экземпляра класса Car и вызов метода экземпляра
my_car = Car("Tesla", "X")
my_car.display_info()  # Вывод: Car: Tesla X


In [None]:
# Методы класса
class Person:
    population = 0

    def __init__(self, name):
        self.name = name
        Person.population += 1

    @classmethod
    def get_population(cls):
        return cls.population

# Создание экземпляров класса Person и вызов метода класса
p1 = Person("Alice")
p2 = Person("Bob")
print(Person.get_population())


In [None]:
# Пример использования статического метода в контексте машинного обучения
# Методы compute_mean и compute_std помечены декоратором @staticmethod и могут вызываться без создания экземпляра класса.
# Конструктор __init__ и метод normalize работают с данными экземпляра
# и используют статические методы для вычисления среднего значения и стандартного отклонения.

import numpy as np

class DataNormalizer:
    @staticmethod
    def compute_mean(data):
        return np.mean(data)

    @staticmethod
    def compute_std(data):
        return np.std(data)

    def __init__(self, data):
        self.data = data
        self.mean = DataNormalizer.compute_mean(data)
        self.std = DataNormalizer.compute_std(data)

    def normalize(self):
        return (self.data - self.mean) / self.std

# Использование статических методов и методов экземпляра
data = np.array([1, 2, 3, 4, 5])
normalizer = DataNormalizer(data)

print(f"Mean: {normalizer.mean}")
print(f"Std: {normalizer.std}")
normalized_data = normalizer.normalize()
print(f"Normalized data: {normalized_data}")


In [None]:
# Расширенное использование классов в машинном обучении на Python включает в себя несколько продвинутых техник и практик,
# которые делают код более модульным, удобным для повторного использования и легким для тестирования.
# Вот несколько примеров таких практик:

In [None]:
# Наследование для расширения моделей

In [None]:
from sklearn.base import BaseEstimator, TransformerMixin

class CustomTransformer(BaseEstimator, TransformerMixin):
    def __init__(self, params):
        # инициализация параметров
        pass

    def fit(self, X, y=None):
        # логика обучения
        return self

    def transform(self, X):
        # логика преобразования данных
        return X_modified

In [None]:
# Композиция для сочетания моделей

In [None]:
class MyModel:
    def __init__(self, preprocessor, classifier):
        self.preprocessor = preprocessor
        self.classifier = classifier

    def fit(self, X, y):
        X_transformed = self.preprocessor.fit_transform(X)
        self.classifier.fit(X_transformed, y)

    def predict(self, X):
        X_transformed = self.preprocessor.transform(X)
        return self.classifier.predict(X_transformed)

In [None]:
# Стратегии для динамического создания моделей

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor

class ModelFactory:
    def get_model(model_type):
        if model_type == "linear":
            return LinearRegression()
        elif model_type == "tree":
            return DecisionTreeRegressor()
        else:
            raise ValueError("Unknown model type")

# Использование
model = ModelFactory.get_model("linear")

In [None]:
# Декораторы для расширения функциональности

In [None]:
def log_time(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        end = time.time()
        print(f"{func.__name__} took {end - start} seconds")
        return result
    return wrapper

class MyModel:
    @log_time
    def fit(self, X, y):
        # обучение модели
        pass


In [None]:
# Модули в Python

In [None]:
# Создание простого модуля
# ml_module.py
# main.py

In [None]:
# ml_module.py
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

def load_data(file_path):
    """
    Загрузка данных из CSV файла.
    :param file_path: Путь к CSV файлу.
    :return: DataFrame с загруженными данными.
    """
    return pd.read_csv(file_path)

def preprocess_data(df, target_column):
    """
    Предобработка данных: разделение на признаки и целевую переменную, масштабирование признаков.
    :param df: DataFrame с данными.
    :param target_column: Имя столбца с целевой переменной.
    :return: Обработанные признаки, целевая переменная, препроцессор.
    """
    X = df.drop(columns=[target_column])
    y = df[target_column]

    # Определение числовых и категориальных признаков
    numeric_features = ['age', 'bmi', 'children']
    categorical_features = ['sex', 'smoker', 'region']

    # Создание препроцессора
    numeric_transformer = StandardScaler()
    categorical_transformer = OneHotEncoder(drop='first')

    preprocessor = ColumnTransformer(
        transformers=[
            ('num', numeric_transformer, numeric_features),
            ('cat', categorical_transformer, categorical_features)
        ])

    # Применение препроцессора к данным
    X_processed = preprocessor.fit_transform(X)
    return X_processed, y, preprocessor

def train_model(X, y):
    """
    Обучение модели линейной регрессии.
    :param X: Признаки.
    :param y: Целевая переменная.
    :return: Обученная модель.
    """
    model = LinearRegression()
    model.fit(X, y)
    return model

def predict(model, X):
    """
    Предсказание на новых данных.
    :param model: Обученная модель.
    :param X: Признаки.
    :return: Предсказанные значения.
    """
    return model.predict(X)

def evaluate_model(y_true, y_pred):
    """
    Оценка модели с использованием метрик MSE и R^2.
    :param y_true: Истинные значения.
    :param y_pred: Предсказанные значения.
    :return: MSE, R^2.
    """
    mse = mean_squared_error(y_true, y_pred)
    r2 = r2_score(y_true, y_pred)
    return mse, r2


In [None]:
# main.py
import ml_module as ml
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

# Загрузка данных
file_path = '../../../Downloads/data_lesson4.csv'  # Замените на путь к вашему CSV файлу
data = ml.load_data(file_path)

# Предобработка данных
target_column = 'charges'
X, y, preprocessor = ml.preprocess_data(data, target_column)

# Разделение данных на тренировочную и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Обучение модели
model = ml.train_model(X_train, y_train)

# Предсказание на тестовых данных
y_pred = ml.predict(model, X_test)

# Оценка модели
mse, r2 = ml.evaluate_model(y_test, y_pred)
print(f"Среднеквадратичная ошибка: {mse:.2f}")
print(f"Коэффициент детерминации R^2: {r2:.2f}")

# Визуализация истинных и предсказанных значений
def plot_predictions(y_true, y_pred, num_points=50):
    plt.figure(figsize=(10, 6))
    plt.scatter(range(num_points), y_true[:num_points], color='blue', label='Истинные значения')
    plt.scatter(range(num_points), y_pred[:num_points], color='red', label='Предсказанные значения')
    plt.xlabel('Индекс')
    plt.ylabel('Значение charges')
    plt.title(f'Истинные и предсказанные значения charges (первые {num_points} точек)')
    plt.legend()
    plt.show()

plot_predictions(y_test, y_pred)
