# **Файл для базовых методов и функций**

**Установка зависимостей**


In [None]:
!python -m pip install --upgrade pip


In [None]:
!pip3 install -r ./../requirements.txt
!pip3 install spacy nbformat

In [None]:
import pandas as pd
import kagglehub
import torch

# Метрики
from sklearn.metrics import accuracy_score, precision_recall_fscore_support, confusion_matrix
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

def compute_metrics(pred):
    predictions = pred.predictions.argmax(-1)  # Максимальный индекс (класс)
    labels = pred.label_ids
    
    accuracy = accuracy_score(labels, predictions)
    precision, recall, f1, _ = precision_recall_fscore_support(labels, predictions, average='weighted')
    
    # Построение confusion matrix
    cm = confusion_matrix(labels, predictions)
    
    save_confusion_matrix(cm, dataset.classes)
    
    return {
        'accuracy': accuracy,
        'precision': precision,
        'recall': recall,
        'f1': f1
    }


def save_confusion_matrix(cm, class_names, filename="confusion_matrix.png"):
    plt.figure(figsize=(10, 8))
    sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", xticklabels=class_names, yticklabels=class_names)
    plt.ylabel('Actual')
    plt.xlabel('Predicted')
    plt.title('Confusion Matrix')
    plt.savefig(filename)
    plt.close()


**Загружаем конфиг**

In [3]:
import yaml

CONFIG_PATH = './../config.yaml'

with open(CONFIG_PATH, 'r') as f:
    config = yaml.safe_load(f)


**Другие функции**

In [4]:
import logging

def are_almost_equal(a: float, b: float, tolerance: float = 0.001) -> bool:
    return abs(a - b) < max(abs(a), abs(b)) * tolerance

def setup_logging():
    logging.config.dictConfig(
        {
            'version': 1,
            'disable_existing_loggers': False,
            'formatters': {
                'standard': {'format': '%(asctime)s [%(levelname)s] %(name)s: %(message)s', 'datefmt': '%Y-%m-%d %H:%M:%S'}
            }
        }
    )


def get_logger(name: str) -> logging.Logger:
    return logging.getLogger(name)

setup_logging()
logger = get_logger(__name__)

logger.info("template.ipynb запущен")


In [None]:
import shutil
import os


def move_data(path, data_path):
    """
    Рекурсивно копирует все файлы и подпапки из исходной директории в целевую.
    
    Args:
        path (str): Путь к исходной директории
        data_path (str): Путь к целевой директории
    """
    # Создаем директорию, если её нет
    os.makedirs(data_path, exist_ok=True)

    # Рекурсивно обходим все файлы и папки
    for item in os.listdir(path):
        src = os.path.join(path, item)
        dst = os.path.join(data_path, item)

        if os.path.isfile(src):
            # Если это файл - копируем его
            shutil.copy2(src, dst)
            logger.info(f"Скопирован файл: {item}")
        elif os.path.isdir(src):
            # Если это папка - рекурсивно копируем её содержимое
            shutil.copytree(src, dst, dirs_exist_ok=True)
            logger.info(f"Скопирована директория: {item}")

    logger.info(f"Все данные перемещены из {path} в {data_path}")