In [None]:
# --- Scikit-learn (Классика: Линейные модели, Деревья, Метрики) ---
# Doc: https://scikit-learn.org/stable/user_guide.html
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import f1_score # Doc: https://scikit-learn.org/stable/modules/model_evaluation.html

# --- CatBoost (Лучший для таблиц с категориями/текстом) ---
# Doc: https://catboost.ai/en/docs/concepts/python-reference_catboostclassifier
from catboost import CatBoostClassifier

model = CatBoostClassifier(
    iterations=1000, 
    learning_rate=0.03, 
    cat_features=cat_cols # Индексы категориальных колонок
)
model.fit(X_train, y_train, verbose=100)

# --- XGBoost ---
# Doc: https://xgboost.readthedocs.io/en/stable/python/python_intro.html
from xgboost import XGBClassifier

In [None]:
# --- Torchvision (Стандартные модели и аугментации) ---
# Doc: https://pytorch.org/vision/stable/models.html
import torchvision.models as models
from torchvision import transforms

# --- PyTorch Image Models (timm) — библиотека со всеми современными SOTA моделями (ViT, EfficientNet) ---
# Doc: https://huggingface.co/docs/timm/index
import timm

# Пример загрузки предобученного Vision Transformer (ViT)
model = timm.create_model('vit_base_patch16_224', pretrained=True)

# --- OpenCV (Обработка изображений: фильтры, изменение размера) ---
# Doc: https://docs.opencv.org/4.x/d6/d00/tutorial_py_root.html
import cv2
image = cv2.imread('image.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # Важно: OpenCV читает в BGR!

In [None]:
# --- Hugging Face Transformers (BERT, GPT, Tokenizers) ---
# Doc: https://huggingface.co/docs/transformers/index
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# --- NLTK (Очистка текста, стоп-слова) ---
# Doc: https://www.nltk.org/
import nltk
from nltk.corpus import stopwords
nltk.download('stopwords')

# --- Scikit-learn NLP (TF-IDF) ---
# Doc: https://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction
from sklearn.feature_extraction.text import TfidfVectorizer

In [None]:
# --- PyTorch Layers (RNN, LSTM, GRU, Conv1D) ---
# Doc: https://pytorch.org/docs/stable/nn.html#recurrent-layers
import torch.nn as nn

# Пример LSTM: input_size (признаки), hidden_size (память)
lstm = nn.LSTM(input_size=1, hidden_size=64, num_layers=2, batch_first=True)

# Doc: https://pytorch.org/docs/stable/generated/torch.nn.Conv1d.html
conv1d = nn.Conv1d(in_channels=1, out_channels=32, kernel_size=3)

In [None]:
# документации CatBoost (в ссылке выше) обрати особое внимание на раздел "Overfitting detector". На олимпиадах часто дают мало данных, и модели легко переобучаются (заучивают ответы). early_stopping_rounds в коде CatBoost — твой лучший друг, он остановит обучение, когда точность на валидации перестанет расти.

# Совет по метакогниции: Если во время олимпиады модель работает долго, загляни в документацию по ключевому слову device='gpu' (для CatBoost) или .to('cuda') (для PyTorch). Это ускорит обучение в 10–50 раз.