# **Инструкция по настройке виртуального окружения**

Использование разных версий библиотек может привести к тому, что при исполнении одного и того же кода результаты будут отличаться. 

Перед началом работы с заданиями курса необходимо правильно настроить виртуальное окружение Python, что обеспечит:

* Воспроизводимость результатов.

* Совместимость версий библиотек.

* Изолированность виртуальной среды от других проектов.

Инструкция призвана помочь в настройке виртуального окружения Python для работы в:

* Облачные среды: Google Colab/Kaggle.

* Локальные среды: venv и Conda.

## **Проверка настройки виртуального окружения**

Для проверки настройки виртуального окружения перед тем, как приступить к выполнению заданий курса, **в каждом ноутбуке с домашним заданием** выполняйте код в ячейке ниже **после каждого нового запуска ноутбука**.

In [3]:
# Код для проверки настройки виртуального окружения

import sys
from importlib.metadata import version

required = {
    'python': '3.12.x',
    'scipy': '1.16.3',
    'numpy': '2.0.2',
    'pandas': '2.2.2',
    'scikit-learn': '1.6.1',
    'statsmodels': '0.14.6',
    'matplotlib': '3.10.0',
    'seaborn': '0.13.2',
    'nltk': '3.9.1',
    'missingno': '0.5.2',
    'mlxtend': '0.23.4',
    'graphviz': '0.21',
    'catboost': '1.2.8',
    'lightgbm': '4.6.0',
    'xgboost': '3.1.3',
    'optuna': '4.4.0',
    'eli5': '0.16.0',
    'shap': '0.50.0'
}

print(f'{"Компонент":<15} | {"Требуется":<12} | {"Установлено":<12} | {"Соответствие"}')
print('-' * 62)

environment_ok = True
for lib, req_ver in required.items():
    try:
        if lib=='python':
            inst_ver = sys.version.split()[0]
            status = '✓' if sys.version_info.major == 3 and sys.version_info.minor == 12 else f'x (требуется {req_ver})'
        else:
            inst_ver = version(lib)
            if inst_ver == req_ver:
                status = '✓'
            else:
                environment_ok = False
                status = f'x (требуется {req_ver})'
    except:
        environment_ok = False
        inst_ver = '-'
        status = 'x (не установлена)'
    print(f'{lib:<15} | {req_ver:<12} | {inst_ver:<12} | {status:<12}')

print('\nРезультат проверки: ', 
      '✓\nВсе версии соответствуют требованиям' 
      if environment_ok else 
      'x\nВНИМАНИЕ: Версии некоторых компонентов не соответствуют требованиям!\n'
      'Для решения проблемы обратитесь к инструкции по настройке виртуального окружения')

Компонент       | Требуется    | Установлено  | Соответствие
--------------------------------------------------------------
python          | 3.12.x       | 3.12.10      | ✓           
scipy           | 1.16.3       | 1.17.0       | x (требуется 1.16.3)
numpy           | 2.0.2        | 2.4.2        | x (требуется 2.0.2)
pandas          | 2.2.2        | 3.0.0        | x (требуется 2.2.2)
scikit-learn    | 1.6.1        | 1.6.1        | ✓           
statsmodels     | 0.14.6       | 0.14.6       | ✓           
matplotlib      | 3.10.0       | 3.10.0       | ✓           
seaborn         | 0.13.2       | 0.13.2       | ✓           
nltk            | 3.9.1        | 3.9.1        | ✓           
missingno       | 0.5.2        | 0.5.2        | ✓           
mlxtend         | 0.23.4       | 0.23.4       | ✓           
graphviz        | 0.21         | 0.21         | ✓           
catboost        | 1.2.8        | 1.2.8        | ✓           
lightgbm        | 4.6.0        | 4.6.0        | ✓           


## **Настройка для облачных сред: [Google Colab](https://colab.research.google.com/?hl=ru)/[Kaggle](https://www.kaggle.com/docs/notebooks)**

Google Colab и Kaggle не поддерживают прямое использование локальных виртуальных окружений Python. 

В этом случае предлагается установить нужные версии библиотек напрямую в среду исполнения.

**ВНИМАНИЕ.** При новом запуске ноутбука с заданиями требуется повторная настройка.

In [2]:
%pip install scikit-learn==1.6.1 statsmodels==0.14.6 matplotlib==3.10.0 seaborn==0.13.2 nltk==3.9.1 missingno==0.5.2 mlxtend==0.23.4 graphviz==0.21 catboost==1.2.8 lightgbm==4.6.0 xgboost==3.1.3 optuna==4.4.0 eli5==0.16.0 shap==0.50.0

Collecting scikit-learn==1.6.1
  Downloading scikit_learn-1.6.1-cp312-cp312-win_amd64.whl.metadata (15 kB)
Collecting statsmodels==0.14.6
  Downloading statsmodels-0.14.6-cp312-cp312-win_amd64.whl.metadata (9.8 kB)
Collecting matplotlib==3.10.0
  Downloading matplotlib-3.10.0-cp312-cp312-win_amd64.whl.metadata (11 kB)
Collecting seaborn==0.13.2
  Downloading seaborn-0.13.2-py3-none-any.whl.metadata (5.4 kB)
Collecting nltk==3.9.1
  Downloading nltk-3.9.1-py3-none-any.whl.metadata (2.9 kB)
Collecting missingno==0.5.2
  Downloading missingno-0.5.2-py3-none-any.whl.metadata (639 bytes)
Collecting mlxtend==0.23.4
  Downloading mlxtend-0.23.4-py3-none-any.whl.metadata (7.3 kB)
Collecting graphviz==0.21
  Downloading graphviz-0.21-py3-none-any.whl.metadata (12 kB)
Collecting catboost==1.2.8
  Downloading catboost-1.2.8-cp312-cp312-win_amd64.whl.metadata (1.5 kB)
Collecting lightgbm==4.6.0
  Downloading lightgbm-4.6.0-py3-none-win_amd64.whl.metadata (17 kB)
Collecting xgboost==3.1.3
  Downloa

## **Настройка локальной среды: [venv](https://docs.python.org/3/library/venv.html)**

**Версия Python: 3.12.x**

На других версиях Python данный способ может не работать.

Откройте терминал (`cmd` в Windows или `Terminal` в macOS/Linux).

In [None]:
python --version # узнать, какая версия Python установлена по умолчанию

Если по умолчанию в системе используется версия Python, отличная от 3.12.x, рекомендуется использовать другие способы настройки (Conda или Google Colab/Kaggle) или [установить pyenv](https://github.com/pyenv/pyenv?tab=readme-ov-file#installation) и использовать его для [установки и использования нужной версии python](github.com/pyenv/pyenv?tab=readme-ov-file#install-additional-python-versions): `pyenv install 3.12.12` (для установки) и `pyenv global 3.12.12` (для использования версии 3.12.12).

### **Шаг 1. Создание окружения**

В папке с файлами для курса (рабочая папка, в рамках которой вы будете использовать окружение):

In [None]:
python -m venv ml2me # можно использовать другое имя окружения (вместо ml2me)

### **Шаг 2. Активация окружения**

- **Windows (PowerShell/CMD):**

In [None]:
.\ml2me\Scripts\activate # или другое имя окружения (вместо ml2me)

- **macOS/Linux:**

In [None]:
source ./ml2me/bin/activate # или другое имя окружения (вместо ml2me)

### **Шаг 3. Установка зависимостей с помощью `requirements.txt`**

Загрузите файл `requirements.txt` в папку с файлами для курса.

In [None]:
pip install -r requirements.txt

### **Шаг 4. Настройка Jupyter**

In [None]:
pip install ipykernel
python -m ipykernel install --user --name=ml2me # или другое имя окружения (вместо ml2me)

После настройки выберите созданное окружение через интерфейс в IDE (например, `Select Kernel` в VSCode, `Kernel` в Jupyter Notebook).

## **Настройка локальной среды: [Conda](https://docs.conda.io/projects/conda/en/latest/user-guide/index.html)**

Установите [Anaconda](https://www.anaconda.com/docs/getting-started/anaconda/install) или [Miniconda](https://www.anaconda.com/docs/getting-started/miniconda/install).

### **Шаг 1. Создание окружения**

Откройте терминал (`cmd` в Windows или `Terminal` в macOS/Linux) и загрузите файл `environment.yml`.

In [None]:
conda env create -f environment.yml

### **Шаг 2. Активация окружения**

In [None]:
conda activate ml2me

### **Шаг 3. Настройка Jupyter**

In [None]:
python -m ipykernel install --user --name=ml2me # можно использовать другое имя окружения (вместо ml2me)

После настройки выберите созданное окружение через интерфейс в IDE (например, `Select Kernel` в VSCode, `Kernel` в Jupyter Notebook).