# `Введение в обработку естественного языка`
<br>

## `Python. Виртуальные окружения`
<br><br>

### `Роман Ищенко (roman.ischenko@gmail.com)`

#### `Москва, 2025`

### `Управление версиями Python с помощью Pyenv`

Pyenv — кроссплатформенный инструмент для управления версиями Python<br>
https://github.com/pyenv/pyenv
<br><br>

Основные возможности:
- Установка/удаление версий Python. Версии существуют независимо и изолированно друг от друга. Это, в том числе, означает, что пакеты, установленные для одной версии, не будут видны для другой
- Позволяет установить глобальную версию Python для пользователя. Эта версия будет использована по умолчанию при выполнении команды __python__
- Позволяет для каждого проекта указать специфическую версию Python. В каталоге проекта будет автоматически использована именно указанная версия
<br><br>

Достоинства:
- Не зависит от Python (то есть, для установки Pyenv в системе не требуется никакая «начальная» установленная версия Python)
- Требует минимальной интеграцией со средой окружения (фактически, только добавления в переменную окружения PATH)
- Не требует прав администратора, может работать локально для отдельного пользователя
<br><br>

Установка Linux/Mac:
```
# Копируем репозиторий локально
git clone https://github.com/pyenv/pyenv.git ~/.pyenv

# Добавляем переменные окружения
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
echo 'command -v pyenv >/dev/null || export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc

# Добавляем инициализацию
echo 'eval "$(pyenv init -)"' >> ~/.bashrc

# Инициализируем среду для работы с pyenv
source ~/.bashrc
```
При необходимости добавляем и в `~/.profile`, `~/.bash_profile` или `~/.bash_login`
<br>

В MacOS возможна установка с помощью пакетного менеджера Homebrew: `brew install pyenv`
<br><br>

Установка в Windows:
```
# Копируем репозиторий локально
git clone https://github.com/pyenv-win/pyenv-win.git "%USERPROFILE%\.pyenv"

# Добавляем переменные окружения
[System.Environment]::SetEnvironmentVariable('PYENV',$env:USERPROFILE + "\.pyenv\pyenv-win\","User")
[System.Environment]::SetEnvironmentVariable('PYENV_ROOT',$env:USERPROFILE + "\.pyenv\pyenv-win\","User")
[System.Environment]::SetEnvironmentVariable('PYENV_HOME',$env:USERPROFILE + "\.pyenv\pyenv-win\","User")

# Добавляем каталоги исполняемых файлов в PATH
[System.Environment]::SetEnvironmentVariable('path', $env:USERPROFILE + "\.pyenv\pyenv-win\bin;" + $env:USERPROFILE + "\.pyenv\pyenv-win\shims;" + [System.Environment]::GetEnvironmentVariable('path', "User"),"User")

```
<br>

Для сборки версий обязательно обязательно заглянуть в раздел `Install Python build dependencies`

В частности, для Ubuntu/Debian/Mint потребуется:
```
sudo apt update; sudo apt install build-essential libssl-dev zlib1g-dev \
libbz2-dev libreadline-dev libsqlite3-dev curl git \
libncursesw5-dev xz-utils tk-dev libxml2-dev libxmlsec1-dev libffi-dev liblzma-dev
```
<br><br>

Использование:<br>
`pyenv <command> [<args>]`
<br><br>
Несколько полезных команд:
- `versions` — список установленных версий
- `install -l` — список доступных для установки версий (там есть anaconda, miniconda)
- `install <version>` — установка версии в систему
- `global <version>` — выбор глобальной версии Python для пользователя
- `local <version>` — выбор версии Python для проекта (каталога)

### `Управление виртуальными окружениями в Python`

Структура установки библиотек/пакетов в Python имеет «плоскую» структуру. Это означает, что не могут использоваться две различные версии одного и того же пакета, даже если они устанавливаются неявно (как зависимости для других пакетов). Кроме того, для разных проектов также могут требоваться разные версии одних и тех же пакетов/библиотек.

Для изоляции проектов с различными зависимости от библиотек друг от друга используются виртуальные окружения

#### Python 2
Используется пакет `virtualenv`
<br><br>
Установка:<br>
`pip install virtualenv`

#### Python 3
Начиная с третьей версии Python для работы с виртуальными окружениями появился стандартный модуль — `venv`
<br><br>

Создание виртуального окружения:<br>
`python -m venv <имя каталога>`
<br><br>
Активация в linux/macos:<br>
`source <каталог окружения>/bin/activate`
<br><br>
Активация в Windows:<br>
`<каталог окружения>\Scripts\activate.bat`
<br><br>
После активации можно установить необходимые пакеты с помощью `pip`. Все установленные внутри виртуального окружения пакеты будут доступны только в нём.
<br><br>
Деактивация:<br>
`deactivate`
<br><br>
После выполнения этой команды библиотеки, установленные внутри виртуального окружения, перестанут быть доступными (до очередной активации)

Плюс такого способа — возможность создать несколько виртуальных окружений для одного проекта. Минус — необходимость помнить, где хранятся виртуальные окружения. Хранить их в каталоге часто бывает неудобно.

### `Управление зависимостями. requirements.txt`

В случае, если необходимо передать проект, требуется каким-то образом указать все модули, которые используются в проекте.
Стандартный механизм для этого — файл `requirements.txt`

Формат содержимого: каждая строка — отдельная зависимость. Синтаксис:<br>
`<имя пакета><отношение><номер версии>`

Например, `pandas==1.2.5` или `pandas>=1.2.0`. В первом случае требуется точная версия, во втором — не меньше указанной

Установка всех перечисленных в файле библиотек производится командой

`pip install -r requirements.txt`

Зависимости собираются вручную. Но для сокращения ручной работы (и для уменьшения вероятности что-то забыть) можно инициализировать файл списком уже установленных в python библиотек

`pip freeze > requirements.txt`

Из недостатков следует отметить невозможность разделить пакеты, которые используются только для разработки от тех, которые требуются для работы проекта в production

### `Управление зависимостями. Модуль Pipenv`

`Pipenv`(https://pipenv.pypa.io/) — модуль обеспечения переносимости и детерминированной установки приложений со всеми зависимостями в различных окружениях.<br>
Обычно используется в паре с инструментом `pyenv`.
<br><br>
Преимущества:<br>
- Обеспечивает большую гибкость и детерминированность по сравнению со стандартным инструментом `requirements.txt`
- Прозрачная работа с виртуальными окружениями (автоматически создаёт для каждого проекта)
<br><br>

Установка:<br>
`pip install pipenv`
<br><br>

Инициализация нового проекта:<br>
`pipenv --python <version>`
<br><br>

Установка требуемых зависимостей для проекта:<br>
`pipenv install`
<br><br>

Запуск виртуального окружения проекта:<br>
`pipenv shell`
<br><br>

Установка нового пакета/библиотеки для проекта:<br>
`pipenv install <имя пакета>`
<br><br>

Для каждого проекта создаются два файла: `Pipfile` и `Pipfile.lock`. Важно передавать (и сохранять в репозитории) эти файлы вместе с остальными файлами проекта. Именно они гарантируют детерминированную установку.

### `Управление зависимостями.Poetry`

`Poetry`(https://python-poetry.org/) — утилита для управления зависимостями и пакетами. Требует версию Python не ниже 3.7<br>
Во многом похожа на `pipenv`.
<br><br>
Отличия:<br>
- Скорость работы
- Работает с toml файлами 
<br><br>

Установка:<br>
`curl -sSL https://install.python-poetry.org | python3`
<br><br>

Создание нового проекта:<br>
`poetry new demo`
<br><br>

Инициализация нового проекта:<br>
`poetry init`
<br><br>

Установка требуемых зависимостей для проекта:<br>
`poetry install --no-root`
<br><br>

Запуск виртуального окружения проекта:<br>
`poetry shell`<br>
Уже не так, а так:<br>
`eval $(poetry env activate)`
<br><br>

Установка нового пакета/библиотеки для проекта:<br>
`poetry add <имя пакета>`
<br><br>

Для каждого проекта создаются два файла: `pyproject.toml` и `poetry.lock`. 