# Введение в методы анализа данных. Язык Python.

## Лекция 5.  Модули и пакеты
<br><br><br><br>
__Аксентьев Артем (akseart@ya.ru)__

__Ксемидов Борис (nstalker.anonim@yandex.ru)__
<br>

## План

-  PyPI
    - pip
- Пакеты и модули в Python

# PyPi

PyPI (аббр. от англ. Python Package Index — «каталог пакетов Python») — каталог программного обеспечения, написанного на языке программирования

## PIP
pip — это система управления пакетами(библиотеками), которая на данный момент по умолчанию включена в дистрибутив языка. Она используется для установки и управления программными пакетами, написанными на Python.

pip может брать пакеты из двух типов источников:
- PyPi
- Git-репозиторий

## Зачем это нужно?
1. Избежать изобретения "велосипедов"
2. В крупных коммерческих проектах избежать повторяемости одного и того же кода в различных продуктах

## Как работать с pip?

Установка нового пакета:

In [None]:
!pip install numpy

Установка конкретной версии пакета:

In [None]:
!pip install numpy==1.22.1

Удаление пакета:

In [None]:
!pip uninstall numpy

Вывод всех установленных пакетов:

In [None]:
!pip list

Сохранение пакетов для других разработчиков:

In [None]:
!pip freeze > requirements.txt

In [None]:
!pip list --local

Установка пакетов из requirements.txt

In [None]:
!pip install -r requirements_1.txt

## Conda

Список установленных пакетов

In [None]:
!conda list

Установка пакетов:

In [None]:
!conda install numpy

In [None]:
!conda uninstall numpy

Установка из дополнительного репозитория

In [None]:
!conda install -c conda-forge opencv

Просмотр всех доступных виртуальных сред

In [None]:
!conda env list


Воспроизводимость среды:

In [None]:
!conda env export > environment.yml

In [None]:
!conda env create -f environment.yml

# Работа с пакетами

In [None]:
import math

In [None]:
math.pi

In [None]:
from math import pi
pi

Так делать не надо. Ни в коем случае

In [None]:
from math import *

In [None]:
cos(3)

## Как это работает изнутри?

Импорт модуля:
- поиск модуля;
- компиляция;
- запуск.

Поиска модуля, указанного в импорте, интерпретатор Python, выполняет последовательно в ряде директорий(Module Search Path):

- домашняя директория(там где лежит скрипт);
- директории, указанные в переменной окружения PYTHONPATH(можно задать самому);
- директории Standard library(интерпретатор);
- пути прописанные в .pth файлах(обычный текстовый файл с путями);
- пакеты сторонних разработчиков(устанавливаются через pip).

В Python 3 на этапе компиляции создается каталог с именем __pycache__, в нем располагаются файлы с расширением .pyc, в них содержится байт-код.

Запуск модуля -- выполнение строк кода в соответствующем модуле.
__ВАЖНО:__ модуль импортируется только один раз.  Перезагрузить модуль можно с помощью команды imp.reload.

## Ещё интересные вещи про модули:

### Импорт модуля в зависимости от условий

In [None]:
val = int(input("simple math lib [1], adv math lib [2]: "))
if val==1:
    import simplemath as user_math
elif val==2:
    import advmath as user_math

user_math.add(3, 4)

Изменение атрибутов пакетов:

In [None]:
import math
from math import pi

math.pi = 5
math.pi

In [None]:
pi

### Как перезагрузить модуль?

In [None]:
import user_module
user_module.pi

In [None]:
from imp import reload
reload(user_module)

In [None]:
user_module.pi

Что загружено из модуля:

In [None]:
dir(user_module)

## Пакеты

Пакеты -- модули сгруппированные в одной директории

In [None]:
import mymath.constants

In [None]:
mymath.constants.pi

# PEP-8 и модули

Импортировать модули желательно по одному в строке:

In [None]:
import os
import math

In [None]:
# wrong
import os, math

Однако допустимо:

In [None]:
from subprocess import Popen, PIPE

Импорт модулей всегда помещается в начало файла, сразу после любых комментариев модуля и строк документации, а также перед глобальными параметрами и константами модуля.

Импорт модулей должен быть сгруппирован в следующем порядке:

- импорт стандартной библиотеки
- импорт библиотек сторонних разработчиков
- локальный импорт приложения/библиотеки
Вы должны поместить пустую строку между каждой группой импорта.

In [None]:
import math

import numpy

import mymath.constants

Рекомендуется использовать абсолютный импорт, так как он обычно более удобочитаем и, как правило, ведет себя лучше (или, по крайней мере, дает более качественные сообщения об ошибках), если система импорта настроена неправильно:

In [None]:
import mypkg.sibling
from mypkg import sibling
from mypkg.sibling import example

Импорта с подстановочными знаками (from <module> import *) следует избегать, так как он делает неясным, какие имена присутствуют в пространстве имен, что сбивает с толку как читателей, так и многие автоматизированные инструменты.

## Danders names

"Dunders" уровня модуля (т. е. имена с двумя начальными и двумя конечными символами подчеркивания), такие как __all__, __author__, __version__ и т.д., следует размещать после строки документации модуля, но перед любыми операторами импорта, за исключением from __future__ imports ... .

Python требует, чтобы будущие импорты появлялись в модуле перед любым другим кодом, кроме строк документации.

In [None]:
"""This is the example module.

This module does stuff.
"""

from __future__ import barry_as_FLUFL

__all__ = ['a', 'b', 'c']
__version__ = '0.1'
__author__ = 'Cardinal Biggles'

import os
import sys

# Как разбивать на модули:

1. Разделить код на осмысленные части, например:
    - Работа с БД
    - Работа с GUI
    - Вычисления
    - Работа с пользователем
    - Работа с файлами
2. Вынести конфигурационные файлы в отдельный файл:
    - Токены, авторизация и т.д.(Лучше использовать механизм переменных окружения)
    - Параметры(например, прокси)

# Вопросы к экзамену
- Пакеты и модули отличия
- Как импортировать модуль
- Зачем нужен __name__ и __all__
- Общая схема импорта