### Читаемость кода, оптимизация условных конструкций, наследование

Длинные и особенно вложенные if-statements трудно читаются в коде; если вы напишете программу, в которой условные инструкции занимают под 50 строчек, очень быстро сами запутаетесь. Как избежать путаницы и писать код оптимальнее?

1. Если очень длинное составное условие (особенно если оно вычисляется только один раз, а используется в нескольких местах программы), то можно вынести его в отдельную переменную или функцию.
2. Если много вложенных if-statements, можно применить инвертированную логику (if not x: continue); также стоит подумать, везде ли нужен else. 
3. Можно создать словарь. 
4. Можно использовать принципы ООП, в частности, полиморфизм. 

В чем состоит идея полиморфизма?

В том, что мы определяем, что делает программа, не с помощью условий, а с помощью методов классов, то есть, свойства объекта определяют, что он будет делать. Например, представим себе, что у нас в программе могут быть два объекта: кошка или собака, ну например, мы пишем игру про домашних питомцев, и пользователь может решить завести кошку или собаку. И то, и другое животное должны издавать какие-то звуки. При этом кошка мяукает, а собака лает. Мы **обобщим это свойство, используя абстракцию**, и создадим более общий класс-родитель "животное", у которого будет метод "издавать звуки". Кошка и собака - это будут классы-дети, которые унаследуют все методы своего родителя (особенно не зависящие от их класса, н-р, и у кошки, и у собаки есть кличка и возраст), а часть методов переопределят под себя. Как это будет выглядеть на деле:

In [1]:
class Animal:
    '''Родительский класс'''
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    # любые другие методы
    
    def speak(self):
        raise NotImplementedError
        
class Cat(Animal):
    def speak(self):
        print('Мяу!')
        
class Dog(Animal):
    def speak(self):
        print('Гав!')

Что нам это даст? 

1. Единство интерфейса: теперь, какое бы животное ни завел пользователь, мы можем использовать метод speak, не задумываясь, что конкретно он будет делать. 
2. Можем дорабатывать сами классы внутри себя как угодно, пока они сохраняют прежний интерфейс: в остальной программе ничего не понадобится менять. 
3. Можем добавлять новые классы-наследники: например, в новой версии нашей игры станет возможно заводить попугаев и рыбок. С классом-родителем гарантированно ничего не забудем, а рыбки могут вызывать NotImplementedError :)

### Модули и пространства имен

Модуль - единица организации программ наивысшего уровня, которая упаковывает программный код для многократного использования и предоставляет изолированное пространство имен, что сводит к минимуму конфликты имен переменных внутри программ. 

Обобщая все изученное, стоит напомнить, что в мире питона все - это объекты. У каждого объекта есть свои атрибуты. Модуль - это тоже **объект** (очень высокого уровня), атрибуты модуля - это все объекты, которые в нем находятся, то есть, переменные, функции и классы. 

В более простом смысле модуль - это любой скрипт с расширением .py (есть еще некоторые менее интересные варианты - питон позволяет импортировать модули, написанные на других языках, там чуточку другое расширение, но ведут они себя так же). Каждый скрипт - это модуль, и тот скрипт, который мы запускаем, на самом деле тоже модуль, только самый главный и имеющий имя \_\_main\_\_. 

Как мы импортируем модули и что при этом происходит?

У нас есть два оператора:
- import
- from ... import

(+ можно использовать переименование as)

Что на самом деле они делают? Они не просто копипастят код из импортируемого модуля в наш главный. В момент, когда исполняется оператор import, скрипт модуля **исполняется**, чтобы появились все определенные в нем объекты, а его имя добавляется в пространство имен нашего модуля, и все его объекты делаются его атрибутами. Так, когда пишем:

    import math
    
В пространстве имен нашего главного модуля появляется имя math, а у него, например, math.sqrt.

Выражение "пространство имен" прозвучало уже несколько раз; а это что такое?

Питон делит все имена переменных, функций и классов внутри себя на определенные сегменты, чтобы они друг другу не мешались. Так, у главного запускаемого скрипта есть свое пространство имен, в котором живет все, что мы определили в этом скрипте, + импортированные имена модулей. Что содержится в пространстве имен скрипта, можно посмотреть с помощью команды dir(). С пустыми скобками она показывает содержимое главного модуля, а если указать ей имя импортированного модуля, то она отобразит его атрибуты (то есть, его пространство имен). 

In [2]:
dir()

['Animal',
 'Cat',
 'Dog',
 'In',
 'Out',
 '_',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'exit',
 'get_ipython',
 'quit']

Имена с двойными нижними подчеркиваниями - особые и зарезервированные, из них стоит обратить внимание только на \_\_name\_\_; имена с нижними подчеркиваниями тоже от нас должны быть скрыты, а вот остальные - то, что есть в нашем текущем скрипте (в .ipynb эти имена немного отличаются от .py). 

<img src="1.jpg">

На этой схемке примерно изображено то самое пространство имен. Глобальная область видимости включает в себя все, то, что в ней есть, видно внутри функций, которые определены в главном скрипте. То, что содержится в пространствах имен модулей, доступно в главном скрипте. То, что содержится в функциях и классах, из глобальной области видимости не доступно, мы можем с ними взаимодействовать, только передавая им какие-то объекты. 

Итак, когда мы импортируем какой-то модуль, наш главный скрипт делает следующее:
- ищет модуль с таким названием
- компилирует его в байт-код (что это, можете самостоятельно почитать)
- выполняет код модуля для создания объектов, которые в нем определены

Именно поэтому иногда в скриптах пишут такую вещь:

In [None]:
if __name__ == '__main__':
    ...

Это делается для того, чтобы код в модуле не выполнялся, если этот модуль просто импортировали. Например, вы написали свой собственный токенизатор и хотите его тестировать. Все функции для тестирования могут вызываться внутри конструкции в ячейке выше, а когда будете импортировать свой токенизатор, они вызываться не будут. 

О том, где и как питон ищет модули:
1. Сперва в домашней папке скрипта и в ее подпапках
2. Потом в каталогах PYTHONPATH, если они установлены
3. В каталогах стандартной библиотеки
4. В содержимом любых файлов .pth, если они есть
5. В подкаталоге site-packages, куда устанавливается все, что мы ставим через pip или conda

Поэтому не рекомендуется называть свои скрипты так же, как называются внешние модули, которые вы собираетесь импортировать. Например, называть свой скрипт numpy не очень умно, если вам потом понадобится сам numpy!

Модуль - это один импортируемый скрипт, но бывают и целые библиотеки, то есть, наборы импортируемых скриптов. Как создать целую большую библиотеку? Обычно хочется сложить все скрипты в папочку. В ранних версиях питона (до 3.3) для таких папочек обязательно было еще создавать (можно пустой) файл \_\_init\_\_.py, это и сейчас осмысленно делать. Такой файл запускается, если вы импортируете свою папку целиком. Кстати, как происходит импорт из папки?

Допустим, у меня есть папка dir01, в которой есть подпапка dir02, а в ней модуль script1.py. 

    import dir01.dir02.script1
    
Если хочется импортировать просто dir01, чтобы сразу получить доступ ко всему, что у нее внутри, нужно создать файл \_\_init\_\_.py, внутри которого прописать все необходимые импорты. Этот файл запустится, когда вы импортируете папку или что-то из папки, поэтому там удобно бывает определять какие-нибудь глобальные штуки, подключать базы данных и так далее. 

Также еще можно взять на вооружение зарезервированную переменную \_\_all\_\_, которая будет явно говорить питону, что мы хотим импортировать из модуля, когда пишем from module import \*. Она заполняется подобным образом:

    __all__ = ['func1', 'func2', 'var1', 'var2']

Подводя итог, что из всего вышеописанного необходимо усвоить базовому треку:

1. Первые три пункта упрощения условных инструкций (в ООП можете не вникать)
2. Что происходит, когда пишем import, и для чего нужна строчка if \_\_name\_\_ == '\_\_main\_\_'
3. Постараться уяснить себе про локальную и глобальную область видимости (мы это еще в прошлом семестре обсуждали), помнить, что переменные внутри функций не доступны снаружи, а переменные внутри модулей доступны через имя модуля по точке, потому что они становятся атрибутами. 