# Python 3. Занятие 4


## Объекты и классы

Основная идея ООП - выделить в программе отдельные сущности - объекты.

**Примеры объектов из реальной жизни** - стол, чашка, человек, книга, здание и т.д.
**Примеры объектов в программах** - пользователь, кнопка, сообщение.

У объектов могут быть свои свойства, например, цвет, содержание или имя пользователя. Такие переменные (конкретные характеристики объекта) называются **атрибутами**.

Возможные действия, например, "отправить сообщение", "нанять сотрудника", "нажать кнопку", называются **методами**. Это функции, которые описаны внутри объекта или класса. Они относятся к определенному объекту и позволяют взаимодействовать с ними или другими частями кода. 

Чтобы не создавать для каждого отдельного объекта свои методы (переиспользование кода), существуют классы. 
**Класс** — это «шаблон» для объекта, который описывает его атрибуты и методы Каждый объект — это экземпляр какого-нибудь класса.

**Пример** - пишем систему учета сотрудников. Создадим класс "Сотрудник" с атрибутами: ФИО, должность, подразделение, руководитель, зарплата; и методами: "перевести в другой отдел", "повысить зарплату", "сменить должность", "уволить". Отдельный сотрудник, Вася Пупкин, является объектом - экземпляром класса "Сотрудник".

## Абстракция

Абстрагирование — это способ выделить набор наиболее важных атрибутов и методов и исключить незначимые. Соответственно, абстракция — это использование всех таких характеристик для описания объекта. Важно представить объект минимальным набором полей и методов без ущерба для решаемой задачи.

Пример: объекту класса «программист» вряд ли понадобятся свойства «умение готовить еду» или «любимый цвет». Они не влияют на его особенности как программиста. А вот «основной язык программирования» и «рабочие навыки» — важные свойства, без которых программиста не опишешь.

Набор атрибутов и методов, доступный извне, работает как интерфейс для доступа к объекту. Через них к нему могут обращаться другие структуры данных, причем им не обязательно знать, как именно объект устроен внутри.



## Инкапсуляция

**Каждый объект — независимая структура.** Он содержит в себе все, что ему нужно для работы. Если ему нужна какая-либо переменная, она будет описана в теле объекта, а не наружном коде. Это делает объекты более гибкими. Даже если внешний код перепишут, логика работы не изменится.

Инкапсуляция позволяет спрятать от внешнего кода и других объектов детали реализации того или иного метода. Другим объектам не важно (и не нужно) знать как именно объект выполняет свою задачу, главное - что выполняет :)

Таким образом, внутреннее устройство одного объекта закрыто от других: извне «видны» только значения атрибутов и результаты выполнения методов.

## Наследование

Позволяет создавать классы и объекты, которые похожи друг на друга, но немного отличаются, например, имеют дополнительные атрибуты или другие методы. Более общий класс в таком случае становится «родителем», а более специфичный и подробный — «наследником».

Например, класс "сотрудник" может иметь наследные классы "программист", "аналитик" и "тестировщик", каждый из которых имеет собственные методы, например, "запрограммировать", "проанализировать", "протестировать", а остальные методы и атрибуты класса "сотрудник" будут присутствовать во всех дочерних классах. И наш Вася Пупкин будет и экземпляром класса "сотрудник", и класса "программист".

У одного "родителя" может быть несколько дочерних классов, у одного дочернего класса может быть и несколько родительских.

Наследование позволяет создавать сложные схемы с четкой иерархией "от общего к частному". Это облегчает понимание и масштабирование кода. Не нужно много раз переписывать в разных объектах одни и те же свойства. Достаточно унаследовать эти объекты от одного "родителя", и родительские свойства применятся автоматически.

## Полиморфизм

Одинаковые методы разных классов могут выполнять задачи разными способами. Например, у "сотрудника" есть метод "работать". У "программиста" реализация этого метода будет означать написание кода, а у "тестировщика" — рассмотрение управленческих вопросов. Но глобально и то, и другое будет работой.

Тут важны единый подход и договоренности между специалистами. Если метод называется delete, то он должен что-то удалять. Как именно — зависит от объекта, но заниматься такой метод должен именно удалением. Более того: если оговорено, что «удаляющий» метод называется delete, то не нужно для какого-то объекта называть его remove или иначе. Это вносит путаницу в код.

# Классы в Python

## Объявление класса и экземпляра

В Python объявление класса выполняется следующим образом:

In [None]:
class MyLittleClass(object):  # название класса и родительский класс, родительский класс по умолчанию - object, его можно и не указывать
#class MyLittleClass:
    # Атрибут класса
    color = "blue"
    
    # Метод
    def set_color(self, new_color):
        color = new_color
        print('set color to', color)

Создание объекта - экземпляра класса выглядит так:

In [None]:
obj = MyLittleClass()

In [None]:
type(obj)

Обращение к атрибуту экземпляра выглядит следующим образом:

In [None]:
obj.color

Вызов метода экземпляра выглядит так:

In [None]:
obj.set_color('red')
obj.color

**Почему `color` внутри объекта не поменялся?**

Потому что обращение к атрибутам класса должно иметь форму `self.attribute_name`, а `color` в методе `set_color` -- просто локальная переменная :)

In [None]:
class MyLittleClass2:
    color = "blue"
    
    def set_color(self, new_color):
        self.color = new_color
        print('set color to', self.color)

In [None]:
obj = MyLittleClass2()
obj.color

In [None]:
obj.set_color('red')
obj.color

`self` - ссылка на "себя", на экземпляр класса, для которого хотим получить значение атрибута или вызвать метод. Является первым аргументом метода и используется внутри методов. 

Можем ли мы напрямую поменять значение атрибута экземпляра?

Можем, но это считается нехорошей практикой. Предпочтительнее писать т.н. методы-геттеры (для чтения значений атрибутов) и методы-сеттеры (для записи значений атрибутов)

In [None]:
obj.color = 'green'
obj.color

**Замечание** - в Python все является объектом, даже сам класс, поэтому важно разделять методы и атрибуты экземпляров класса и самого класса:

In [None]:
MyLittleClass2.color

In [None]:
MyLittleClass2().color

## Метод-конструктор

Чтобы каждый раз не устанавливать состояние (значения аргументов) экземпляра класса, можем воспользоваться **конструктором** - особым методом, который вызывается при создании экземпляра класса:

In [None]:
class MyLittleClass3:
    #color = "blue"
    
    def __init__(self, name, color):
        self.color = color
        self.name = name

    def set_color(self, new_color):
        self.color = new_color
        print('set color to', self.color)

In [None]:
obj = MyLittleClass3("Walter", "White")
obj.color

In [None]:
obj.name

In [None]:
obj.occupation

## Динамичность атрибутов

Мы также можем динамически определить атрибуты, которых вообще не было в определении класса:

In [None]:
obj.some_attribute = 42
obj.some_attribute

Поговорим об аргументе `self` в определении метода. Когда мы вызываем метод как `obj.methodname()`, неявно первым аргументом передается ссылка на `obj` в качестве аргумента `self`:

In [None]:
class MyLittleClass4:
    def method_without_self(arg):
        print(arg)
        
    def method_with_self(self, arg):
        print(arg)

In [None]:
obj = MyLittleClass4()
obj.method_with_self('i am an argument')
obj.method_without_self('i am another argument') # здесь мы на самом деле передаем по два аргумента, self и arg

Как вызвать методы без `self`? Они не привязаны к экземпляру класса (потому что не имеют доступа к его локальным данным), зато привязаны к классу:

In [None]:
MyLittleClass4.method_without_self('i am another argument') # а здесь мы передаем только один аргумент

Поскольку все является объектом, то можно и "оторвать" метод от экземпляра:

In [None]:
func = MyLittleClass4.method_without_self
func("hello")

In [None]:
func2 = MyLittleClass4.method_with_self
func2("hello") # передаем один аргумент

Получили ошибку, т.к. не передали объект для аргумента `self`.

In [None]:
obj = MyLittleClass4()
func2(obj, "hello")

А можем и наоборот привязать существующую функцию к объекту:

In [None]:
obj.get_color()

In [None]:
def get_color_function(self):
    return self.color

In [None]:
MyLittleClass4.get_color = get_color_function
obj = MyLittleClass4()
obj.get_color()

Ах да, цвета-то у нас нет. Не проблема - добавим атрибут `color` к экземпляру?

In [None]:
obj.color = 'pink'
obj.get_color()

Но сейчас атрибут `color` есть только у объекта `obj`, создадим новый объект и посмотрим есть ли у него атрибут `color`:

In [None]:
obj2 = MyLittleClass4()
obj2.get_color()

Нужно добавить атрибут не к одному экземпляру класса, а ко всему классу:

In [None]:
MyLittleClass4.color = 'green'
obj3 = MyLittleClass4()
obj3.get_color()

In [None]:
obj3.color == MyLittleClass4.color

In [None]:
obj.color

In [None]:
obj2.color

## Приватность атрибутов

Во многих языках программирования можно регулировать доступ до атрибутов класса от внешнего кода и других классов. Обычно выделяют три уровня доступа:
- публичный - атрибуты доступны как внутри класса, так и из наружнего кода
- защищенный - атрибуты доступны внутри класса и для наследников класса
- приватный - атрибуты доступны только внутри класса

А есть ли в Python приватность атрибутов? Можем ли мы запретить читать и менять атрибуты объекта снаружи (внешним кодом)?

In [None]:
class VeryPrivateDataHolder:
    not_secret = 0     # public
    _secret = 1        # protected
    __very_secret = 2  # private

In [None]:
obj = VeryPrivateDataHolder()

In [None]:
obj.not_secret

In [None]:
obj._secret

In [None]:
obj.__very_secret

Казалось бы, в Python всё-таки есть приватность, но есть нюанс:

In [None]:
obj._VeryPrivateDataHolder__very_secret

Т.е. при желании все же можем получить доступ к "приватным" атрибутом, но делать так не рекомендуется, особенно не со своими классами!

In [None]:
obj._VeryPrivateDataHolder__very_secret = 'new secret'
obj._VeryPrivateDataHolder__very_secret

In [None]:
VeryPrivateDataHolder.__very_secret

## Наследование

Рассмотрим как работает наследование в Python с помощью следующих классов:

In [None]:
class Animal:  # неявно наследуется от класса object
    some_value = "animal"

    def __init__(self):
        print("i am an animal")
    
    def speak(self):
        raise NotImplementedError('i don\'t know how to speak')  # ошибка, показывающая что метод еще не реализован

In [None]:
class Cat(Animal):
    some_value = "cat"

    def __init__(self):
        super().__init__()
        print("i am a cat")
    
    def speak(self):
        print('meoooow')

In [None]:
class Dog(Animal):
    some_value = "dog"
    
    def __init__(self):
        super().__init__()
        print("i am a dog")

In [None]:
class Hedgehog(Animal):
    def __init__(self):
        super().__init__()
        print("i am a hedgehog")

In [None]:
animal = Animal()
print(animal.some_value)
animal.speak()

In [None]:
cat = Cat()

In [None]:
cat.some_value # переопределено

In [None]:
cat.speak()

In [None]:
dog = Dog()

In [None]:
dog.some_value # переопределено

In [None]:
dog.speak()

In [None]:
hedgehog = Hedgehog()

In [None]:
hedgehog.some_value

In [None]:
hedgehog.speak()

Ромбовидное наследование возможно, но не делайте так, пожалуйста!

In [None]:
#      Animal
#    /       \ 
#  Cat       Dog
#    \       /
#      CatDog

In [None]:
class CatDog(Cat, Dog): 
    def __init__(self):
        super().__init__()
        print("i am a CatDog!")

In [None]:
catdog = CatDog()
catdog.some_value

Порядок перечисления родителей важен!

In [None]:
class DogCat(Dog, Cat):  # теперь наоборот
    def __init__(self):
        super().__init__()
        print("i am a CatDog!")

dogcat = DogCat()
dogcat.some_value

# Строки


## Базовый синтаксис

Базовые преобразования строк:

In [None]:
s = 'Lorem ipsum dolor sit amet, consectetur adipiscing elit!!'
s

In [None]:
s.upper()

In [None]:
s.lower()

In [None]:
s.lower().capitalize()

In [None]:
s.title()

## Поиск подстроки в строке

Для проверки есть ли в строке искомая подстрока можно использовать оператор `in`:

In [None]:
'lorem' in s

In [None]:
'lorem' in s.lower()

Чтобы найти где именно есть подстрока в строке удобно использовать методы `find` и `index`:

In [None]:
s.find('ipsum') # возвращает индекс первого вхождения

In [None]:
s.find('nonexistent') # или -1 

In [None]:
s.index('ipsum')

In [None]:
s.index('nonexistent')

## Анализ строки

Можем проверять из каких символов состоит строка:

In [None]:
strings = ['abc', '2', '   ']

print('\t\t'.join('string isalpha isdigit isspace'.split()))
for s in strings:
    print("'" + s + "'", s.isalpha(), s.isdigit(), s.isspace(), sep='\t\t')

Дополнительные методы - `startswith`, `endswith`, `strip`.

In [None]:
'Hello, world!'.startswith('Hel')

In [None]:
'Hello, world!'.endswith('world')

In [None]:
'    Hello world    '.strip()

# Форматирование строк

## f-строки

**f-строки** - более новый и удобный способ форматирования строк, добавлен в Python 3.6:

In [None]:
year = 2023
f'В {year}-м году проходит курс по Python 3' # Обратите внимание на символ f перед строкой

f-строки поддерживают форматирование чисел:

In [None]:
year = 2023
season = 7

# .2f - вещественное число с двумя знаками после запятой
f'В {year: .2f}-м году проходит курс по Python 3'

Внутри f-строк можно выполнять различные операции:

In [None]:
year = 2023

f'В {year}-м году проходит курс по Python 3'

Можно обращаться к элементам списков по индексу:

In [None]:
years = [2023, 2024, 2025]

f'В {years[0]}-м году проходит курс по Python 3'

И даже использовать функции и методы:

In [None]:
year = 2023
season = 7
name = 'Python 3'

f'В {year}-м году проходит курс по {name.upper()}'

# Регулярные выражения

**Регулярные выражения** - формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (`. ˆ $ * + ? { } [ ] | ( )`)

![xkcd-re](https://imgs.xkcd.com/comics/regular_expressions.png)

*Source: [xkcd](https://imgs.xkcd.com/comics/regular_expressions.png)*

В Python для работы с регулярными выражениями существует модуль `re`. 

Для поиска всех непересекающихся вхождений регулярного выражения используется `re.findall`:

In [None]:
import re

string = '__abc__acc__abcd__a6c__a66c'

In [None]:
re.findall(r'abc', string)

In [None]:
re.findall(r'a\dc', string)

In [None]:
re.findall(r'a\w+c', string)

Можем заменять части строки с помощью регулярных выражений:

In [None]:
re.sub(r'a\wc', '***', string)

Регулярки порой сложно дебажить, на помощь приходит https://regex101.com/