# Основы ООП

## Класс и экземпляр

In [1]:
from collections import Counter

In [2]:
cnt = Counter('khgkrhiurunfumxxer')

Вопрос:
+ что такое cnt, что такое Counter?
+ что мы только что сделали?

### Пример пользовательского класса

In [26]:
class Animal:
    """
    Docstring
    """
 
    # конструктор, вызывается при создании объекта 
    def __init__(self, name, legs, scariness):
        """
        Constructor
        """
        self.name = name # атрибуты (поля) класса
        self.legs = legs
        self.scariness = scariness
        
    
    # метод класса
    def introduce(self): 
        """
        Make animal introduce itself!
        """
        print ("Hello! My name is %s!" % self.name)
    
    # метод класса
    def sound(self):
        """
        What does the animal say?
        """
        print ("Sound!")


+ Название класса - всегда с большой буквы, всегда CamelCase
+ Обязательный первый аргумент у всех методов класса - ***self***, переменная self ссылается на объект класса и позволяет получить доступ к атрибутам и методам. 

### Документация

Встроенная документация в тройных кавычках. Можно напечатать с помощью функции **help**. 
Выдаст нам ифнормацию о том, какие методы есть в классе и документацию к ним. 

In [27]:
help(Animal) # от объекта класса

Help on class Animal in module __main__:

class Animal(builtins.object)
 |  Animal(name, legs, scariness)
 |  
 |  Docstring
 |  
 |  Methods defined here:
 |  
 |  __init__(self, name, legs, scariness)
 |      Constructor
 |  
 |  introduce(self)
 |      Make animal introduce itself!
 |  
 |  sound(self)
 |      What does the animal say?
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



In [28]:
animal = Animal('Animal', 4, 1)
help(animal) # от объекта экземпляра класса

Help on Animal in module __main__ object:

class Animal(builtins.object)
 |  Animal(name, legs, scariness)
 |  
 |  Docstring
 |  
 |  Methods defined here:
 |  
 |  __init__(self, name, legs, scariness)
 |      Constructor
 |  
 |  introduce(self)
 |      Make animal introduce itself!
 |  
 |  sound(self)
 |      What does the animal say?
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



#### dir()

Также информацию о свойствах класса/экземпляра можно получить с помощью функции ***dir()***
Она озвращает имена переменных, доступные в локальной области, либо атрибуты указанного объекта в алфавитном порядке.

In [29]:
dir(Animal)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'introduce',
 'sound']

In [30]:
dir(animal)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'introduce',
 'legs',
 'name',
 'scariness',
 'sound']

**Задание:**
+ вывести 3 наиболее частых символа из текста ридми репозитория нашего курса на гитхабе (https://github.com/eszakharova/py_prog2021-22#readme) с помощью Counter
+ подсказака: если найти правильную ссылку, то можно сразу получить сырой текст, и не парсить html. 

In [31]:
help(Counter)

Help on class Counter in module collections:

class Counter(builtins.dict)
 |  Counter(*args, **kwds)
 |  
 |  Dict subclass for counting hashable items.  Sometimes called a bag
 |  or multiset.  Elements are stored as dictionary keys and their counts
 |  are stored as dictionary values.
 |  
 |  >>> c = Counter('abcdeabcdabcaba')  # count elements from a string
 |  
 |  >>> c.most_common(3)                # three most common elements
 |  [('a', 5), ('b', 4), ('c', 3)]
 |  >>> sorted(c)                       # list all unique elements
 |  ['a', 'b', 'c', 'd', 'e']
 |  >>> ''.join(sorted(c.elements()))   # list elements with repetitions
 |  'aaaaabbbbcccdde'
 |  >>> sum(c.values())                 # total of all counts
 |  15
 |  
 |  >>> c['a']                          # count of letter 'a'
 |  5
 |  >>> for elem in 'shazam':           # update counts from an iterable
 |  ...     c[elem] += 1                # by adding 1 to each element's count
 |  >>> c['a']                          #

In [32]:
import requests

In [33]:
resp = requests.get('https://raw.githubusercontent.com/eszakharova/py_prog2021-22/main/README.md')

In [34]:
cnt = Counter(resp.text)

In [35]:
cnt.most_common(3)

[(' ', 1559), ('-', 205), ('|', 121)]

## Атрибуты экземпляра

При создании класса в принципе ничего не мешает нам инициалирировать атрибуты  в любом методе, в любом месте. Но обычно все атрибуты стоит создавать внутри констуктора для того, чтобы все экземпляры класса имели одинаковую структуру (одинаковый набор атрибутов вне зависимости от вызванных методов). 

In [36]:
animal = Animal(name='Doggy', legs=4, scariness=8) # экземпляр класса
print(animal.scariness)
animal.sound()
animal.introduce()

8
Sound!
Hello! My name is Doggy!


In [37]:
animal.sound

<bound method Animal.sound of <__main__.Animal object at 0x7fcc3005a810>>

Каждый экземпляр класса имеет свои значения атрибутов. Можно менять их после создания объекта, можно создавать новые. 

In [38]:
animal2 = Animal('Spidy', 8, 225)
print(animal2.name)
animal2.name = 'Spider' # меняем значение атрибута name
print(animal2.name)

Spidy
Spider


In [39]:
animal3 = Animal('Monster', legs=1.5, scariness=1000)
print(animal3.legs)
animal3.legs = 100 # меняем значение атрибута legs
print(animal3.legs)

1.5
100


In [40]:
animal2.new_attr = 10
# отобразится в dir
dir(animal2)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'introduce',
 'legs',
 'name',
 'new_attr',
 'scariness',
 'sound']

In [41]:
animal2.new_attr

10

In [42]:
# новый атрибут появляется только у того экземпляра, у которого его создали (не у всех)
dir(animal2) == dir(animal3)

False

In [43]:
animal3.new_attr

AttributeError: 'Animal' object has no attribute 'new_attr'

## Атрибуты класса

У класса также могут быть свои поля, которые принадлежат не объекту экземпляра класса, а объекту класса.

In [44]:
class Animal:
   
    fav_food = 'pizza' # атрибут класса, вне __init__ и без self
    
    
    def __init__(self, name, legs, scariness):
        self.name = name 
        self.legs = legs
        self.scariness = scariness
    
    def introduce(self): 
        print ("Hello! My name is %s!" % self.name)
    
    def sound(self):
        print ("Sound!")

    def tell_fav_food(self):
        print("I like %s!" % self.fav_food) # обращаемся с помощью self!
    

In [45]:
animal = Animal(name='Doggy', legs=4, scariness=8)
animal2 = Animal('Spidy', 8, 225)
animal3 = Animal('Monster', legs=1.5, scariness=1000)

In [46]:
animals = [animal, animal2, animal3]
for animal_ in animals:
    print(animal_.fav_food) # доступ через экземпляр

pizza
pizza
pizza


In [47]:
Animal.fav_food # доступ через класс

'pizza'

In [48]:
Animal.name # к атрибутам экземпляра доступ через объект класса мы получить не можем. как вы думаете почему?

AttributeError: type object 'Animal' has no attribute 'name'

Значение атрибута класса нельзя изменить через его экземпляр. Если попробовать это сделать так, как в коде ниже, то у экземпляра класса создается атрибут экземпляра с таким же именем. При этом значение этого атрибута у объекта класса и всех других его экземпляров не изменится.

In [49]:
animal.fav_food = 'salad'
animal.fav_food

'salad'

Доступ к атрибуту класса через переменную fav_food у этого экземпляра потерялся, так как она теперь ссылается на другой объект. Но обратиться к атрибуту класса мы все еще можем, он никуда не делся. 

In [50]:
animal.__class__.fav_food # __class__ ссылается на объект класса 

'pizza'

У остальных экземпляров атрибуты остались прежними

In [51]:
print(animal3.fav_food, Animal.fav_food) 

pizza pizza


Можно поменять атрибут класса через объект класса

In [52]:
Animal.fav_food = 'sandwich'

In [53]:
print(animal2.fav_food, animal3.fav_food) # значение fav_food изменилось у всех объектов, где мы не перезаписывали атрибут экземпляра

sandwich sandwich


In [54]:
# как вы думаете, что выведет код?
print(animal.fav_food)

salad


In [55]:
print(animal.__class__.fav_food)

sandwich


## Объекты в питоне и их удаление

В питоне все является объектом и к тому же экземпляром какого-то класса: число, строка, словарь, массив, экземпляр встроенного класса, экземпляр пользовательского класса, сам класс, функция. 

Объект - участок в памяти, у которого обязательно присутсвуют два поля: **тип** и **счётчик ссылок**. У каждого объекта есть уникальный идентификатор, который возвращает функция ***id()***. Идентификатор является адресом объекта в памяти.

Функция ***type()*** возвращает тип объекта - название класса, экземпляром которого является объект. 

Мы можем обращаться к объектам и что-то сними делать с помощью переменных, которые ссылаются на нужный объект. 

### type()

In [56]:
# число
my_number = 13
print(type(my_number))

<class 'int'>


In [57]:
print(type(13))

<class 'int'>


In [58]:
# функция
def my_func(number: int):
    return 13*number
print(type(my_func))

<class 'function'>


In [59]:
# экземпляр класса
print(type(cnt))
print(type(animal))

<class 'collections.Counter'>
<class '__main__.Animal'>


In [60]:
# класс
print(type(Counter))

<class 'type'>


In [61]:
# int - тоже класс
print(type(int))

<class 'type'>


In [62]:
print(type(type))

<class 'type'>


### id()

Оператор ***is*** как раз таки сравнивает id объектов. 

In [63]:
my_str = 'abc'

In [64]:
print(id(my_str))

140515053344496


In [65]:
print(hex(id(my_str)))

0x7fcc35d716f0


In [66]:
my_second_str = my_str

In [67]:
print(my_str is my_second_str)
print(id(my_str) == id(my_second_str))

True
True


In [68]:
my_number = 1234567
my_new_number = 1234567

In [69]:
# разные объекты 
my_number is my_new_number

False

In [70]:
# одинаковые value
my_number == my_new_number

True

### Количество ссылок и del()

Встроенная функция ***del()*** удаляет переменную (и соответственно ссылку между переменной и объектом), счетчик ссылок уменьшается на 1. В случае если счетчик ссылок на объект равен нулю, объект удаляется из памяти. 

Посмотреть сколько существует ссылок на объект можно с помощью функции ***sys.getrefcount()*** https://docs.python.org/3/library/sys.html#sys.getrefcount

In [71]:
import sys

In [72]:
a = Counter('abc')
b = a
c = b

In [73]:
# на 1 больше ожидаемого, тк создается еще одна временная ссылка на объект из аргумента функции
sys.getrefcount(a)

4

In [74]:
del b
sys.getrefcount(a) 

3

### Сборщик мусора и циклические ссылки

Проблема - что делать в подобном случае?

In [75]:
class A:
    pass

class B:
    pass

In [76]:
a = A()
b = B()

In [77]:
# закрученная в замкнутый цикл ссылка: а ссылается на б, который ссылается на а, который ссылается на б
# это значит, что счетчик ссылок никогда не будет равным 0, даже если мы удалим переменные а и б
a.b = b
b.a = a

Для этого в питоне существует сборщик мусора (garbage collecor), который умеет находить циклические ссылки на объекты, к которым уже нет доступа из кода, и удалять такие объекты из памяти:

In [78]:
import ctypes
import gc

# выключаем циклический GC
gc.disable()  

# cписок ссылается сам на себя
lst = []
lst.append(lst)

# сохраняем адрес списка lst
lst_address = id(lst)

# удаляем переменную lst
del lst

# словари ссылаются друг на друга
object_1 = {}
object_2 = {}
object_1['obj2'] = object_2
object_2['obj1'] = object_1

# сохраняем адрес 
obj_address = id(object_1)

# удаляем ссылки
del object_1, object_2

# раскомментируйте для запуска ручной сборки объектов с циклическими ссылками
# gc.collect()

# проверяем счетчик ссылок
# используется from_address из ctypes для доступа к объектам по адресу памяти (по id)
print(ctypes.c_long.from_address(obj_address).value)
print(ctypes.c_long.from_address(lst_address).value)

1
1


### Деструктор

Деструктор объекта - метод ***\_\_del\_\_***, вызывается, когда все ссылки на объект удалены. То есть в момент, когда объект удаляется из памяти. 

In [79]:
class SomeClass:
    
    #конструктор, можно писать аргументы со значением по умолчанию
    def __init__(self, name='some object'):
        self.name = name
        print('Constructor called, %s created!' % self.name) 
    
    # деструктор
    def __del__(self): 
        print('Destructor called, %s deleted!' % self.name) 

In [92]:
obj = SomeClass('my object')

Constructor called, my object created!


In [93]:
obj2 = obj

In [94]:
obj3 = obj2

**Задание:** 
+ вызовите деструктор
+ вызовите деструктор не используя del

In [95]:
# для вызова деструктора нужно привести счетчик ссылок на объект к 0
# например удалив все переменные, которые на него ссылаются с помощью del

In [96]:
del obj

In [97]:
del obj2

In [98]:
# последняя ссылка на объект уничтожена, объект удаляется из памяти, вызывается деструктор
del obj3

Destructor called, my object deleted!


In [99]:
# если не использовать del, то нужно сделать так, чтобы переменные не ссылались на наш объект
# переопределим их, пусть ссылаются на другие объекты

In [100]:
obj = SomeClass('my object')

Constructor called, my object created!


In [101]:
obj2 = obj

In [102]:
obj3 = obj2

In [103]:
obj = 1

In [104]:
obj2 = 2

In [105]:
# последняя ссылка на объект уничтожена, объект удаляется из памяти, вызывается деструктор
obj3 = 3

Destructor called, my object deleted!


**Задание**:    
+ Нужно написать класс ***Sentence***, конструктор котрого получает на вход предложение. 
+ Атрибуты могут быть любые, подумайте, как вам удобно будет хранить данные о предложении. 
+ Возможно будет удобно написать еще и класс Word, для хранения информации о слове
+ У этого класса должен быть метод ***replace_nouns***, который получает в качестве аргумента существительное, заменяет все встречающиеся в предложении существительные на это существительное в нужной форме (чтобы получилось грамматичное предложение), согласует по роду глаголы и прилагательные, если нужно, и печатает получившееся предложение (знаки перпинания можно игнорировать).

+ [Руководство пользователя pymorphy2](https://pymorphy2.readthedocs.io/en/latest/user/guide.html)

In [106]:
!pip install pymorphy2



In [107]:
# поставить слово в нужную форму с помощью pymorphy
import pymorphy2
morph = pymorphy2.MorphAnalyzer()
cats_parsed = morph.parse('котиков')[0]

In [112]:
pear_parsed = morph.parse('яблоки')[0]

In [113]:
pear_parsed

Parse(word='яблоки', tag=OpencorporaTag('NOUN,inan,neut plur,accs'), normal_form='яблоко', score=0.526315, methods_stack=((DictionaryAnalyzer(), 'яблоки', 583, 9),))

In [114]:
dir(pear_parsed.tag)

['ANIMACY',
 'ASPECTS',
 'CASES',
 'FORMAT',
 'GENDERS',
 'INVOLVEMENT',
 'KNOWN_GRAMMEMES',
 'MOODS',
 'NUMBERS',
 'PARTS_OF_SPEECH',
 'PERSONS',
 'POS',
 'RARE_CASES',
 'TENSES',
 'TRANSITIVITY',
 'VOICES',
 '_CYR2LAT',
 '_EXTRA_INCOMPATIBLE',
 '_GRAMMEME_INCOMPATIBLE',
 '_GRAMMEME_INDICES',
 '_LAT2CYR',
 '_NON_PRODUCTIVE_GRAMMEMES',
 '_NUMERAL_AGREEMENT_GRAMMEMES',
 '_POS',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__len__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 '_assert_grammemes_are_known',
 '_assert_grammemes_initialized',
 '_cyr',
 '_cyr_grammemes_cache',
 '_from_internal_grammeme',
 '_from_internal_tag',
 '_grammemes_cache',
 '_grammemes_tuple',
 '_init_grammemes',
 '_is_unknown',
 '_str'

In [115]:
pear_parsed.inflect({cats_parsed.tag.case, cats_parsed.tag.number}).word # нам нужны число и падеж

'яблоки'

In [148]:
import re

# удобно завести отдельный класс для слов, и хранить все нужные нам признаки в атрибутах этого класса 
# для быстрого доступа к ним
class Word:

    def __init__(self, text: str, parsed: pymorphy2.analyzer.Parse):
        self.text = text
        self.parsed = parsed
        self.pos = parsed.tag.POS
        self.number = parsed.tag.number

    def inflect_by_noun(self, inflection_tag: pymorphy2.tagset.OpencorporaTag):
        """ 
        Согласовать слово с переданным существительным 
        (в случае существительного - поставить в то же число и падеж)
        """
        case = inflection_tag.case
        number = inflection_tag.number
        gender = inflection_tag.gender
        inflected = None
        
        # существительное ставим в нужное число и падеж
        if self.pos == 'NOUN':
            inflected = self.parsed.inflect({case, number})
        # прилагательные и причастия ставим в нужный род
        # если число множественное, то даже род согласовывать не надо
        elif self.pos in ['ADJF', 'ADJS', 'PRTF', 'PRTS'] and self.number == 'sing':
            inflected = self.parsed.inflect({gender})
        # глагол в прошедшем времени ставим в нужный род
        # если число множественное, то даже род согласовывать не надо
        elif self.pos == 'VERB' and self.parsed.tag.tense == 'past' and self.number == 'sing':
            inflected = self.parsed.inflect({gender})
        # если нам не нужно менять форму слова или если inflect вернул None
        # (inflect возвращает None, если не получилось просклонять, надо это учесть, 
        # чтобы не упасть неожиданно c AttributeError, пытаясь найти атрибут word у None)
        if not inflected:  
            return self.text
        return inflected.word


class Sentence:

    def __init__(self, text: str, analyzer: pymorphy2.MorphAnalyzer):
        self. text = text
        # лучше не создавать анализатор для каждого предложения, 
        # а сделать это один раз и передавать его в виде аргумента
        self.analyzer = analyzer
        # токенизируем просто регуляркой, т.к. сохранять знаки препинания не требуется
        self.words = re.findall('([a-zA-Zа-яА-я\-]+)', text)
        self.words_parsed = self.parse_words()

    def parse_words(self) -> list:
        result = []
        for word in self.words:
            # берем наиболее вероятный разбор, иногда будут ошибки из-за омонимии
            # но сейчас наша цель - познакомиться с классами, а не сделать идеальную программу
            word_parsed = self.analyzer.parse(word)[0]
            result.append(Word(word, word_parsed))
        return result

    def replace_nouns(self, noun: str):
        result = []
        noun_word = Word(noun, self.analyzer.parse(noun)[0])
        for word in self.words_parsed:
            if word.pos == 'NOUN':
                # переданное существительное "согласовываем" с тем, которое оно заменит в предложении 
                result.append(noun_word.inflect_by_noun(word.parsed.tag))
            else:
                # все остальные слова согласовываем (если нужно) с переданным существительным
                result.append(word.inflect_by_noun(noun_word.parsed.tag))
        return ' '.join(result).capitalize()
        

In [149]:
# пример работы
s = Sentence('Мама стирала раму.', morph)
s.replace_nouns('котик')
# 'Котик мыл котика'

'Котик стирал котика'

In [150]:
s = Sentence('Маленькая девочка бежала за красивой бабочкой', morph)
s.replace_nouns('котик')
# неправильно из-за омонимии, но хотя бы по роду все согласовано

'Маленький котик бежал за красивом котиком'

In [156]:
s = Sentence('Поющий мальчик бежал за толстым енотом', morph)
s.replace_nouns('кошечка')
# тут повезло

'Поющая кошечка бежала за толстой кошечкой'

In [153]:
s = Sentence('Маленькие мальчики думали о красивой ржи', morph)
s.replace_nouns('котик')
# и тут повезло

'Маленькие котики думали о красивом котике'

In [154]:
s = Sentence('Маленькие мальчики бежали за красивыми бабочками', morph)
s.replace_nouns('котик')
# и здесь 

'Маленькие котики бежали за красивыми котиками'

In [158]:
s = Sentence('красивый попугай сидел на стуле', morph)
s.replace_nouns('кошечка')

'Красивая кошечка сидела на кошечке'

Если бы мы делали что-то подобное, но без использования классов:

In [159]:
def inflect(parsed_word, inflection_tag):
        case = inflection_tag.case
        number = inflection_tag.number
        gender = inflection_tag.gender
        inflected = None
        
        # существительное ставим в нужное число и падеж
        if parsed_word.tag.POS == 'NOUN':
            inflected = parsed_word.inflect({case, number})
        # прилагательные и причастия ставим в нужный род
        elif parsed_word.tag.POS in ['ADJF', 'ADJS', 'PRTF', 'PRTS'] and parsed_word.tag.number == 'sing':
            inflected = parsed_word.inflect({gender})
        # глагол в прошедшем времени ставим в нужный род
        elif parsed_word.tag.POS == 'VERB' and parsed_word.tag.tense == 'past' and parsed_word.tag.number == 'sing':
            inflected = self.parsed.inflect({gender})
        # если нам не нужно менять форму слова или если inflect вернул None
        # (inflect возвращает None, если не получилось просклонять, надо это учесть, 
        # чтобы не упасть неожиданно c AttributeError, пытаясь найти атрибут word у None)
        if not inflected:  
            return parsed_word.word
        return inflected.word
    
def parse_words(words, analyzer):
    result = []
    for word in words:
        # берем наиболее вероятный разбор, иногда будут ошибки из-за омонимии
        # но сейчас наша цель - познакомиться с классами, а не сделать идеальную программу
        result.append(analyzer.parse(word)[0])
    return result
        
def replace_nouns(noun, sentence, analyzer):
    result = []
    # токенизируем просто регуляркой, т.к. сохранять знаки препинания не требуется
    words = re.findall('([a-zA-Zа-яА-я\-]+)', sentence)
    words_parsed = parse_words(words, analyzer)
    noun_parsed = analyzer.parse(noun)[0]
    for parsed_word in words_parsed:
        if parsed_word.tag.POS == 'NOUN':
            result.append(inflect(noun_parsed, parsed_word.tag))
        else:
            result.append(inflect(parsed_word, noun_parsed.tag))
    return ' '.join(result).capitalize()
    

In [160]:
replace_nouns('котик', 'Красивые попугаи сидели на стуле', morph)


'Красивые котики сидели на котике'

В данном случае сделанное через функции выглядит в целом нормально, но есть некоторые минусы:

+ Сложнее читать код и понимать, что происходит.
+ Более громоздкие вызовы, надо передавать много аргументов.
+ Не хранит состояние.
    + Если мы захотим подставить в одно и то же предложение 10000 разных существительных, то в варианте с функциями разбор предложения будет делаться каждый раз и будет долго, в варианте с классами - один раз при инициализации и будет намного быстрее.
    + Если мы захотим делать с предложениями что-то еще, например заменять глаголы или прилагательные (независимо от существительных) и напишем несколько новых функциий, то опять же при вызове каждой новой функции разбор будет делаться заново. И если не вынести токенизацию и разбор в отдельные функции, то будет еще и много дублирующегося кода.
    + Можно вынести токенизацию и разбор предложения из функции и хранить предложения в виде список разобранных слов, но код станет менее понятным и аккуртным. К тому же список в отличие от класса не дает нам никакой информации о том, что он из себя представляет и что лежит внутри.


In [161]:
%%time 
for i in range(10000):
    replace_nouns('котик', 'Красивые попугаи сидели на стуле', morph)

CPU times: user 6.47 s, sys: 0 ns, total: 6.47 s
Wall time: 6.47 s


In [162]:
%%time
s = Sentence('Красивые попугаи сидели на стуле', morph)
for i in range(10000):
    s.replace_nouns('котик')

CPU times: user 1.92 s, sys: 0 ns, total: 1.92 s
Wall time: 1.92 s
