### Основные понятия объектно-ориентированного программирования (ООП).

Может звучать пугающе, но мы рассмотрим лишь самую верхушку айсберга, достаточную, чтобы понимать, что такое классы в pandas и чем методы (типа `df.value_counts()`)  отличаются от атрибутов (типа `df.shape`). Обещаю, будет коротко и ясно 😉

Итак, работая с **pandas** мы постоянно сталкиваемся с классами - будь то наш любимый **DataFrame** или **Series**, или даже группировка **groupby**.  
В программировании зачастую нам не хватает типов данных, имеющихся по умолчанию - целых чисел, строк и т.д. и мы хотим создать свой тип данных, который будет иметь свои признаки (*атрибуты*) и уметь что-то делать (обладать *методами*)
Создадим для примера класс **Cat**:

In [1]:
#данный код необязательно досконально понимать и уметь применять, достаточно понять концепцию

class Cat:       #создаем новый класс 
        
    def __init__(self, weight, color, paws=4): #указываем, какие параметры будут у нашего котейки
        self.paws=paws      #по умолчанию 4 лапы, вес и цвет при создании указать обязательно
        self.weight = weight
        self.color = color
    
    def eat(self):
        if self.weight < 5:
            print('Котейка весит', self.weight, 'кг. и ест что хочет')
        else:
            print('Котейка весит', self.weight, 'кг. и ест диетический корм')
        
    def sleep(self):
        print('Котейка спит')

Итак, мы объявили некую новую структуру данных под названием Cat, у которой есть такие свойства как *вес*, *цвет* и *количество лап*. Такие свойства называются *атрибутами*. Также мы определили несколько встроенных функций - что любой котейка умеет делать - спать и есть. Такие функции называются *методами класса*.

Итак, мы определили, что мы подразумеваем под котом, как видом. Теперь создадим пару конкретных котиков. Для этого вызовем наш класс и укажем параметры питомцев:

In [2]:
barsik = Cat(4.6, 'white')
ryzhik = Cat(6.7, 'red')

**Cat** - это *класс*, а **barsik** и **ryzhik** - *объекты* этого класса.  

Нечто подобное происходит, когда мы создаем датафрейм:

In [3]:
import pandas as pd

df = pd.DataFrame(data={'Имя': ['Анна', 'Сергей', 'Алексей', 'Сергей', 'Екатерина'], 'Фамилия': ['Егорова', 'Тищенко', 'Маевский', 'Пеньков', 'Никонова'] ,'Январь': [1000, 1300, 800, 1100, 2000], 'Февраль': [1100, 1250, 750, 1100, 1800], 
     'Март': [950, 1320, 900, 1200, 1950]})
df

Unnamed: 0,Имя,Фамилия,Январь,Февраль,Март
0,Анна,Егорова,1000,1100,950
1,Сергей,Тищенко,1300,1250,1320
2,Алексей,Маевский,800,750,900
3,Сергей,Пеньков,1100,1100,1200
4,Екатерина,Никонова,2000,1800,1950


Создали объект `df` класса `pandas.DataFrame`

Но вернемся к нашим питомцам. Итак, у нас в двух переменных два разных котика, имеющих различный вес и цвет. Давайте убедимся в этом. Атрибуты вызываются через точку:

In [4]:
print(barsik.color)
print(ryzhik.color)
print(barsik.weight)
print(ryzhik.weight)

white
red
4.6
6.7


Нечто подобное происходит, когда мы пишем `df.shape` или `df.columns`. Во втором случае мы можем даже вручную этот атрибут поменять. (Например, привести названия колонок к нижнему регистру)

In [5]:
df.shape

(5, 5)

In [6]:
print(df.columns)
df.columns = ['имя', 'фамилия', 'январь', 'февраль', 'март']
df

Index(['Имя', 'Фамилия', 'Январь', 'Февраль', 'Март'], dtype='object')


Unnamed: 0,имя,фамилия,январь,февраль,март
0,Анна,Егорова,1000,1100,950
1,Сергей,Тищенко,1300,1250,1320
2,Алексей,Маевский,800,750,900
3,Сергей,Пеньков,1100,1100,1200
4,Екатерина,Никонова,2000,1800,1950


Мы можем манипулировать атрибутами, как обычными переменными, например, посмотреть, сколько в сумме весят наши питомцы:

In [7]:
barsik.weight + ryzhik.weight

11.3

Вторым важным свойством классов являются *методы*. Это, как я уже писал, нечто вроде встроенных функций. Они позволяют нам прописать некие действия для наших классов. Вы уже многократно их ипользовали в работе. Они вызываются через точку с указанием круглых скобок.

In [8]:
barsik.sleep()

Котейка спит


Нечто подобное происходит, когда мы пишем `df.sort_values(by=...)` Мы берем объект `df` и вызываем один из его методов.

In [9]:
df.sort_values(by='январь')

Unnamed: 0,имя,фамилия,январь,февраль,март
2,Алексей,Маевский,800,750,900
0,Анна,Егорова,1000,1100,950
3,Сергей,Пеньков,1100,1100,1200
1,Сергей,Тищенко,1300,1250,1320
4,Екатерина,Никонова,2000,1800,1950


Таким образом, создав такую сложную структуру данных, мы открываем для себя множество новых возможностей. Например, кормить котейку в зависимости от его веса (этот момент пропиасн в определении метода **eat** класса **Cat**):

In [10]:
barsik.eat()
ryzhik.eat()

Котейка весит 4.6 кг. и ест что хочет
Котейка весит 6.7 кг. и ест диетический корм


Рыжик у нас страдает легким ожирением, поэтому ест диетический корм.

Подведем итог. Класс - это некий чертеж, план нового типа данных. (Класс **Cat**) На его основе создаются объекты этого класса (**barsik** и **ryzhik**). У класса есть *атрибуты* - некие свойства, вызываются через точку (`barsik.color`, `ryzhik.weight`) и *методы* - встроенные функции, описывающие некие действия, вызываются через точку с круглыми скобками (`ryzhik.eat()`).