### Функция Pivot
Функция pivot_table позволяет быстро и просто составлять сводные таблицы. Сформируем таблицу, которая покажет суммарную зарплату футболистов различных национальностей в разных клубах:

      pivot = df.loc[df['Club'].isin(['FC Barcelona','Real Madrid','Juventus','Manchester United'])].pivot_table(values=['Wage'],
      index=['Nationality'],
      columns=['Club'],
      aggfunc='sum')
      display(pivot)

Для начала разберем конструкцию: df.loc[df['Club'].isin(['FC Barcelona','Real Madrid','Juventus','Manchester United'])].

Она позволит отфильтровать датасет по колонке Club, её значение соответствует одному из перечисленных футбольных клубов.

Посмотрим на параметры функции pivot_table:

В параметр values мы передаем колонку, по которой будем рассчитывать сумму агрегирующей функцией.
В параметр index передадим колонку, данные которой будут строками сводной таблицы.
В параметр columns передаем колонку, значения которой будут в столбцах.
В параметр aggfunc передаем агрегирующую функцию. Помнишь, мы проходили их, когда рассматривали функцию groupby? Все эти функции можно применять для сводных таблиц.

In [1]:
import pandas as pd

football = pd.read_csv("football.csv")



In [3]:
pivot = football.loc[football["Club"].isin(["FC Barcelona","Real Madrid","Juventus","Manchester United"])].pivot_table(values=["Wage"],
                                            index=['Nationality'],
                                            columns=['Club'],
                                            aggfunc='sum',
                                            margins=True,
                                            fill_value=0)
display(pivot)

Unnamed: 0_level_0,Wage,Wage,Wage,Wage,Wage
Club,FC Barcelona,Juventus,Manchester United,Real Madrid,All
Nationality,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2
Argentina,565000,205000,206000,0,976000
Belgium,110000,0,230000,240000,580000
Bosnia Herzegovina,0,180000,0,0,180000
Brazil,465000,335000,91000,570000,1461000
Chile,205000,0,215000,0,420000
Costa Rica,0,0,0,195000,195000
Croatia,260000,160000,0,420000,840000
Dominican Republic,0,0,0,140000,140000
Ecuador,0,0,120000,0,120000
England,0,0,478000,0,478000


In [6]:
pivot = football.loc[football['Club'].isin(['FC Barcelona', 'Real Madrid', 'Juventus', 'Mancherseter United'])]
display(pivot)

Unnamed: 0.1,Unnamed: 0,Name,Age,Nationality,Club,Value,Wage,Position,Crossing,Finishing,...,Penalties,Composure,Marking,StandingTackle,SlidingTackle,GKDiving,GKHandling,GKKicking,GKPositioning,GKReflexes
0,0,L. Messi,31,Argentina,FC Barcelona,110500000,565000,RF,84,95,...,75,96,33,28,26,6,11,15,14,8
7,7,L. Suárez,31,Uruguay,FC Barcelona,80000000,455000,RS,77,93,...,85,85,62,45,38,27,25,31,33,37
18,18,M. ter Stegen,26,Germany,FC Barcelona,58000000,240000,GK,15,14,...,25,69,25,13,10,87,85,88,85,90
20,20,Sergio Busquets,29,Spain,FC Barcelona,51500000,315000,CDM,62,67,...,60,90,90,86,80,5,8,13,9,13
32,32,Coutinho,26,Brazil,FC Barcelona,69500000,340000,LW,79,79,...,70,85,55,54,47,12,7,9,14,6
42,42,S. Umtiti,24,France,FC Barcelona,57000000,205000,CB,69,51,...,61,82,90,89,86,15,10,14,12,15
49,49,Jordi Alba,29,Spain,FC Barcelona,38000000,250000,LB,87,73,...,59,79,72,84,85,13,15,13,6,13
53,53,I. Rakitić,30,Croatia,FC Barcelona,46500000,260000,RCM,84,83,...,82,81,72,74,70,14,11,12,5,9
54,54,Piqué,31,Spain,FC Barcelona,34000000,240000,RCB,57,64,...,69,86,91,86,84,10,11,14,15,8
96,96,A. Vidal,31,Chile,FC Barcelona,26000000,205000,CAM,76,75,...,81,81,82,87,86,4,2,4,2,4


In [12]:
pivot = football.loc[football['Club'].isin(['FC Barcelona', 'Real Madrid', 'Juventus', 'Mancherseter United'])].pivot_table(values=["Wage"],# Первый параметр значение которое будет находится на пересечении строки и столбца
                         index=["Nationality"], #В параметр index передадим колонку, данные которой будут строками сводной таблицы.
                         columns=["Club"], #В параметр columns передаем колонку, значения которой будут в столбцах.
                         aggfunc="sum") #Агрегирующая функция
display(pivot)

Unnamed: 0_level_0,Wage,Wage,Wage
Club,FC Barcelona,Juventus,Real Madrid
Nationality,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
Argentina,565000.0,205000.0,
Belgium,110000.0,,240000.0
Bosnia Herzegovina,,180000.0,
Brazil,465000.0,335000.0,570000.0
Chile,205000.0,,
Costa Rica,,,195000.0
Croatia,260000.0,160000.0,420000.0
Dominican Republic,,,140000.0
France,495000.0,145000.0,459000.0
Germany,240000.0,160000.0,355000.0


In [13]:
#Добавляем суммирование по национальностям
pivot = football.loc[football['Club'].isin(['FC Barcelona', 'Real Madrid', 'Juventus', 'Mancherseter United'])].pivot_table(values=["Wage"],# Первый параметр значение которое будет находится на пересечении строки и столбца
                         index=["Nationality"], #В параметр index передадим колонку, данные которой будут строками сводной таблицы.
                         columns=["Club"], #В параметр columns передаем колонку, значения которой будут в столбцах.
                         aggfunc="sum",#Агрегирующая функция
                            margins=True) #Столбец суммарных результатов
display(pivot)

Unnamed: 0_level_0,Wage,Wage,Wage,Wage
Club,FC Barcelona,Juventus,Real Madrid,All
Nationality,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
Argentina,565000.0,205000.0,,770000
Belgium,110000.0,,240000.0,350000
Bosnia Herzegovina,,180000.0,,180000
Brazil,465000.0,335000.0,570000.0,1370000
Chile,205000.0,,,205000
Costa Rica,,,195000.0,195000
Croatia,260000.0,160000.0,420000.0,840000
Dominican Republic,,,140000.0,140000
France,495000.0,145000.0,459000.0,1099000
Germany,240000.0,160000.0,355000.0,755000


In [14]:
#Добавляем значение по умолчанию
pivot = football.loc[football['Club'].isin(['FC Barcelona', 'Real Madrid', 'Juventus', 'Mancherseter United'])].pivot_table(values=["Wage"],# Первый параметр значение которое будет находится на пересечении строки и столбца
                         index=["Nationality"], #В параметр index передадим колонку, данные которой будут строками сводной таблицы.
                         columns=["Club"], #В параметр columns передаем колонку, значения которой будут в столбцах.
                         aggfunc="sum",#Агрегирующая функция
                            margins=True,
                            fill_value=0) #Столбец суммарных результатов
display(pivot)

Unnamed: 0_level_0,Wage,Wage,Wage,Wage
Club,FC Barcelona,Juventus,Real Madrid,All
Nationality,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
Argentina,565000,205000,0,770000
Belgium,110000,0,240000,350000
Bosnia Herzegovina,0,180000,0,180000
Brazil,465000,335000,570000,1370000
Chile,205000,0,0,205000
Costa Rica,0,0,195000,195000
Croatia,260000,160000,420000,840000
Dominican Republic,0,0,140000,140000
France,495000,145000,459000,1099000
Germany,240000,160000,355000,755000


Замена отсутствующих значений
Если в датасете получилось много NaN (Not a Number). Это означает, что на пересечении строки и столбца нет данных, например, в клубе Juventus нет футболистов из Бельгии.

Для того, чтобы заменить NaN на 0, можно применить дополнительный параметр fill_value.

Этот параметр принимает значение, которым заполняются все NaN в сводной таблице:

      pivot = df.loc[df['Club'].isin(['FC Barcelona','Real Madrid','Juventus','Manchester United'])].pivot_table(values=['Wage'],
      index=['Nationality'],
      columns=['Club'],
      aggfunc='sum',
      margins=True,
      fill_value=0)
      display(pivot)

In [23]:
pivot = football.loc[football['Club'].isin(['AS Monaco'])].pivot_table(values=["Wage"],# Первый параметр значение которое будет находится на пересечении строки и столбца
                         index=["Nationality"], #В параметр index передадим колонку, данные которой будут строками сводной таблицы.
                         columns=["Club"], #В параметр columns передаем колонку, значения которой будут в столбцах.
                         aggfunc="sum",#Агрегирующая функция
                            margins=True,
                            fill_value=0) #Столбец суммарных результатов
display(pivot)

Unnamed: 0_level_0,Wage,Wage
Club,AS Monaco,All
Nationality,Unnamed: 1_level_2,Unnamed: 2_level_2
Belgium,47000,47000
Brazil,55000,55000
Colombia,115000,115000
Croatia,70000,70000
France,95000,95000
Italy,48000,48000
Montenegro,79000,79000
Morocco,39000,39000
Poland,86000,86000
Portugal,65000,65000


In [33]:
pivot = football.pivot_table(
    values=["Acceleration"],
    index=["Name"],
    columns=["Club"],
    aggfunc="mean",
    margins=True,
    fill_value=0)
average_speeds = pivot.mean(axis=1)
top_positions = average_speeds.sort_values(ascending=False).head(3)
display(top_positions)

Name
All             63.112312
J. Rodríguez     0.955880
J. Hernández     0.786738
dtype: float64