# **Арифметические операции между объектами в Pandas**

Арифметические операции можно совершать как между Series, так и между DataFrame. Основные математические операции однотипны и производятся поэлементно. Если метки индекса двух Series не совпадают, то будет создана новая метка. Если один из элементов отсутствует в одной из Series, то результатом операции будет NaN. В случае DataFrame всё примерно аналогично - если метки индекса и названия столбцов двух DataFrame не совпадают, то будет создан новый индекс или новый столбец. Если один из элементов отсутствует в одном из DataFrame, то результатом операции будет NaN.


In [None]:
# пример сложения двух Series
import pandas as pd

s1 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s2 = pd.Series([4, 5, 6], index=['a', 'c', 'd'])
s3 = s1 + s2
print(s3)

# a    5.0
# b    NaN
# c    8.0
# d    NaN
# dtype: float64

In [None]:
# пример сложения двух DataFrame

import pandas as pd
import numpy as np

df1 = pd.DataFrame(np.random.randn(3, 2), columns=['a', 'b'])
df2 = pd.DataFrame(np.random.randn(2, 3), columns=['b', 'c', 'd'])
df3 = df1 + df2
print(df3)

#     a         b   c   d
# 0 NaN  0.110268 NaN NaN
# 1 NaN -1.730586 NaN NaN
# 2 NaN       NaN NaN NaN

# вывод такой, так как в df2 отсутствует колонка a, а в df1 отсутстсвуют колонки b, c и d.
# также в df2 всего две строки

Следует отметить относительно операции деления, если делитель равен нулю, то результатом будет inf - бесконечность.

В pandas можно выполнять арифметические операции с константами. В этом случае операция выполняется поэлементно.

In [None]:
# пример арифметических операций с константами
import pandas as pd
import numpy as np

s = pd.Series([1, 2, 3])
df = pd.DataFrame(np.random.randn(3, 2), columns=['a', 'b'])
s1 = s + 1
df1 = df * 2

print(s1)
print(df1)

# 0    2
# 1    3
# 2    4
# dtype: int64
#           a         b
# 0  2.029291 -4.087751
# 1 -0.559872  1.506203
# 2 -0.651024  2.550921

## **Восполнение отсутствующих значений в арифметических операциях**

При выполнении арифметических операций с объектами типа Series и DataFrame, может возникнуть несовпадение индексов элементов. Если какие-то индексы не совпадают, то при выполнении операции для них будет возвращено значение NaN (Not a Number). 

В pandas есть несколько методов, которые можно использовать для восстановления значений NaN в процессе выполнения арифметических операций. Так у любого оператора в Pandas есть свой дубликат в виде функции. Например, аналог операции сложения - функция, точнее метод add.

Конкретно для метода add(), если при выполнении операции сложения двух объектов типа Series или DataFrame находятся элементы с несовпадающими индексами, то при использовании параметра fill_value эти элементы могут быть заменены на значение fill_value.

In [None]:
# пример операции сложения с помощью метода add(), чтобы заменить элементы с отсутствующими индексами
import pandas as pd

s1 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s2 = pd.Series([4, 5, 6], index=['b', 'c', 'd'])

print(s1)

# a    1
# b    2
# c    3
# dtype: int64

print(s2)

# b    4
# c    5
# d    6
# dtype: int64

s3 = s1.add(s2, fill_value=0)

print(s3)

# a    1.0
# b    6.0
# c    8.0
# d    6.0
# dtype: float64

Как видно из результата в примере выше, элементы с индексами 'a' и 'd', которых нет в обоих объектах, появляются в результирующем объекте с значениями NaN. Однако, благодаря параметру fill_value=0, значения NaN заменяются на 0, и мы получаем объект с корректными значениями.

Следует обратить внимание, что в данном примере использовался параметр fill_value=0, но его можно заменить на любое другое значение в зависимости от требований задачи.

У большинства арифметических операций есть параметр fill_value, который может быть использован для замены отсутствующих значений в процессе выполнения операций.

Например, для метода sub() (вычитание) этот параметр используется аналогично методу add(), но в данном случае он будет применен к отсутствующим значениям из объекта, с которого производится вычитание.

Также параметр fill_value может быть использован в методах mul() (умножение), div() (деление),  floordiv(), pow(), которые соответственно выполняют операции умножения, деления, целочисленного деления и возведения в степень.

# **Арифметические операции между Series и DataFrame**

Когда мы выполняем арифметические операции между объектами Series и DataFrame, pandas использует (broadcasting) правило укладывания, чтобы применить операцию к каждому элементу в DataFrame. Это означает, что операция выполняется для каждого столбца (или строки) в DataFrame с каждым элементом в Series. Следует обратить внимание, что при этом происходит автоматическое выравнивание по меткам (индексам) объектов Series и DataFrame.

Если индексы в объекте Series и DataFrame не совпадают, pandas автоматически выравнивает объекты по меткам индекса перед выполнением операции. В случае отсутствия соответствующего значения в одном из объектов, pandas заполняет соответствующую ячейку NaN.


In [None]:
# пример операции между DataFrame и Series
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [10, 20, 30, 40], 'C': [100, 200, 300, 400]})

print(df)

#    A   B    C
# 0  1  10  100
# 1  2  20  200
# 2  3  30  300
# 3  4  40  400

s = pd.Series([0.1, 0.2, 0.3], index=['A', 'B', 'C'])

print(s)

# A    0.1
# B    0.2
# C    0.3
# dtype: float64

print(df + s)

#      A     B      C
# 0  1.1  10.2  100.3
# 1  2.1  20.2  200.3
# 2  3.1  30.2  300.3
# 3  4.1  40.2  400.3

In [None]:
# пример операции между DataFrame и Series с несовпадающими индексами
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [10, 20, 30, 40], 'C': [100, 200, 300, 400]})
s = pd.Series([0.1, 0.2, 0.3, 0.4], index=['B', 'C', 'D', 'E'])

print(df + s)

#     A     B      C   D   E
# 0 NaN  10.1  100.2 NaN NaN
# 1 NaN  20.1  200.2 NaN NaN
# 2 NaN  30.1  300.2 NaN NaN
# 3 NaN  40.1  400.2 NaN NaN

## **Использование методов - операторов**

Для выполнения операций между Series и DataFrame в pandas также можно использовать методы типа add, sub, mul, div и т.д., которые обладают дополнительными параметрами для настройки укладывания.

Параметр axis=0, указывает pandas, что нужно выполнить операцию по строкам. Параметр axis=1 - что по столбцам.

In [None]:
# пример сложения Series и DataFrame при помощи метода add
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [10, 20, 30], 'C': [100, 200, 300]})
s = pd.Series([1, 2, 3])
df_new = df.add(s, axis=0) # дефолтное значение axis=1

print(df_new)

#    A   B    C
# 0  2  11  101
# 1  4  22  202
# 2  6  33  303

df_new2 = df.add(s, axis=1) # можно не указывать axis=1, т.к. значение встаёт по умолчанию

print(df_new2)

#     A   B   C   0   1   2
# 0 NaN NaN NaN NaN NaN NaN
# 1 NaN NaN NaN NaN NaN NaN
# 2 NaN NaN NaN NaN NaN NaN

# если нужно корректно сложить столбцы df с соответствующими номерами строк s, надо переименовать столбцы df или индексы s
s.index = ['A', 'B', 'C']
df_new3 = df.add(s)

print(df_new3)

#    A   B    C
# 0  2  12  103
# 1  3  22  203
# 2  4  32  303

Когда мы складываем DataFrame с другим столбцом этого DataFrame, мы можем использовать оператор сложения (+), так как pandas автоматически выполняет укладывание по столбцам.

In [None]:
# пример, где есть df со столбцами A, B, C, и к нему добавляется столбец D - сумма столбцов A и B
import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [10, 20, 30], 'C': [100, 200, 300]})
df['D'] = df['A'] + df['B']
print(df)

#    A   B    C   D
# 0  1  10  100  11
# 1  2  20  200  22
# 2  3  30  300  33