## 第5章 関数を適用(apply)する
### 5.1 関数の初歩

In [None]:
# pandas, polarsは使用しないブロック
def my_function():
    pass

def my_sq(x):
    return x ** 2

def avg_2(x, y):
    return (x + y)/ 2

my_calc_1 = my_sq(4)
print(my_calc_1)

my_calc_2 = avg_2(10,20)
print(my_calc_2)

### 5.2 applyの基本

In [2]:
import pandas as pd
df = pd.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })
display("元データ", df["a"])
display("各要素を2乗する", df["a"] ** 2)

'元データ'

0    10
1    20
2    30
Name: a, dtype: int64

'各要素を2乗する'

0    100
1    400
2    900
Name: a, dtype: int64

In [3]:
import polars as pl
df = pl.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })
display("元データ", df["a"])
display("各要素を2乗する", df["a"] ** 2)

'元データ'

a
i64
10
20
30


'各要素を2乗する'

a
f64
100.0
400.0
900.0


#### 5.2.1 関数をSeriesに適用する

In [12]:
import pandas as pd
df = pd.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

print("抽出した列aのデータ型", type(df["a"]))
print("抽出した1行目のデータ型", type(df.iloc[0, :]))

def my_sq(x):
    return x ** 2
sq = df["a"].apply(my_sq)
display("Seriesの各要素を2乗したSeries", sq)

def my_exp(x, e):
    return x ** e
ex = df["a"].apply(my_exp, e = 3)
display("Seriesの各要素を3乗したSeries", ex)

抽出した列aのデータ型 <class 'pandas.core.series.Series'>
抽出した1行目のデータ型 <class 'pandas.core.series.Series'>


'Seriesの各要素を2乗したSeries'

0    100
1    400
2    900
Name: a, dtype: int64

'Seriesの各要素を3乗したSeries'

0     1000
1     8000
2    27000
Name: a, dtype: int64

In [11]:
import polars as pl
df = pl.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

print("抽出した列aのデータ型", type(df["a"]))
print("抽出した1行目のデータ型", type(df[0, :]))

def my_sq(x):
    return x ** 2
# polarsのapplyは将来的に削除される
#sq = df["a"].apply(my_sq)
sq = df["a"].map_elements(lambda x: my_sq(x))
display("Seriesの各要素を2乗したSeries", sq)

def my_exp(x, e):
    return x ** e
ex = df["a"].map_elements(lambda elemtn: my_exp(x = elemtn, e = 3))
display("Seriesの各要素を3乗したSeries", ex)

抽出した列aのデータ型 <class 'polars.series.series.Series'>
抽出した1行目のデータ型 <class 'polars.dataframe.frame.DataFrame'>


'Seriesの各要素を2乗したSeries'

a
i64
100
400
900


'Seriesの各要素を3乗したSeries'

a
i64
1000
8000
27000


#### 5.2.2 関数をDataFrameに適用する
#### 5.2.2.1 列ごとの演算
polarsのapplyやmap_rowsには列ごとの処理が無いようなので、この節は省略
#### 5.2.2.2 行ごとの演算

In [16]:
import pandas as pd
df = pd.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

def avg_2_apply(row):
    x = row[0]
    y = row[1]
    return (x + y)/2
display("行ごとに関数を適用する", df.apply(avg_2_apply, axis = 1))

  x = row[0]
  y = row[1]


'行ごとに関数を適用する'

0    15.0
1    25.0
2    35.0
dtype: float64

In [15]:
import polars as pl
df = pl.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

def avg_2_apply(row):
    x = row[0]
    y = row[1]
    return (x + y)/2
#display("行ごとに関数を適用する", df.apply(lambda row: avg_2_apply(row)))
display("行ごとに関数を適用する", df.map_rows(lambda row: avg_2_apply(row)))

'行ごとに関数を適用する'

map
f64
15.0
25.0
35.0


### 5.3 関数のベクトル化

In [21]:
import pandas as pd
df = pd.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

def avg_2(x, y):
    return (x + y)/2
display("2つの列をベクトルのように扱う", avg_2(df["a"], df["b"]))

'2つの列をベクトルのように扱う'

0    15.0
1    25.0
2    35.0
dtype: float64

In [22]:
import polars as pl
df = pl.DataFrame({
    "a": [10, 20, 30],
    "b": [20, 30, 40]
    })

def avg_2(x, y):
    return (x + y)/2
display("2つの列をベクトルのように扱う", avg_2(df["a"], df["b"]))
#display("別の書き方 その1", df.apply(lambda row: avg_2(row[0], row[1])))
display("別の書き方 その2", df.map_rows(lambda row: avg_2(row[0], row[1])))


'2つの列をベクトルのように扱う'

a
f64
15.0
25.0
35.0


'別の書き方 その2'

map
f64
15.0
25.0
35.0
