## Apply trong Pandas DataFrame

`apply()` là một phương thức rất hữu ích trong Pandas DataFrame, cho phép bạn áp dụng một hàm cho từng cột hoặc dòng của DataFrame, giúp bạn thực hiện các phép toán phức tạp hơn so với các hàm thống kê cơ bản.



### Cách sử dụng apply()

```python
df.apply(func, axis=0)
```

* `df`: DataFrame mà bạn muốn áp dụng hàm.
* `func`: Hàm mà bạn muốn áp dụng. Hàm này phải chấp nhận một Series (cột hoặc dòng) làm đầu vào và trả về một giá trị hoặc một Series.
* `axis`: Xác định trục để áp dụng hàm:
    * `axis=0` (mặc định): Áp dụng hàm cho từng cột.
    * `axis=1`: Áp dụng hàm cho từng dòng.

### Ví dụ

#### Áp dụng hàm cho từng cột

```python
import pandas as pd
import numpy as np

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# Tính bình phương của mỗi giá trị trong mỗi cột
print(df.apply(np.square))
#    col1  col2
# 0     1   100
# 1     4   400
# 2     9   900
# 3    16  1600
# 4    25  2500

# Tính tổng của các giá trị trong mỗi cột
print(df.apply(sum))
# col1    15
# col2    150
# dtype: int64
```

#### Áp dụng hàm cho từng dòng

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# Tính tổng của các giá trị trong mỗi dòng
print(df.apply(sum, axis=1))
# 0    11
# 1    22
# 2    33
# 3    44
# 4    55
# dtype: int64
```

#### Định nghĩa hàm riêng

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# Định nghĩa hàm để kiểm tra xem giá trị có lớn hơn 10 hay không
def check_greater_than_10(x):
    return x > 10

# Áp dụng hàm cho cột 'col2'
print(df['col2'].apply(check_greater_than_10))
# 0    False
# 1    False
# 2    True
# 3    True
# 4    True
# Name: col2, dtype: bool
```

### Ưu điểm của apply()

* **Linh hoạt:** Cho phép bạn áp dụng bất kỳ hàm nào cho DataFrame, bao gồm các hàm do bạn tự định nghĩa.
* **Hiệu quả:** Nhanh hơn việc viết vòng lặp thủ công để xử lý từng dòng hoặc cột.
* **Dễ sử dụng:** Cú pháp đơn giản và dễ hiểu.

### Lưu ý

* `apply()` có thể chậm hơn các hàm vector hóa của NumPy và Pandas trong một số trường hợp.
* Khi áp dụng hàm cho từng dòng, hãy chắc chắn rằng hàm của bạn có thể xử lý một Series làm đầu vào.




## Làm sạch dữ liệu trong Pandas DataFrame

Pandas là một thư viện Python mạnh mẽ được sử dụng rộng rãi cho xử lý và phân tích dữ liệu. DataFrame là một trong những cấu trúc dữ liệu chính của Pandas, đại diện cho một bảng dữ liệu với các hàng và cột. Trong thực tế, dữ liệu thường không hoàn hảo và có thể chứa các lỗi, giá trị thiếu, hoặc kiểu dữ liệu không phù hợp. Làm sạch dữ liệu là một bước quan trọng trước khi phân tích, để đảm bảo dữ liệu chính xác và đáng tin cậy.

Dưới đây là một số kỹ thuật phổ biến để làm sạch dữ liệu trong Pandas DataFrame:



### Đổi tên cột

**Lệnh:** `df.columns = ['a','b','c']`

**Giải thích:** Lệnh này thay đổi tên các cột của DataFrame thành `'a'`, `'b'`, và `'c'`.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

df.columns = ['a', 'b']
print(df)
#    a  b
# 0  1  4
# 1  2  5
# 2  3  6
```




### Kiểm tra dữ liệu null

**Lệnh:** `pd.isnull()`, `pd.notnull()`

**Giải thích:**

* `pd.isnull()`: Trả về một DataFrame Boolean, với giá trị `True` cho các ô có giá trị null và `False` cho các ô khác.
* `pd.notnull()`: Trả về một DataFrame Boolean, với giá trị `True` cho các ô không null và `False` cho các ô null.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
df = pd.DataFrame(data)

print(df)
#    col1  col2
# 0     1     4
# 1  None     5
# 2     3  None

print(pd.isnull(df))
#    col1  col2
# 0  False  False
# 1   True  False
# 2  False   True

print(pd.notnull(df))
#    col1  col2
# 0   True   True
# 1  False   True
# 2   True  False
```



### Bỏ dòng/cột có dữ liệu null

**Lệnh:**

* `df.dropna()`: Bỏ toàn bộ dòng có giá trị null.
* `df.dropna(axis=1)`: Bỏ toàn bộ cột có giá trị null.
* `df.dropna(axis=1, thresh=n)`: Bỏ các dòng có nhiều hơn n giá trị null.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
df = pd.DataFrame(data)

print(df)
#    col1  col2
# 0     1     4
# 1  None     5
# 2     3  None

print(df.dropna())
#    col1  col2
# 0     1     4

print(df.dropna(axis=1))
#    col1
# 0     1
# 1  None
# 2     3

print(df.dropna(axis=1, thresh=2))
#    col1  col2
# 0     1     4
```


In [None]:
import pandas as pd

data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
df = pd.DataFrame(data)

print(df)
#    col1  col2
# 0     1     4
# 1  None     5
# 2     3  None

print(df.dropna())
#    col1  col2
# 0     1     4

print(df.dropna(axis=1))

print(df.dropna(axis=1, thresh=2))

   col1  col2
0   1.0   4.0
1   NaN   5.0
2   3.0   NaN



### Thay thế giá trị null

**Lệnh:**

* `df.fillna(x)`: Thay toàn bộ giá trị null bằng giá trị `x`.
* `s.fillna(s.mean())`: Thay giá trị null trong Series `s` bởi giá trị mean của các giá trị trong Series.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
df = pd.DataFrame(data)

print(df)
#    col1  col2
# 0     1     4
# 1  None     5
# 2     3  None

print(df.fillna(0))
#    col1  col2
# 0     1     4
# 1     0     5
# 2     3     0

s = pd.Series([1, None, 3])
print(s.fillna(s.mean()))
# 0    1.0
# 1    2.0
# 2    3.0
# dtype: float64
```



### Chuyển đổi kiểu dữ liệu

**Lệnh:** `s.astype(float)`

**Giải thích:** Lệnh này chuyển đổi kiểu dữ liệu của Series `s` sang kiểu `float`.

**Ví dụ:**

```python
import pandas as pd

s = pd.Series([1, '2', 3])
print(s.astype(float))
# 0    1.0
# 1    2.0
# 2    3.0
# dtype: float64
```



### Thay thế giá trị

**Lệnh:**

* `s.replace(1,'one')`: Thay tất cả các giá trị bằng 1 bởi `'one'`.
* `s.replace([1,3],['one','three'])`: Thay nhiều giá trị cùng lúc.

**Ví dụ:**

```python
import pandas as pd

s = pd.Series([1, 2, 1, 3])
print(s.replace(1, 'one'))
# 0    one
# 1      2
# 2    one
# 3      3
# dtype: object

print(s.replace([1, 3], ['one', 'three']))
# 0      one
# 1        2
# 2      one
# 3    three
# dtype: object
```



### Đổi tên cột

**Lệnh:**

* `df.rename(columns=lambda x: x + 1)`: Đổi tên cột hàng loạt bằng lambda.
* `df.rename(columns={'old_name': 'new_name'})`: Đổi tên cột cụ thể trong DataFrame.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df.rename(columns=lambda x: x + 1))
#    col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df.rename(columns={'col1': 'new_col1'}))
#   new_col1  col2
# 0        1     4
# 1        2     5
# 2        3     6
```



### Đổi index

**Lệnh:**

* `df.set_index('column_one')`: Đổi index trong DataFrame thành cột `'column_one'`.
* `df.rename(index=lambda x: x + 1)`: Đổi index hàng loạt trong DataFrame.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df.set_index('col1'))
#      col2
# col1
# 1        4
# 2        5
# 3        6

print(df.rename(index=lambda x: x + 1))
#   col1  col2
# 1     1     4
# 2     2     5
# 3     3     6
```

**Lưu ý:**

* `pd.isnull()`, `pd.notnull()`, `df.dropna()`, `df.fillna()`, `s.replace()` có thể được áp dụng cho cả Series và DataFrame.
* `df.rename()` có thể được áp dụng cho cả cột và index.
* Luôn kiểm tra kết quả của các lệnh để đảm bảo chúng đã được thực hiện đúng cách.


## Lọc, sắp xếp và nhóm dữ liệu trong Pandas DataFrame

Sau khi làm sạch dữ liệu, bạn có thể muốn lọc, sắp xếp và nhóm dữ liệu để có được những thông tin có ý nghĩa. Pandas cung cấp các chức năng mạnh mẽ để thực hiện những thao tác này một cách dễ dàng.



### Lọc dữ liệu theo điều kiện

**Lệnh:**

* `df[ df[col] > 5 ]`: Lọc ra các dòng thỏa mãn điều kiện `col` lớn hơn 5.
* `df[ df[col] > 100 & df[col] < 200 ]`: Lọc ra các dòng thỏa mãn điều kiện: có giá trị cột `col` trong khoảng 100 đến 200.

**Giải thích:**

* `df[condition]` là cách đơn giản nhất để lọc dữ liệu trong Pandas.
* `condition` là một biểu thức Boolean trả về `True` hoặc `False` cho mỗi dòng.
* Dấu `&` được sử dụng để kết hợp nhiều điều kiện bằng phép AND.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5, 6], 'col2': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     1    10
# 1     2    20
# 2     3    30
# 3     4    40
# 4     5    50
# 5     6    60

print(df[df['col1'] > 3])
#    col1  col2
# 3     4    40
# 4     5    50
# 5     6    60

print(df[df['col2'] > 20 & df['col2'] < 50])
#    col1  col2
# 2     3    30
# 3     4    40
```






### Sắp xếp dữ liệu

**Lệnh:**

* `df.sort_values(col1)`: Sắp xếp dữ liệu trong cột `col1` theo chiều thuận (ascending).
* `df.sort_values(col2, ascending=False)`: Sắp xếp dữ liệu trong cột `col2` theo chiều nghịch (descending).
* `df.sort_values([col1,col2],ascending=[True,False])`: Sắp xếp `col1` theo chiều thuận và `col2` theo chiều nghịch.

**Giải thích:**

* `df.sort_values()` sắp xếp DataFrame theo một hoặc nhiều cột.
* Tham số `ascending` cho biết thứ tự sắp xếp, `True` là chiều thuận, `False` là chiều nghịch.
* Bạn có thể sắp xếp theo nhiều cột bằng cách truyền một list cho tham số `by`.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5, 6], 'col2': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     1    10
# 1     2    20
# 2     3    30
# 3     4    40
# 4     5    50
# 5     6    60

print(df.sort_values('col1'))
#    col1  col2
# 0     1    10
# 1     2    20
# 2     3    30
# 3     4    40
# 4     5    50
# 5     6    60

print(df.sort_values('col2', ascending=False))
#    col1  col2
# 5     6    60
# 4     5    50
# 3     4    40
# 2     3    30
# 1     2    20
# 0     1    10

print(df.sort_values(['col1', 'col2'], ascending=[True, False]))
#    col1  col2
# 0     1    10
# 1     2    20
# 2     3    30
# 3     4    40
# 4     5    50
# 5     6    60
```



### Nhóm dữ liệu

**Lệnh:**

* `df.groupby(col1)`: Nhóm dữ liệu theo cột `col1`.
* `df.groupby([col1, col2])`: Nhóm dữ liệu theo nhiều cột `col1` và `col2`.

**Giải thích:**

* `df.groupby()` tạo ra một đối tượng `GroupBy` cho phép bạn thực hiện các thao tác thống kê trên từng nhóm dữ liệu.
* `df.groupby().mean()` tính mean của mỗi nhóm.
* Bạn có thể sử dụng nhiều hàm thống kê khác như `sum()`, `count()`, `std()`, `max()`, `min()`, `describe()`, v.v.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': ['A', 'A', 'B', 'B', 'C', 'C'], 'col2': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)

print(df)
#   col1  col2
# 0     A    10
# 1     A    20
# 2     B    30
# 3     B    40
# 4     C    50
# 5     C    60

print(df.groupby('col1').mean())
#       col2
# col1
# A      15.0
# B      35.0
# C      55.0

print(df.groupby(['col1', 'col2']).count())
#             col1
# col1 col2
# A    10       1
#      20       1
# B    30       1
#      40       1
# C    50       1
#      60       1
```



### Pivot dữ liệu

**Lệnh:**

`df.pivot_table(index=col1,values=[col2,col3],aggfunc=mean)`: Tạo một Pivot Table, nhóm dữ liệu theo cột `col1`, tính mean của `col2` và `col3`.

**Giải thích:**

* `df.pivot_table()` tạo ra một bảng tổng hợp dữ liệu, nhóm theo các cột được chỉ định.
* `index` là cột được sử dụng để nhóm dữ liệu.
* `values` là cột(cột) được tính toán.
* `aggfunc` là hàm thống kê được áp dụng cho các giá trị trong mỗi nhóm.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': ['A', 'A', 'B', 'B', 'C', 'C'], 'col2': [10, 20, 30, 40, 50, 60], 'col3': [100, 200, 300, 400, 500, 600]}
df = pd.DataFrame(data)

print(df)
#   col1  col2  col3
# 0     A    10   100
# 1     A    20   200
# 2     B    30   300
# 3     B    40   400
# 4     C    50   500
# 5     C    60   600

print(df.pivot_table(index='col1', values=['col2', 'col3'], aggfunc='mean'))
#       col2  col3
# col1
# A      15.0   150.0
# B      35.0   350.0
# C      55.0   550.0
```



## Nối dữ liệu và gộp dữ liệu trong Pandas DataFrame

Trong nhiều trường hợp, bạn cần kết hợp dữ liệu từ nhiều nguồn khác nhau để phân tích. Pandas cung cấp các chức năng để nối và gộp dữ liệu từ nhiều DataFrame.





### Nối dữ liệu theo chiều dọc (append)

**Lệnh:** `df1.append(df2)`

**Giải thích:** Lệnh này nối các dòng của `df2` xuống dưới các dòng của `df1`. Số lượng các cột trong hai DataFrame phải giống nhau.

**Ví dụ:**

```python
import pandas as pd

data1 = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df1 = pd.DataFrame(data1)

data2 = {'col1': [7, 8, 9], 'col2': [10, 11, 12]}
df2 = pd.DataFrame(data2)

print(df1)
#    col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df2)
#    col1  col2
# 0     7    10
# 1     8    11
# 2     9    12

print(df1.append(df2))
#    col1  col2
# 0     1     4
# 1     2     5
# 2     3     6
# 0     7    10
# 1     8    11
# 2     9    12
```




### Nối dữ liệu theo chiều ngang (concat)

**Lệnh:** `pd.concat([df1, df2],axis=1)`

**Giải thích:** Lệnh này nối các cột của `df2` sang phải các cột của `df1`. Số lượng các dòng trong hai DataFrame phải giống nhau.

**Ví dụ:**

```python
import pandas as pd

data1 = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df1 = pd.DataFrame(data1)

data2 = {'col3': [7, 8, 9], 'col4': [10, 11, 12]}
df2 = pd.DataFrame(data2)

print(df1)
#    col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df2)
#    col3  col4
# 0     7    10
# 1     8    11
# 2     9    12

print(pd.concat([df1, df2], axis=1))
#    col1  col2  col3  col4
# 0     1     4     7    10
# 1     2     5     8    11
# 2     3     6     9    12
```



### Join dữ liệu

**Lệnh:** `df1.join(df2, on=col1, how='inner')`

**Giải thích:** Lệnh này kết hợp dữ liệu từ hai DataFrame dựa trên một cột chung.

* `on`: Cột chung được sử dụng để join.
* `how`: Loại join:
    * `'inner'`: Chỉ giữ lại các dòng có giá trị chung trong cột `on` của cả hai DataFrame.
    * `'left'`: Giữ lại tất cả các dòng của DataFrame bên trái (df1), thêm các giá trị null cho các cột trong DataFrame bên phải (df2) nếu không có giá trị chung.
    * `'right'`: Giữ lại tất cả các dòng của DataFrame bên phải (df2), thêm các giá trị null cho các cột trong DataFrame bên trái (df1) nếu không có giá trị chung.
    * `'outer'`: Giữ lại tất cả các dòng của cả hai DataFrame, thêm các giá trị null cho các cột trong DataFrame bên trái hoặc bên phải nếu không có giá trị chung.

**Ví dụ:**

```python
import pandas as pd

data1 = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df1 = pd.DataFrame(data1)

data2 = {'col1': [2, 3, 4], 'col3': [7, 8, 9]}
df2 = pd.DataFrame(data2)

print(df1)
#    col1  col2
# 0     1     4
# 1     2     5
# 2     3     6

print(df2)
#    col1  col3
# 0     2     7
# 1     3     8
# 2     4     9

print(df1.join(df2, on='col1', how='inner'))
#    col1  col2  col3
# 1     2     5     7
# 2     3     6     8

print(df1.join(df2, on='col1', how='left'))
#    col1  col2  col3
# 0     1     4  NaN
# 1     2     5  7.0
# 2     3     6  8.0

print(df1.join(df2, on='col1', how='right'))
#    col1  col2  col3
# 0     2  5.0     7
# 1     3  6.0     8
# 2     4  NaN     9

print(df1.join(df2, on='col1', how='outer'))
#    col1  col2  col3
# 0     1  4.0  NaN
# 1     2  5.0  7.0
# 2     3  6.0  8.0
# 2     4  NaN  9.0
```

## Thống kê dữ liệu trong Pandas DataFrame

Sau khi làm sạch và xử lý dữ liệu, bạn có thể muốn phân tích và khám phá dữ liệu bằng cách sử dụng các thống kê cơ bản. Pandas cung cấp nhiều chức năng tiện ích để tính toán các thống kê phổ biến và thực hiện các phép toán trên DataFrame.



### Thống kê dữ liệu tổng quan

**Lệnh:** `df.describe()`

**Giải thích:** Lệnh này trả về một bảng thống kê mô tả dữ liệu cho các cột số trong DataFrame, bao gồm:

* `count`: Số lượng giá trị không null.
* `mean`: Giá trị trung bình.
* `std`: Độ lệch chuẩn.
* `min`: Giá trị nhỏ nhất.
* `25%`: Phần vị trí 25%.
* `50%`: Phần vị trí 50% (median).
* `75%`: Phần vị trí 75%.
* `max`: Giá trị lớn nhất.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

print(df.describe())
#        col1   col2
# count  5.0   5.0
# mean   3.0   30.0
# std    1.581139  15.811388
# min    1.0   10.0
# 25%    2.0   20.0
# 50%    3.0   30.0
# 75%    4.0   40.0
# max    5.0   50.0
```






### Tính toán các thống kê cơ bản

**Lệnh:**

* `df.mean()`: Tính mean cho tất cả các cột.
* `df.max()`: Tìm giá trị lớn nhất cho mỗi cột.
* `df.min()`: Tìm giá trị nhỏ nhất cho mỗi cột.
* `df.median()`: Tìm giá trị median cho mỗi cột.
* `df.std()`: Tìm giá trị độ lệch tiêu chuẩn cho mỗi cột.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

print(df.mean())
# col1    3.0
# col2    30.0
# dtype: float64

print(df.max())
# col1    5
# col2    50
# dtype: int64

print(df.min())
# col1    1
# col2    10
# dtype: int64

print(df.median())
# col1    3.0
# col2    30.0
# dtype: float64

print(df.std())
# col1    1.581139
# col2    15.811388
# dtype: float64
```



### Tính correlation

**Lệnh:** `df.corr()`

**Giải thích:** Lệnh này tính toán ma trận correlation giữa các cột số trong DataFrame. Correlation đo lường mức độ tương quan tuyến tính giữa hai biến.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50], 'col3': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)

print(df.corr())
#          col1  col2  col3
# col1  1.000000  1.00  1.00
# col2  1.000000  1.00  1.00
# col3  1.000000  1.00  1.00
```

### Đếm giá trị không null

**Lệnh:** `df.count()`

**Giải thích:** Lệnh này đếm số lượng giá trị không null cho mỗi cột trong DataFrame.

**Ví dụ:**

```python
import pandas as pd

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, None, 40, 50], 'col3': [100, 200, 300, None, 500]}
df = pd.DataFrame(data)

print(df.count())
# col1    5
# col2    4
# col3    4
# dtype: int64
```



### Áp dụng hàm cho DataFrame

**Lệnh:**

* `df.apply(np.mean)`: Áp dụng hàm `np.mean()` cho mỗi cột của DataFrame.
* `df.apply(np.max,axis=1)`: Áp dụng hàm `np.max()` cho mỗi dòng dữ liệu.

**Giải thích:**

* `df.apply()` cho phép bạn áp dụng một hàm cho từng cột hoặc dòng của DataFrame.
* `axis=0` (mặc định) áp dụng hàm cho từng cột.
* `axis=1` áp dụng hàm cho từng dòng.

**Ví dụ:**

```python
import pandas as pd
import numpy as np

data = {'col1': [1, 2, 3, 4, 5], 'col2': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

print(df.apply(np.mean))
# col1    3.0
# col2    30.0
# dtype: float64

print(df.apply(np.max, axis=1))
# 0    10
# 1    20
# 2    30
# 3    40
# 4    50
# dtype: int64
```

**Lưu ý:**

* Ngoài các hàm được liệt kê ở trên, bạn có thể sử dụng bất kỳ hàm nào khác của Python hoặc NumPy.
* Bạn có thể sử dụng `df.apply()` để thực hiện các phép toán phức tạp hơn trên dữ liệu.
