# 1. インストールとインポート

In [1]:
!pip install pandas

In [2]:
import pandas as pd
import numpy as np

## 2. Series

In [3]:
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)

0    1
1    2
2    3
3    4
4    5
dtype: int64


## 3. DataFrame

In [4]:
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df)

   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9


# 4. CSVファイルの読み込みと書き込み

## 4.1 CSVファイルの読み込み

In [5]:
df = pd.read_csv('sample.csv')
print(df)

   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9


## 4.2 CSVファイルへの書き込み

In [6]:
df.to_csv('output.csv', index=False)

# 5. データの選択と操作

## 5.1 カラムの選択

In [7]:
col_A = df['A']
print(col_A)

0    1
1    2
2    3
Name: A, dtype: int64


## 5.2 行の選択

In [8]:
row_1 = df.loc[1]
print(row_1)

A    2
B    5
C    8
Name: 1, dtype: int64


## 5.3 条件による選択

In [9]:
filtered_df = df[df['A'] > 1]
print(filtered_df)

   A  B  C
1  2  5  8
2  3  6  9


# 6. データの統計情報

## 6.1 基本的な統計情報

In [10]:
stats = df.describe()
print(stats)

         A    B    C
count  3.0  3.0  3.0
mean   2.0  5.0  8.0
std    1.0  1.0  1.0
min    1.0  4.0  7.0
25%    1.5  4.5  7.5
50%    2.0  5.0  8.0
75%    2.5  5.5  8.5
max    3.0  6.0  9.0


## 6.2 平均値

In [11]:
mean = df.mean()
print(mean)

A    2.0
B    5.0
C    8.0
dtype: float64


## 6.3 中央値

In [12]:
median = df.median()
print(median)

A    2.0
B    5.0
C    8.0
dtype: float64


## 6.4 最大値・最小値

In [13]:
max_value = df.max()
min_value = df.min()
print(max_value)
print(min_value)

A    3
B    6
C    9
dtype: int64
A    1
B    4
C    7
dtype: int64


# 7. データの欠損値処理

In [14]:
data = {'A': [1, np.nan, 3], 'B': [np.nan, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df)

     A    B  C
0  1.0  NaN  7
1  NaN  5.0  8
2  3.0  6.0  9


## 7.1 欠損値の検出

In [15]:
missing_values = df.isnull()
print(missing_values)

       A      B      C
0  False   True  False
1   True  False  False
2  False  False  False


## 7.2 欠損値の削除

In [16]:
df_dropna = df.dropna()
print(df_dropna)

     A    B  C
2  3.0  6.0  9


## 7.3 欠損値の補完

In [17]:
df_filled = df.fillna(value=0)
print(df_filled)

     A    B  C
0  1.0  0.0  7
1  0.0  5.0  8
2  3.0  6.0  9


# 8. データの結合と整形

## 8.1 データフレームの結合（横方向）

In [18]:
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'C': [7, 8, 9], 'D': [10, 11, 12]})
df_concat = pd.concat([df1, df2], axis=1)
print(df_concat)

   A  B  C   D
0  1  4  7  10
1  2  5  8  11
2  3  6  9  12


## 8.2 データフレームの結合（縦方向）

In [19]:
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
df_concat = pd.concat([df1, df2], axis=0)
print(df_concat)

   A   B
0  1   4
1  2   5
2  3   6
0  7  10
1  8  11
2  9  12


## 8.3 データフレームのマージ

In [20]:
left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                     'A': ['A0', 'A1', 'A2', 'A3'],
                     'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                      'C': ['C0', 'C1', 'C2', 'C3'],
                      'D': ['D0', 'D1', 'D2', 'D3']})

merged = pd.merge(left, right, on='key')
print(merged)

  key   A   B   C   D
0  K0  A0  B0  C0  D0
1  K1  A1  B1  C1  D1
2  K2  A2  B2  C2  D2
3  K3  A3  B3  C3  D3


## 8.4 ピボットテーブルの作成

In [21]:
data = {'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
        'B': ['one', 'one', 'two', 'two', 'one', 'one'],
        'C': ['x', 'y', 'x', 'y', 'x', 'y'],
        'D': [1, 2, 3, 4, 5, 6]}

df = pd.DataFrame(data)

pivot_table = df.pivot_table(values='D', index=['A', 'B'], columns=['C'])
print(pivot_table)

C          x    y
A   B            
bar one  5.0  6.0
    two  NaN  4.0
foo one  1.0  2.0
    two  3.0  NaN
