<a href="https://colab.research.google.com/github/aruaru0/python-codes/blob/main/how_to_make_dataframe.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pandasのデータフレームを作成する方法

## listから作成する

In [36]:
import pandas as pd

df = pd.DataFrame([[1,0.1,'a'],[3,1.2,'b']], columns=['x', 'y', 'z'])
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


In [39]:
df.values, df.columns, df.index

(array([[1, 0.1, 'a'],
        [3, 1.2, 'b']], dtype=object),
 Index(['x', 'y', 'z'], dtype='object'),
 RangeIndex(start=0, stop=2, step=1))

## tupleから作成

In [6]:
import pandas as pd

df = pd.DataFrame(((1,0.1,'a'), (3,1.2,'b')), columns=['x', 'y', 'z'])
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


## dictから作成する

In [5]:
import pandas as pd

df = pd.DataFrame({'x': [1,3], 'y':[0.1,1.2], 'z':['a', 'b']})
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


## numpyから作成する

In [8]:
import pandas as pd
import numpy as np

array = np.array([[1,0.1,'a'],[3,1.2,'b']])
df = pd.DataFrame(array, columns=['x', 'y', 'z'])
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


# CSVファイル関連

# csvファイルから作成

### ヘッダ付き

In [83]:
%%writefile test.csv
x,y,z
1, 0.1, a
3, 1.2, b

Overwriting test.csv


In [40]:
import pandas as pd

df = pd.read_csv('test.csv')
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


In [84]:
%%writefile test.csv
　　　　x, 　　　　y, 　　　z
1, 0.1, a
3, 1.2, b

Overwriting test.csv


In [86]:
import pandas as pd

df = pd.read_csv('test.csv')
df.columns

Index(['　　　　x', ' 　　　　y', ' 　　　z'], dtype='object')

### ヘッダなし

In [None]:
%%writefile test.csv
1, 0.1, a
3, 1.2, b

In [11]:
import pandas as pd

df = pd.read_csv('test.csv', header=None, names=['x', 'y', 'z'])
display(df)

Unnamed: 0,x,y,z
0,x,y,z
1,1,0.1,a
2,3,1.2,b


## 行をスキップして読み込み

In [12]:
%%writefile test.csv
# データ列の説明
# x : 整数
# y : 小数点
# z : 文字列
x, y, z
1, 0.1, a
3, 1.2, b

Overwriting test.csv


In [14]:
import pandas as pd

df = pd.read_csv('test.csv', skiprows=4)
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


### スキップする行を指定

In [19]:
%%writefile test.csv
# データ列の説明
# begin data
x, y, z
1, 0.1, a
3, 1.2, b
# end of data

Overwriting test.csv


In [20]:
import pandas as pd

df = pd.read_csv('test.csv', skiprows=[0,1,5])
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


### 先頭のn行を読み込む

In [23]:
%%writefile test.csv
x, y, z
1, 0.1, a
3, 1.2, b
# end of data
a, b
1,2
3,4

Overwriting test.csv


In [26]:
import pandas as pd

df = pd.read_csv('test.csv', nrows=2) # headerの行は含まれないことに注意
display(df)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


## データ型を指定した読み込み

In [80]:
%%writefile test.csv
x,y,z
1,2,3
4,5,6

Overwriting test.csv


In [87]:
import pandas as pd
df = pd.read_csv('test.csv', dtype={'x': int, 'y': float, 'z': str})
display(df)

print(df.dtypes)

Unnamed: 0,x,y,z
0,1,0.1,a
1,3,1.2,b


　　　　x       int64
 　　　　y    float64
 　　　z      object
dtype: object


In [73]:
import pandas as pd

df = pd.read_csv('test.csv', dtype={'x':int, ' y':float, ' z':str})
display(df)

print(df.dtypes)

Unnamed: 0,x,y,z
0,1,2.0,3
1,4,5.0,6


x       int64
 y    float64
 z     object
dtype: object


In [34]:
# ZIP圧縮されたCSVも読み込める
# URLを指定してCSVを読み込むことも可能
df_web = pd.read_csv(
    'https://raw.githubusercontent.com/nkmk/python-snippets/master/notebook/data/src/sample_header.csv'
)