### Pandas 数据结构 - Series

Pandas Series 类似表格中的一个列（column），类似于一维数组，可以保存任何数据类型。

```python
pandas.Series( data, index, dtype, name, copy)
```

- data：一组数据(ndarray 类型)。
- index：数据索引标签，如果不指定，默认从 0 开始。
- dtype：数据类型，默认会自己判断。
- name：设置名称。
- copy：拷贝数据，默认为 False。

In [6]:
import pandas as pd

language = pd.Series(
	[ 'Python', 'Golang', 'Java', 'JavaScript' ],
	index=['P', 'G', 'J', 'JS']
)
print(language)


#  通过 key/value
singer = pd.Series(
	{ 'Jay': '周杰伦', 'Vae': '许嵩', 'Silence': '汪苏泷' },
	name='singer'
)
print(singer)

P         Python
G         Golang
J           Java
JS    JavaScript
dtype: object
Jay        周杰伦
Vae         许嵩
Silence    汪苏泷
Name: singer, dtype: object


### Pandas 数据结构 - DataFrame

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共同用一个索引）。

```python
pandas.DataFrame( data, index, columns, dtype, copy)
```
- data：一组数据(ndarray、series, map, lists, dict 等类型)。
- index：索引值，或者可以称为行标签。
- columns：列标签，默认为 RangeIndex (0, 1, 2, …, n) 。
- dtype：数据类型。
- copy：拷贝数据，默认为 False。

In [10]:
import pandas as pd

data = pd.DataFrame([['Google', 1], ['Bing', 2], ['Yahoo', 3]], columns=['Site', 'Sort'])
print(data)

     Site  Sort
0  Google     1
1    Bing     2
2   Yahoo     3


In [12]:
# 使用 loc 获取指定行的数据，索引从 0 开始
print(data.loc[0])

# 多行以逗号隔开
print(data.loc[[1, 2]])

Site    Google
Sort         1
Name: 0, dtype: object
    Site  Sort
1   Bing     2
2  Yahoo     3


### Pandas CSV 文件

In [21]:
import pandas as pd

# 通过 read_csv 读取 csv 文件
nba_data = pd.read_csv('/Users/h_vk/Downloads/nba.csv')

# 打印前 5 条数据
print(nba_data.head(5))
# 打印后 5 条数据
print(nba_data.tail(5))

# 打印表格的基本信息
print(nba_data.info())

            Name            Team  Number Position   Age Height  Weight  \
0  Avery Bradley  Boston Celtics     0.0       PG  25.0    6-2   180.0   
1    Jae Crowder  Boston Celtics    99.0       SF  25.0    6-6   235.0   
2   John Holland  Boston Celtics    30.0       SG  27.0    6-5   205.0   
3    R.J. Hunter  Boston Celtics    28.0       SG  22.0    6-5   185.0   
4  Jonas Jerebko  Boston Celtics     8.0       PF  29.0   6-10   231.0   

             College     Salary  
0              Texas  7730337.0  
1          Marquette  6796117.0  
2  Boston University        NaN  
3      Georgia State  1148640.0  
4                NaN  5000000.0  
             Name       Team  Number Position   Age Height  Weight College  \
453  Shelvin Mack  Utah Jazz     8.0       PG  26.0    6-3   203.0  Butler   
454     Raul Neto  Utah Jazz    25.0       PG  24.0    6-1   179.0     NaN   
455  Tibor Pleiss  Utah Jazz    21.0        C  26.0    7-3   256.0     NaN   
456   Jeff Withey  Utah Jazz    24.0   

In [18]:
import pandas as pd

singer = pd.DataFrame([
	['周杰伦', '最伟大的作品'],
	['许嵩', '呼吸之野']
], columns= ['Name', 'Album'])

# 通过 to_csv 将内容写入 csv 文件
singer.to_csv('singer.csv')


