* Pandas 名字衍生自术语 "panel data"（面板数据）和 "Python data analysis"（Python 数据分析）
* Pandas 的主要数据结构是 Series （一维数据）与 DataFrame（二维数据），这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

# Pandas 数据结构

# Objective:
1. 掌握本章节所有操作
2. 独立编写日常报表脚本
3. 独立制作数据分析报表

In [5]:
import pandas as pd

In [6]:
%who

pandas	 pd	 


# Series
```python
pandas.Series( data, index, dtype, name, copy)

data：一组数据(ndarray 类型)。
index：数据索引标签，如果不指定，默认从 0 开始。
dtype：数据类型，默认会自己判断。
name：设置这个Series名称。
copy：拷贝数据，默认为 False。
```


* Series 是一种**类似于一维数组**的对象，它由一组**数据（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）**组成。
* DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共同用一个索引）。


## 1. 建立一个Series instance

In [8]:
import pandas as pd

# 新建一个Series
# 传入一个list
# 数据标签默认从0开始

ls = ["A","B","C","D","E"]

# pandas module 的 Series方法
obj = pd.Series(ls)
print(obj)

0    A
1    B
2    C
3    D
4    E
dtype: object


## 2. 获取index, value

In [10]:
obj.index
# 不包含尾

RangeIndex(start=0, stop=5, step=1)

In [11]:
obj.values

array(['A', 'B', 'C', 'D', 'E'], dtype=object)

## 3. 指定索引

In [12]:
# pandas module 的 Series方法
obj = pd.Series(["A","B","C","D","E"], index = ["a","b","c","d","e"])
print(obj)

a    A
b    B
c    C
d    D
e    E
dtype: object


## 4. 字典为data

In [31]:
ls_data = ["A","B","C","D","E"]
ls_index = ["a","b","c","d","e"]

data = dict(zip(ls_index ,ls_data))
obj = pd.Series(data)
obj

a    A
b    B
c    C
d    D
e    E
dtype: object

* 如果我们只需要字典中的一部分数据，只需要指定需要数据的索引即可，如下实例：

In [30]:
ls_data = ["A","B","C","D","E"]
ls_index = ["a","b","c","d","e"]
data = dict(zip(ls_index ,ls_data))


obj = pd.Series(data, index = ["a","b"])
obj

a    A
b    B
dtype: object

# 读取数据

In [23]:
import pandas as pd

a = [1,2,3]
obj1 = pd.Series(a)
print(obj1[0])
print(obj1[1])
print(obj1[2])

1
2
3


In [28]:
import pandas as pd
b = ["Google", "Runoob", "Wiki"]
obj2 = pd.Series(b, index = ["x","y","z"])
print(obj2)

print(obj2["x"])
print(obj2["y"])
print(obj2["z"])

x    Google
y    Runoob
z      Wiki
dtype: object
Google
Runoob
Wiki


# 设置名称

In [36]:
import pandas as pd
b = ["Google", "Runoob", "Wiki"]
obj3 = pd.Series(b, index = ["x","y","z"],name = "互联网巨头")
obj3

x    Google
y    Runoob
z      Wiki
Name: 互联网巨头, dtype: object