# 学习 Python 数据结构

导入 pandas 第三方库

In [None]:
import pandas as pd

## Pandas 数据结构之 DataFrame

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。
DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共同用一个索引）。

DataFrame 构造方法如下：

pandas.DataFrame(data, index, columns, dtype, copy)

参数说明：

data：一组数据(ndarray、series, map, lists, dict 等类型)。

index：行索引（标签）值。

columns：列标签，默认为 RangeIndex (0, 1, 2, …, n) 。

dtype：数据类型。

copy：拷贝数据，默认为 False

### 使用 ndarrays 创建一个 DataFrame 类型数据

In [None]:
# 创建 Series 和 DataFrame 数据结构
data = {
    '姓名': [3, 33, 22],
    '年龄': [5, 55, 55],
    '收入': [1, 2, 3],
    '门牌号': [3, 4, 5]
}
my_df = pd.DataFrame(data)
print(my_df)

### 使用列表创建 DataFrame 类型数据

In [None]:
list_data = [[3,5,7,100],[33,55,77,11],[22,55,22,11]]
my_df2 = pd.DataFrame(list_data,columns=['姓名','年龄','收入','门牌号'])
my_df2

**自定义行索引名称**

In [None]:
list_data2 = [[3,5,7,100],[33,55,77,11],[22,55,22,11]]
my_df3 = pd.DataFrame(list_data2,index =['第一行','第二行','第三行'] ,columns=['姓名','年龄','收入','门牌号'])
my_df3

### 使用字典创建  DataFrame 类型数据

In [None]:
my_dict = [
    {'姓名':3,'年龄':5,'收入':7,'门牌号':100},
    {'姓名':33,'年龄':55,'收入':77,'门牌号':11},
    {'姓名':22,'年龄':55,'收入':22,'门牌号':11},
]
my_df4 = pd.DataFrame(my_dict,index =['第一行','第二行','第三行'])
my_df4

## Pandas 数据结构之 Series

Pandas Series 类似表格中的一个列（column），类似于一维数组，可以保存任何数据类型。

Series 由索引（index）和列组成，函数如下：

```python
Series(data, index, dtype, name, copy)
```
参数说明：

data：一组数据(ndarray 类型)。

index：数据索引标签，如果不指定，默认从 0 开始。

dtype：数据类型，默认会自己判断。

name：设置名称。

copy：拷贝数据，默认为 False。

### 创建 Series 数据结构

In [None]:
my_series = pd.Series(['悟空', '唐僧', 520, 13.14])
my_series

In [None]:
my_series2 = pd.Series([1, 2, 520, 1314])
my_series2

### 检查一下数据类型

In [None]:
type(my_series)

### 自定义索引名称

In [None]:
my_series3 = pd.Series([1, 2, 520, 1314], ['a', 'b', 'c', 'd'])
my_series3

### 通过字典来创建 Series

In [None]:
dict = {'a': 1, 'b': 2, 'c': 520, 'd': 1314}
my_series4 = pd.Series(dict)
my_series4

In [None]:
my_series5 = pd.Series([1, 2, 3, 4,5])
my_series5



**如果只需要字典中的一部分数据，只需要指定需要数据的索引即可**

In [None]:
data = {'a':1,'b':2,'c':3}
my_series6 = pd.Series(data,['c','b'])
my_series6

设置 Series 名称参数

In [None]:
my_series7 = pd.Series([1,2,3,4],name='wukong_series')
my_series7

# 练习题

In [None]:
1 创建一个 Series 数据类型： 包含用户名、密码、年龄、生日、家庭地址信息。
2 创建一个 DataFrame 数据类型： 包含账单编号、账单类目、账单名称、单价、数量信息。