In [2]:
import pandas as pd

### List转换为Series

In [5]:
courses = ['语文', '数学', '英语', '计算机']
data = pd.Series(data=courses)
data

0     语文
1     数学
2     英语
3    计算机
dtype: object

### Dict转换为Series

In [7]:
grades = {'语文': 80, '数学': 90, '英语': 95, '计算机': 82}
data = pd.Series(data=grades)
data

语文     80
数学     90
英语     95
计算机    82
dtype: int64

### 用Numpy创建Series

In [9]:
import numpy as np
s = pd.Series(
    np.arange(10, 100, 10),
    index=np.arange(101, 110),
    dtype='float'
)
s

101    10.0
102    20.0
103    30.0
104    40.0
105    50.0
106    60.0
107    70.0
108    80.0
109    90.0
dtype: float64

### 转换Series的数据类型

In [17]:
s = pd.Series(
    data=['001', '002', '003', '004'],
    index=list('abcd')
)
# s = s.astype(int)
s = s.map(int)
s

a    1
b    2
c    3
d    4
dtype: int64

### 给Series添加元素

In [18]:
data = data.append(
    pd.Series({
    '物理': 99,
    '化学': 78
}))
data

语文     80
数学     90
英语     95
计算机    82
物理     99
化学     78
dtype: int64

### Series的值转换为List

In [19]:
numbers = data.tolist()
numbers

[80, 90, 95, 82, 99, 78]

### 将Series转换为DataFrame

In [24]:
df = pd.DataFrame(data, columns=['grade'])
# print(df)
# 用reset index将Series转换为DataFrame
df = data.reset_index()  # 将作为index的科目名称也变成一列
df.columns = ['course', 'grade']
df

Unnamed: 0,course,grade
0,语文,80
1,数学,90
2,英语,95
3,计算机,82
4,物理,99
5,化学,78


### 使用字典创建DataFrame

In [3]:
df = pd.DataFrame(
    {
        '姓名': ['Tom', 'Jack', 'Lucy'],
        '性别': ['男', '男', '女'],
        '年龄': [19, 20, 18]
    }
)
df

Unnamed: 0,姓名,性别,年龄
0,Tom,男,19
1,Jack,男,20
2,Lucy,女,18


### 设置DataFrame的索引列

In [3]:
data = {
    '姓名': ['Tom', 'Jack', 'Lucy'],
    '性别': ['男', '男', '女'],
    '年龄': [19, 20, 18]
}
df = pd.DataFrame(data)
df.set_index('姓名', inplace=True)
df

Unnamed: 0_level_0,性别,年龄
姓名,Unnamed: 1_level_1,Unnamed: 2_level_1
Tom,男,19
Jack,男,20
Lucy,女,18


### 将索引列改为普通数据列

In [4]:
df.reset_index(inplace=True)
df

Unnamed: 0,姓名,性别,年龄
0,Tom,男,19
1,Jack,男,20
2,Lucy,女,18


### 将DataFrame转换为dict
我们可以通过参数 list、records、series、index、split 和 dict 来改变最终字典的格式。

In [41]:
print(df.to_dict())  # 等价于to_dict('dict')
print(df.to_dict('list'))
print(df.to_dict('records'))
print(df.to_dict('index'))
print(df.to_dict('split'))

{'姓名': {0: 'Tom', 1: 'Jack', 2: 'Lucy'}, '性别': {0: '男', 1: '男', 2: '女'}, '年龄': {0: 19, 1: 20, 2: 18}}
{'姓名': ['Tom', 'Jack', 'Lucy'], '性别': ['男', '男', '女'], '年龄': [19, 20, 18]}
[{'姓名': 'Tom', '性别': '男', '年龄': 19}, {'姓名': 'Jack', '性别': '男', '年龄': 20}, {'姓名': 'Lucy', '性别': '女', '年龄': 18}]
{0: {'姓名': 'Tom', '性别': '男', '年龄': 19}, 1: {'姓名': 'Jack', '性别': '男', '年龄': 20}, 2: {'姓名': 'Lucy', '性别': '女', '年龄': 18}}
{'index': [0, 1, 2], 'columns': ['姓名', '性别', '年龄'], 'data': [['Tom', '男', 19], ['Jack', '男', 20], ['Lucy', '女', 18]]}


### 转换为dict，以某列做key

In [45]:
# print(df.set_index('姓名').T.to_dict('list'))
# print(df.set_index('姓名').to_dict('index'))
print({k: v for k, v in zip(df['姓名'], df.to_dict('records'))})

{'Tom': {'姓名': 'Tom', '性别': '男', '年龄': 19}, 'Jack': {'姓名': 'Jack', '性别': '男', '年龄': 20}, 'Lucy': {'姓名': 'Lucy', '性别': '女', '年龄': 18}}


### 将两列转换为dict

In [5]:
df.set_index('姓名')['年龄'].to_dict()
# dict(zip(df['姓名'],df['年龄']))

{'Tom': 19, 'Jack': 20, 'Lucy': 18}

### 将单列转换为list

In [18]:
# df['性别'].values.tolist()
# df['性别'].tolist()
# df['性别'].drop_duplicates().tolist()  # 去除重复元素

df['score'] = [78, 88, 98]  # 添加一列
df.score.tolist()  # 如果列名是英文，还可以直接用.访问

[78, 88, 98]

### 将多列转换为list

In [19]:
[df[col].tolist() for col in ['姓名',  '性别']]

[['Tom', 'Jack', 'Lucy'], ['男', '男', '女']]

### 将单行转换为list

In [20]:
df.iloc[0].tolist()

['Tom', '男', 19, 78]

### 将多行转换为list

In [21]:
# df.values.tolist()
df[['姓名', '性别']].values.tolist()  # 指定列

[['Tom', '男'], ['Jack', '男'], ['Lucy', '女']]