In [1]:
import mytools

In [2]:
提示词 = """
## 角色

请扮演经验丰富的Python教学专家，列出pandas包的必要学习内容。

## 背景

我是一个初学者，我的学习目的是使用pandas进行后续的人工智能相关内容的学习。

## 要求

1. 教学内容要精炼。
"""
mytools.render(mytools.dsllm(提示词))

作为一名经验丰富的Python教学专家，针对你的学习目的——使用pandas进行人工智能相关内容的学习，以下是精炼的必要学习内容：

### 1. **基础数据结构**
   - **Series**: 一维标记数组，理解其创建、索引和基本操作。
   - **DataFrame**: 二维表格数据结构，掌握其创建、索引、列操作和基本操作。

### 2. **数据导入与导出**
   - **读取数据**: `pd.read_csv()`, `pd.read_excel()`, `pd.read_sql()` 等，学会从不同格式文件中读取数据。
   - **保存数据**: `df.to_csv()`, `df.to_excel()`, `df.to_sql()` 等，学会将数据保存到不同格式文件中。

### 3. **数据清洗**
   - **处理缺失值**: `df.dropna()`, `df.fillna()`，学会处理数据中的缺失值。
   - **数据转换**: `df.apply()`, `df.map()`, `df.replace()`，学会对数据进行转换和替换。
   - **数据过滤**: `df.query()`, `df.loc[]`, `df.iloc[]`，学会根据条件过滤数据。

### 4. **数据操作**
   - **索引与切片**: `df.loc[]`, `df.iloc[]`，学会使用标签和位置进行数据选择。
   - **数据合并**: `pd.concat()`, `pd.merge()`, `df.join()`，学会合并多个数据集。
   - **分组与聚合**: `df.groupby()`, `df.agg()`，学会对数据进行分组并进行聚合操作。

### 5. **数据分析**
   - **描述性统计**: `df.describe()`, `df.mean()`, `df.sum()` 等，学会计算数据的统计量。
   - **数据透视表**: `pd.pivot_table()`，学会创建数据透视表以进行更深入的分析。

### 6. **时间序列处理**
   - **日期解析**: `pd.to_datetime()`，学会将字符串转换为日期格式。
   - **时间序列操作**: `df.resample()`, `df.shift()`，学会处理时间序列数据。

### 7. **可视化**
   - **基础绘图**: `df.plot()`, `df.hist()`，学会使用pandas内置的绘图功能进行数据可视化。

### 8. **高级功能**
   - **多索引**: `pd.MultiIndex`，学会处理多层索引的数据结构。
   - **性能优化**: `df.eval()`, `df.query()`，学会使用高效的方法进行数据操作。

### 9. **实战练习**
   - **项目实践**: 通过实际项目练习，如数据清洗、分析、可视化等，巩固所学知识。

### 10. **与AI结合**
   - **数据预处理**: 学会如何使用pandas进行数据预处理，为机器学习模型准备数据。
   - **特征工程**: 学会如何使用pandas进行特征选择、特征转换等操作。

通过掌握以上内容，你将能够熟练使用pandas进行数据处理和分析，为后续的人工智能学习打下坚实的基础。

In [3]:
教学大纲 = """
1. 基础数据结构
Series: 一维标记数组，理解其创建、索引和基本操作。
DataFrame: 二维表格数据结构，掌握其创建、索引、列操作和基本操作。
"""
提示词 = f"""
## 角色

请扮演经验丰富的Python教学专家，就我提供的教学大纲生成教学内容。

## 背景

我是一个初学者，我的学习目的是使用pandas进行后续的人工智能相关内容的学习。

## 教学大纲

{教学大纲}

## 要求

1. 教学内容要精炼。
"""

mytools.render(mytools.dsllm(提示词))

### 教学内容：基础数据结构

#### 1. Series（一维标记数组）

**目标**：理解Series的创建、索引和基本操作。

**内容**：

1. **创建Series**：
   - 使用列表创建：`pd.Series([1, 3, 5, 7, 9])`
   - 使用字典创建：`pd.Series({'a': 1, 'b': 2, 'c': 3})`
   - 指定索引：`pd.Series([1, 3, 5], index=['a', 'b', 'c'])`

2. **索引和切片**：
   - 位置索引：`series[0]`
   - 标签索引：`series['a']`
   - 切片：`series[1:3]` 或 `series['b':'c']`

3. **基本操作**：
   - 查看数据：`series.head()`
   - 查看索引：`series.index`
   - 查看值：`series.values`
   - 修改值：`series['a'] = 10`

**示例代码**：
```python
import pandas as pd

# 创建Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)

# 使用字典创建Series
s_dict = pd.Series({'a': 1, 'b': 2, 'c': 3})
print(s_dict)

# 指定索引
s_indexed = pd.Series([1, 3, 5], index=['a', 'b', 'c'])
print(s_indexed)

# 索引和切片
print(s[0])  # 位置索引
print(s_dict['a'])  # 标签索引
print(s[1:3])  # 切片

# 基本操作
print(s.head())  # 查看前几行
print(s.index)  # 查看索引
print(s.values)  # 查看值
s['a'] = 10  # 修改值
print(s)
```

#### 2. DataFrame（二维表格数据结构）

**目标**：掌握DataFrame的创建、索引、列操作和基本操作。

**内容**：

1. **创建DataFrame**：
   - 使用字典创建：`pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})`
   - 使用列表创建：`pd.DataFrame([[1, 4], [2, 5], [3, 6]], columns=['A', 'B'])`
   - 从文件读取：`pd.read_csv('file.csv')`

2. **索引和切片**：
   - 列索引：`df['A']`
   - 行索引：`df.loc[0]` 或 `df.iloc[0]`
   - 切片：`df[1:3]` 或 `df.loc[1:3, 'A':'B']`

3. **列操作**：
   - 添加列：`df['C'] = [7, 8, 9]`
   - 删除列：`df.drop('C', axis=1)`
   - 修改列：`df['A'] = df['A'] * 2`

4. **基本操作**：
   - 查看数据：`df.head()`
   - 查看列名：`df.columns`
   - 查看行索引：`df.index`
   - 查看形状：`df.shape`

**示例代码**：
```python
import pandas as pd

# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df)

# 使用列表创建DataFrame
df_list = pd.DataFrame([[1, 4], [2, 5], [3, 6]], columns=['A', 'B'])
print(df_list)

# 从文件读取
# df_csv = pd.read_csv('file.csv')
# print(df_csv)

# 索引和切片
print(df['A'])  # 列索引
print(df.loc[0])  # 行索引
print(df[1:3])  # 切片

# 列操作
df['C'] = [7, 8, 9]  # 添加列
print(df)
df = df.drop('C', axis=1)  # 删除列
print(df)
df['A'] = df['A'] * 2  # 修改列
print(df)

# 基本操作
print(df.head())  # 查看前几行
print(df.columns)  # 查看列名
print(df.index)  # 查看行索引
print(df.shape)  # 查看形状
```

### 总结

通过以上内容的学习，你应该能够掌握Pandas中Series和DataFrame的基本操作，为后续的人工智能相关内容打下坚实的基础。

In [9]:
# 创建Series：

# 使用列表创建：pd.Series([1, 3, 5, 7, 9])
# 使用字典创建：pd.Series({'a': 1, 'b': 2, 'c': 3})
# 指定索引：pd.Series([1, 3, 5], index=['a', 'b', 'c'])

import pandas as pd

s1 = pd.Series([21,22,35,45])
news23 = {
    'Pxxxxx0' : '小明',
    'Pxxxxx1' : '小李',
    'Pxxxxx2' : '小张',
    'Pxxxxx3' : '小黄',
    'Pxxxxx4' : '小黑',
    'Pxxxxx45' : '小花'
}
s2 = pd.Series(news23)

In [10]:
# 索引和切片：

# 位置索引：series[0]
# 标签索引：series['a']
# 切片：series[1:3] 或 series['b':'c']

print(s2[0])
print(s2['Pxxxxx1'])

小明
小李


In [11]:
s2['Pxxxxx2':'Pxxxxx45']

Pxxxxx2     小张
Pxxxxx3     小黄
Pxxxxx4     小黑
Pxxxxx45    小花
dtype: object

In [15]:
# 基本操作：

# 查看数据：series.head()
# 查看索引：series.index
# 查看值：series.values
# 修改值：series['a'] = 10
s2.head(3)

Pxxxxx0    小明
Pxxxxx1    小李
Pxxxxx2    小张
dtype: object

In [18]:
s2.index

Index(['Pxxxxx0', 'Pxxxxx1', 'Pxxxxx2', 'Pxxxxx3', 'Pxxxxx4', 'Pxxxxx45'], dtype='object')

In [19]:
s2.values

array(['小明', '小李', '小张', '小黄', '小黑', '小花'], dtype=object)

In [21]:
s2['Pxxxxx1'] = '小丽'
s2['Pxxxxx1']

'小丽'

In [25]:
# 创建DataFrame：

# 使用字典创建：pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# 使用列表创建：pd.DataFrame([[1, 4], [2, 5], [3, 6]], columns=['A', 'B'])

df1 = pd.DataFrame({'学号': [1, 2, 3], '姓名': ['小明','小丽','小花'], '总评': [100, 90, 89]})

In [None]:
# 索引和切片：

# 列索引：df['A']
# 行索引：df.loc[0] 或 df.iloc[0]
# 切片：df[1:3] 或 df.loc[1:3, 'A':'B']

In [26]:
df1['总评']

0    100
1     90
2     89
Name: 总评, dtype: int64

In [29]:
df1.loc[0]

'小明'

In [30]:
df1.loc[0,'总评']

100

In [34]:
# 列操作：

# 添加列：df['C'] = [7, 8, 9]
# 修改列：df['A'] = df['A'] * 2
df1['期中'] = [80,89,90]
df1['平时'] = [78,78,78]
df1['总评'] = df1['期中']*0.5 +df1['平时']*0.5