### 1.数据结构

In [5]:
import pandas as pd

# 创建Series（一维数据）
s = pd.Series([1, 3, 5])  
print(s)        # → 0:1, 1:3, 2:5

# 创建DataFrame（二维表格）
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)
print(df) # 输出 →
          #    Name  Age
          # 0 Alice   25
          # 1   Bob   30

### 2.读取数据

In [None]:
# 从CSV文件读取
df = pd.read_csv('data.csv')  
# 从Excel读取
df = pd.read_excel('data.xlsx')

### 3.查看数据

In [None]:
print(df.head(2))   # 查看前2行
print(df.tail(1))    # 查看最后1行
print(df.shape)      # 行数和列数 → (2, 2)
print(df.describe()) # 统计摘要（均值、标准差等）

### 4.数据筛选

In [None]:
# 选择列
ages = df['Age']          # → Series [25, 30]
name_age = df[['Name', 'Age']]  # 多列 → DataFrame

# 按行筛选
row_0 = df.iloc[0]        # 第一行 → Name:Alice, Age:25
row_bob = df[df['Name'] == 'Bob']  # 条件筛选 → Bob的行

# 按位置筛选（行:列）
subset = df.iloc[0:2, 1:3]  # 第0-1行，第1-2列

### 5.处理缺失值

In [None]:
# 删除含缺失值的行
df_clean = df.dropna()  
# 填充缺失值
df_filled = df.fillna(0)          # 用0填充
df_filled = df.fillna(df.mean())  # 用均值填充

### 6.分组与聚合

In [None]:
# 按列分组并聚合
grouped = df.groupby('Name')['Age'].mean()  # 计算每个名字的平均年龄
# 复杂聚合
df.groupby('City').agg({'Salary': ['mean', 'max'], 'Age': 'count'})

### 7.合并数据

In [6]:
# 横向合并（类似SQL JOIN）
df1 = pd.DataFrame({'Key': ['A', 'B'], 'Value': [1, 2]})
df2 = pd.DataFrame({'Key': ['A', 'C'], 'Value': [3, 4]})
merged = pd.merge(df1, df2, on='Key', how='left')  # 左连接

# 纵向合并（堆叠）
combined = pd.concat([df1, df2], axis=0)  # 按行合并

### 8.数据输出

In [None]:
df.to_csv('output.csv', index=False)  # 保存为CSV（不保留索引）
df.to_excel('output.xlsx', sheet_name='Sheet1')