# Pandas

## 什么是Pandas？

Pandas被广泛应用于数据清洗、转换、分析以及可视化等领域。Pandas的核心数据结构是Series和DataFrame。

  * **Series:** 一维带标签的数组，可以存储不同数据类型。
  * **DataFrame:** 二维的表格型数据结构，包含一组有序的列，每列可以是不同的数据类型。

## 安装Pandas

```bash
pip install pandas
conda install pandas
```

## 基本用法

```python
import pandas as pd

# 创建一个Series
data = {'a': 0, 'b': 1, 'c': 2}
s = pd.Series(data)
print(s)

# 创建一个DataFrame
data = {'column1': [1, 2, 3], 'column2': [4, 5, 6]}
df = pd.DataFrame(data)
print(df)
```

## 常用操作

  * **选择数据**
      * 根据标签选择：
        ```python
        print(df['column1'])
        ```
      * 根据索引选择：
        ```python
        print(df.loc[0])
        ```
      * 根据位置选择：
        ```python
        print(df.iloc[0])
        ```
  * **筛选数据**
    ```python
    # 筛选column1大于2的行
    print(df[df['column1'] > 2])
    ```
  * **添加/删除列**
    ```python
    # 添加一列
    df['column3'] = [7, 8, 9]
    # 删除一列
    df = df.drop('column2', axis=1)
    ```
  * **读取/写入数据**
      * 读取CSV文件：
        ```python
        df = pd.read_csv('data.csv')
        ```
      * 写入CSV文件：
        ```python
        df.to_csv('output.csv', index=False)
        ```
  * **数据处理**
      * 缺失值处理：
        ```python
        # 填充缺失值
        df.fillna(0, inplace=True)
        ```
      * 数据分组：
        ```python
        grouped = df.groupby('column1')
        print(grouped.mean())
        ```
  * **数据聚合**
    ```python
    print(df.mean())
    print(df.max())
    print(df.std())
    ```