In [None]:
1. Pandas
**主要用途**：数据操作和分析
**功能**：
- 数据清洗和准备
- 数据框（DataFrame）和序列（Series）数据结构
- 数据过滤、分组、聚合和合并
- 时间序列分析

In [None]:
import pandas as pd

# 创建数据框
df = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 过滤年龄大于30的人
filtered_df = df[df['Age'] > 30]

NumPy
**主要用途**：数值计算
**功能**：
- 支持多维数组和矩阵操作
- 提供数学函数库，如线性代数、傅里叶变换、随机数生成


In [None]:
# 创建一个数组
arr = np.array([1, 2, 3, 4, 5])

# 计算数组的平均值
mean = np.mean(arr)

3. Matplotlib
**主要用途**：数据可视化
**功能**：
- 创建静态、交互式和动画的2D图表
- 支持多种图表类型，如折线图、柱状图、散点图、直方图

In [None]:
import matplotlib.pyplot as plt

# 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 创建折线图
plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Line Chart')
plt.show()

4. Seaborn
**主要用途**：统计数据可视化
**功能**：
- 基于Matplotlib，提供更高级别的接口
- 支持绘制复杂的统计图表，如分类图、回归图、矩阵图

In [None]:
import seaborn as sns
import pandas as pd

# 创建数据
df = pd.DataFrame({
    'total_bill': [10, 20, 30, 40, 50],
    'tip': [1, 2, 3, 4, 5],
    'sex': ['Male', 'Female', 'Male', 'Female', 'Male']
})

# 绘制散点图
sns.scatterplot(x='total_bill', y='tip', hue='sex', data=df)

5. SciPy
**主要用途**：科学计算
**功能**：
- 数学函数（如优化、积分、插值、线性代数、统计、傅里叶变换）
- 提供信号处理和图像处理功能


In [None]:
from scipy import optimize

# 定义一个函数
def f(x):
    return x**2 + 5*np.sin(x)

# 寻找函数的最小值
result = optimize.minimize(f, x0=0)

6. Scikit-Learn
**主要用途**：机器学习
**功能**：
- 提供简单高效的工具进行数据挖掘和数据分析
- 支持监督学习和无监督学习算法
- 数据预处理和模型评估工具


In [None]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# 加载数据集
iris = datasets.load_iris()
X, y = iris.data, iris.target

# 拆分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 训练模型
model = LogisticRegression()
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)

Statsmodels
**主要用途**：统计建模和计量经济学
**功能**：
- 估计统计模型
- 进行统计测试
- 探索数据集

In [None]:
import statsmodels.api as sm

# 创建数据
X = sm.add_constant([1, 2, 3, 4, 5])
y = [1, 3, 3, 2, 5]

# 线性回归模型
model = sm.OLS(y, X).fit()
predictions = model.predict(X)
print(model.summary())

Plotly
**主要用途**：交互式数据可视化
**功能**：
- 创建交互式图表和仪表盘
- 支持多种图表类型和动画效果


In [None]:
import plotly.express as px

# 创建数据
df = px.data.iris()

# 绘制散点图
fig = px.scatter(df, x='sepal_width', y='sepal_length', color='species')
fig.show()

 Jupyter Notebook
**主要用途**：交互式编程环境
**功能**：
- 结合代码、文本、公式和可视化的文档
- 便于数据分析和分享