In [2]:
from sklearn.datasets import load_iris
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置中文字体
plt.rcParams['axes.unicode_minus'] = False    # 解决负号显示问题


In [None]:
# 加载鸢尾花数据集
iris = load_iris()

# 将数据转换为DataFrame格式，便于查看和处理
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# 添加目标变量（花的种类）
iris_df['target'] = iris.target

# 查看数据集的前几行
print("鸢尾花数据集预览：")
print(iris_df.head())

# 显示基本统计信息
print("\n数据集基本信息：")
print(iris_df.describe())

In [None]:
# 1. 散点图矩阵
plt.figure(figsize=(10, 10))
sns.pairplot(iris_df, hue='target', diag_kind='hist')
plt.suptitle('鸢尾花数据集特征散点图矩阵', y=1.02)
plt.show()

# 2. 箱线图
plt.figure(figsize=(12, 6))
iris_df.boxplot(by='target')
plt.title('不同品种鸢尾花的特征分布箱线图')
plt.show()

# 3. 小提琴图
plt.figure(figsize=(12, 6))
features = iris.feature_names
for i, feature in enumerate(features):
    plt.subplot(2, 2, i+1)
    sns.violinplot(x='target', y=feature, data=iris_df)
    plt.title(f'{feature}的分布')
plt.tight_layout()
plt.show()

# 4. 热力图（相关性矩阵）
plt.figure(figsize=(8, 6))
correlation = iris_df.corr()
sns.heatmap(correlation, annot=True, cmap='coolwarm')
plt.title('特征相关性热力图')
plt.show()

# 5. 3D散点图
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure(figsize=(10, 8))
ax = fig.add_subplot(111, projection='3d')

scatter = ax.scatter(iris_df.iloc[:, 0], 
                    iris_df.iloc[:, 1], 
                    iris_df.iloc[:, 2],
                    c=iris_df['target'],
                    cmap='viridis')
ax.set_xlabel(features[0])
ax.set_ylabel(features[1])
ax.set_zlabel(features[2])
plt.title('鸢尾花三个特征的3D散点图')
plt.colorbar(scatter)
plt.show()