In [None]:
#引用以下包做数据处理
import numpy as np
import pandas as pd
from sklearn import preprocessing
from scipy.stats import norm,skewnorm
#引用以下包做数据可视化
import matplotlib.pyplot as plt
import seaborn as sns
from warnings import filterwarnings

In [None]:
filterwarnings('ignore')
pd.set_option('display.float_format',lambda x:'%.2f'%x) #不使用科学计数法
sns.set(font_scale=1.5) #设置统计图字体大小
plt.rcParams['font.sans-serif']=['SimHei'] #在统计图上显示中文
plt.style.use({'figure.figsize':(24, 8)})  #设置画布大小

# 归一化

In [None]:
#随机产生50组数，分别代表员工人数x1(1至50)，销售额x2(1至1000000)
x1 = np.random.randint(1, 50, (50,1))
x2 = np.random.randint(1, 1000000, (50,1))
#使用最大-最小归一化进行转换
maxmin = preprocessing.MinMaxScaler()
x1_scaled = maxmin.fit_transform(x1)
x2_scaled = maxmin.fit_transform(x2)
#numpy生成的是二维数组，使用squeeze函数将数组的空维去掉
df = pd.DataFrame()
df['员工人数(归一化前)']= pd.Series(x1.squeeze()) 
df['销售额(归一化前)'] = pd.Series(x2.squeeze())
df['员工人数(归一化后)'] = x1_scaled.squeeze()
df['销售额(归一化后)'] = x2_scaled.squeeze()
#显示归一化前后对比
plt.style.use({'figure.figsize':(32, 6)})
fig,axes=plt.subplots(1,2)
axes[0].plot(df.index,df['员工人数(归一化前)'],df['销售额(归一化前)'])
axes[1].plot(df.index,df['员工人数(归一化后)'],df['销售额(归一化后)'])
axes[0].set_title('归一化前')
axes[1].set_title('归一化后')

# 标准化

In [None]:
#随机产生50组数，分别代表员工人数x1(1至50)，销售额x2(1至1000000)
x1 = np.random.randint(1, 50, (50,1))
x2 = np.random.randint(1, 1000000, (50,1))
#进行标准化转换
x1_scaled = preprocessing.scale(x1)
x2_scaled = preprocessing.scale(x2)
#numpy生成的是二维数组，需要使用squeeze函数将数组的空维去掉
df = pd.DataFrame()
df['员工人数(标准化前)']= pd.Series(x1.squeeze()) 
df['销售额(标准化前)'] = pd.Series(x2.squeeze())
df['员工人数(标准化后)'] = x1_scaled.squeeze()
df['销售额(标准化后)'] = x2_scaled.squeeze()
#显示标准化前后对比
fig,axes=plt.subplots(1,2)
axes[0].plot(df.index,df['员工人数(标准化前)'],df['销售额(标准化前)'])
axes[1].plot(df.index,df['员工人数(标准化后)'],df['销售额(标准化后)'])
axes[0].set_title('标准化前')
axes[1].set_title('标准化后')