# 变异系数法
## 算法简介
变异系数法也是用来赋权重的一种算法。前面一篇建模算法讲到熵权法，变异系数法和熵权法的思想很像，都是通过寻找数据本身的规律来赋权重的一种方法。

变异系数法是一种利用被评价对象指标的变异程度确定指标权重的方法，可实现被评价对象各指标的动态赋权。指标的变异程度大，说明其在评价对象指标中的重要程度越高，应赋予较大的权重；反之则赋予较小的权重。

## 案例分析
用一篇高引EI核心期刊为例, 对风电场运行情况进行综合评价。针对高频率穿越能力、低频率穿越能力、低压穿越能力、并网点电压偏差越限次数、SVC/SVG响应性能指标、有功控制能力、功率因素越限几个指标进行评价，为方便处理把这些指标依次设置为A~G。
<table>
<tr>
  <th>指标</th>
  <th>风场1</th>
  <th>风场2</th>
  <th>风场3</th>
</tr>   
<tr>
    <td>A</td>
    <td>0.743</td>
    <td>0.7567</td>
    <td>0.8104</td>
    </tr>
<tr>
    <td>B</td>
    <td>0.8267</td>
    <td>0.8033</td>
    <td>0.7667</td>
    </tr>
<tr>
    <td>C</td>
    <td>0.8324</td>
    <td>0.8736</td>
    <td>0.8539</td>
    </tr>
<tr>
    <td>D</td>
    <td>12</td>
    <td>10</td>
    <td>16</td>
    </tr>
<tr>
    <td>E</td>
    <td>0.8637</td>
    <td>0.8538</td>
    <td>0.9038</td>
    </tr>
<tr>
    <td>F</td>
    <td>0.0743</td>
    <td>0.0665</td>
    <td>0.0881</td>
    </tr>
<tr>
    <td>G</td>
    <td>0.0409</td>
    <td>0.0716</td>
    <td>0.0657</td>
    </tr>
</table>
对风场1~3，针对A~G指标数据进行评价

## 原理分析
1. 指标正向化：

    和熵权法的指标正向化雷系，正向指标越大越好，负向指标越小越好。把指标都转化成正向指标处理。此篇采用新的正向化形式，采用上一篇建模算法熵权法的处理形式也可，基本思想不变就行。这个数据集有正向指标（越大越优型指标）和负向指标（越小越优型指标）两种。

    设有$m$个待评对象，$n$个评价指标，可以构成数据矩阵$X=(x_{ij})_{m\times n}$，设数据矩阵内元素$x_{ij}$，经过指标正向化处理过后的元素为$x_{ij}^{\prime}$

    - 负向指标：并网点电压偏差越限次数$D$、有功控制能力$F$、功率因数越限$G$属于此类指标：
        $$x_{ij}^{\prime}=\frac{1}{k+\mathrm{max}\left |x_j\right |+x_{ij}}$$
        $K$一般取0.1
    - 正向指标：其余所有指标属于此类，可以不用进行处理
    $$x_{ij}^{\prime} = x_{ij}$$
2. 数据标准化：

    每个指标的数量级不一样，需要把它们化到同一个范围内比较。上一篇建模算法用到了最大值最小值标准化方法。此篇可以用到一个新的标准化方法，处理如下：

    设标准化后的数据矩阵元素为$r_{ij}$，由上可得指标正向化后数据矩阵元素为$x_{ij}^{\prime}$
    $$r_{ij}=\frac{x_{ij}^{\prime}}{\sqrt{\sum_{i=1}^m x_{ij}^{\prime2}}}$$
3. 计算变异系数
    标准化处理过后可以构成数据矩阵$R=(r_{ij})_{m\times n}$
    计算指标的均值:
    $$A_j=\frac{1}{n}\sum_{i=1}^{m}r_{ij}$$
    计算指标的标准差：
    $$S_j=\sqrt{\frac{1}{n}\sum_{i=1}^{m}(r_{ij}-A)^2}$$
    计算变异系数：
    $$V_j = \frac{S_j}{A_j}$$
4. 计算权重
    $$w_j=\frac{V_j}{\sum_{j=1}^nV_j}$$
5. 计算得分
    $$Score_i = \sum_{j=1}^nw_jr_{ij}$$

In [1]:
import copy
import pandas as pd
import numpy as np

In [2]:
data=pd.read_excel('变异系数法.xlsx')
data

Unnamed: 0,风场名,A（高频率穿越能力）,B（低频率穿越能力）,C（低压穿越能力）,D（并网点电压偏差越限次数 ）,E（SVC/SVG响应性能指标）,F（有功控制能力）,G（功率因素越限）
0,风场1,0.743,0.8267,0.8324,12,0.8637,0.0743,0.0409
1,风场2,0.7567,0.8033,0.8736,10,0.8538,0.0665,0.0716
2,风场3,0.8104,0.7667,0.8539,16,0.9038,0.0881,0.0657


In [4]:
# 数据正向化
label_need = data.keys()[1:]
data1 = data[label_need].values
data2 = data1
index = [3, 5, 6]  # 越小越优指标位置,注意python是从0开始计数，对应位置也要相应减1
k = 0.1
for i in range(0, len(index)):
    data2[:, index[i]] = 1/(k+max(abs(data1[:, index[i]]))+data1[:, index[i]])

In [5]:
# 数据标准化
[m,n]=data2.shape
data3=copy.deepcopy(data2)
for j in range(0,n):
    data3[:,j]=data2[:,j]/np.sqrt(sum(np.square(data2[:,j])))
data3

array([[0.55668441, 0.59715567, 0.56309969, 0.58466185, 0.57052403,
        0.58076945, 0.62434529],
       [0.56694898, 0.58025299, 0.59097056, 0.62946352, 0.5639845 ,
        0.59856208, 0.54553197],
       [0.6071831 , 0.55381547, 0.57764395, 0.51180679, 0.59701241,
        0.55175201, 0.55909555]])

In [8]:
#计算信息熵
A=np.average(data3, axis=0)
S=np.std(data3, axis=0)
V=S/A
V

array([0.03777284, 0.03090712, 0.01971778, 0.08427819, 0.0247411 ,
       0.0334341 , 0.05969646])

In [7]:
#计算权重和得分
w=V/sum(V)
#计算得分
s=np.dot(data3,w)
Score=100*s/max(s)
for i in range(0,len(Score)):
    print(f"第{i+1}个风场百分制得分为：{Score[i]}")  

第1个风场百分制得分为：100.0
第2个风场百分制得分为：99.95246423920769
第3个风场百分制得分为：94.43627314352099
