# Метод аддитивной оптимизации

In [1]:
import pandas as pd
import sys
if sys.version_info[0] < 3: 
    from StringIO import StringIO
else:
    from io import StringIO
import numpy as np

## Заведение исходных данных

### Получение весов из работы 1,11 (экспертные методы)  
  
тут обязательно переименовываем столбцы так, чтобы названия соответствовали в этой таблице и в таблице с параметрами

In [2]:
weights = pd.read_csv('Искомый коэффициент значимости.csv',sep=';').set_index('Unnamed: 0').T
weights.rename(columns = {'стоимость (тыс. руб.)' : 'Стоимость, тыс.руб.',
                'площадь (м2)' : 'Площадь, м2',
                'количество комнат' : 'Количество комнат',
                'этаж' : 'Этаж',
                'материал стен': 'Материал'},
              inplace = True)
weights

Unnamed: 0,Район,"Стоимость, тыс.руб.","Площадь, м2",Количество комнат,Этаж,Материал,Сумма
Искомый коэффициент значимости,0.233333,0.22381,0.190476,0.07619,0.085714,0.190476,1.0


### Получение текущих данных

сразу добавляем строку с весами критериев, полученную пунктом выше

In [3]:
data = StringIO('''Адрес;Район;Количество комнат;Площадь, м2;Этаж;Материал;Стоимость, тыс.руб.
Каслинская ул, д. 99в;Калининский;3;100;3/11;Кирпич;8600
Шагольская ул, д. 34;Курчатовский;4;89;4/5;Кирпич;2499
Шагольская ул, д. 41;Курчатовский;3;65;2/5;Панельный;2150
Прокатная ул, д. 26;Металлургический;3;91;1/16;Панельный;2250
Свободы ул, д. 88б;Советский;3;50;6/6;Кирпич;4550
Лобинский 10-й пер, д. 3;Тракторозаводский;3;63;4/5;Панельный;2180
МОПРа площадь ул, д. 9;Центральный;4;198.1;9/16;Кирпич;8000''')
df = pd.read_csv(data, sep=";").set_index('Адрес')
originalDataLen = len(df)
df.loc['Веса критериев'] = weights.iloc[0]
df.head(originalDataLen+1)

Unnamed: 0_level_0,Район,Количество комнат,"Площадь, м2",Этаж,Материал,"Стоимость, тыс.руб."
Адрес,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
"Каслинская ул, д. 99в",Калининский,3.0,100.0,3/11,Кирпич,8600.0
"Шагольская ул, д. 34",Курчатовский,4.0,89.0,4/5,Кирпич,2499.0
"Шагольская ул, д. 41",Курчатовский,3.0,65.0,2/5,Панельный,2150.0
"Прокатная ул, д. 26",Металлургический,3.0,91.0,1/16,Панельный,2250.0
"Свободы ул, д. 88б",Советский,3.0,50.0,6/6,Кирпич,4550.0
"Лобинский 10-й пер, д. 3",Тракторозаводский,3.0,63.0,4/5,Панельный,2180.0
"МОПРа площадь ул, д. 9",Центральный,4.0,198.1,9/16,Кирпич,8000.0
Веса критериев,0.233333,0.07619,0.190476,0.085714,0.190476,0.22381


### Замена буквенных столбцов на числовые эквиваленты

Тут необходимо определиться насколько важен, например, материал дома. Если кирпичный лучше панельного, то вместо "кирпичный" ставим 1, вместо "панельный" - 2. <b>И не забываем, что будем минимизировать данный столбец в последующем.
    
#### Интересный вопрос возник при оценке этажности. Если параметров много, то какие-то два параметра могут быть ближе друг к другу, чем другие. Например 3/11 и 9/16 не одно и то же, но ближе, чем 9/16 и 6/6. Как соблюсти пропорции при расставлении рангов в таком случае?

In [4]:
df.dtypes

Район                   object
Количество комнат      float64
Площадь, м2            float64
Этаж                    object
Материал                object
Стоимость, тыс.руб.    float64
dtype: object

In [5]:
df.replace(inplace = True,
          to_replace = {
              'Центральный' : 1,
              'Калининский' : 2,
              'Курчатовский' : 3,
              'Металлургический' : 4,
              'Тракторозаводский' : 5,
              'Советский' : 6
          })
df.replace(inplace = True,
          to_replace = {
              'Кирпич' : 1,
              'Панельный' : 2
          })
df.replace(inplace = True,
          to_replace = {
              '3/11' : 1,
              '9/16' : 1,
              '4/5' : 2,
              '4/5' : 2,
              '2/5' : 3,
              '1/16' : 3,
              '6/6' : 4,
          })
# 1-2 этаж я не хочу, будет шум
# высокий этаж без лифта (в 5-6 этажках) я тоже не хочу
# последний этаж тоже не хочу, будет крыша протекать
df

Unnamed: 0_level_0,Район,Количество комнат,"Площадь, м2",Этаж,Материал,"Стоимость, тыс.руб."
Адрес,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
"Каслинская ул, д. 99в",2.0,3.0,100.0,1.0,1.0,8600.0
"Шагольская ул, д. 34",3.0,4.0,89.0,2.0,1.0,2499.0
"Шагольская ул, д. 41",3.0,3.0,65.0,3.0,2.0,2150.0
"Прокатная ул, д. 26",4.0,3.0,91.0,3.0,2.0,2250.0
"Свободы ул, д. 88б",6.0,3.0,50.0,4.0,1.0,4550.0
"Лобинский 10-й пер, д. 3",5.0,3.0,63.0,2.0,2.0,2180.0
"МОПРа площадь ул, д. 9",1.0,4.0,198.1,1.0,1.0,8000.0
Веса критериев,0.233333,0.07619,0.190476,0.085714,0.190476,0.22381


## Определим максимум и минимум каждого локального критерия

In [6]:
df.loc['max'] = (df.head(5).max(axis=0))
df.loc['min'] = (df.head(5).min(axis=0))

In [7]:
df.head(3+originalDataLen)

Unnamed: 0_level_0,Район,Количество комнат,"Площадь, м2",Этаж,Материал,"Стоимость, тыс.руб."
Адрес,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
"Каслинская ул, д. 99в",2.0,3.0,100.0,1.0,1.0,8600.0
"Шагольская ул, д. 34",3.0,4.0,89.0,2.0,1.0,2499.0
"Шагольская ул, д. 41",3.0,3.0,65.0,3.0,2.0,2150.0
"Прокатная ул, д. 26",4.0,3.0,91.0,3.0,2.0,2250.0
"Свободы ул, д. 88б",6.0,3.0,50.0,4.0,1.0,4550.0
"Лобинский 10-й пер, д. 3",5.0,3.0,63.0,2.0,2.0,2180.0
"МОПРа площадь ул, д. 9",1.0,4.0,198.1,1.0,1.0,8000.0
Веса критериев,0.233333,0.07619,0.190476,0.085714,0.190476,0.22381
max,6.0,4.0,100.0,4.0,2.0,8600.0
min,2.0,3.0,50.0,1.0,1.0,2150.0


### Выбор критериев которые максимизируем и минимизируем  
  
Правило выбора таково:  
     1. если критерий имеет прямую зависимость с качеством товара <b>(критерий растет - качество растет), то МАКСИМИЗИРУЕМ</b>  
     2. если критерий имеет обратную зависимость с качеством товара <b>(критерий падает - качество растёт), то МИНИМИЗИРУЕМ</b>  

In [None]:
maximizationMinimizationParametrDict = {}
print('"+" - максимизируем; "-" - минимизируем.')
for columnName in df.columns:
    maximizationMinimizationParametrDict[columnName] = \
        input(f'Критерий: "{columnName}", введите +/-: ')

"+" - максимизируем; "-" - минимизируем.
Критерий: "Район", введите +/-: -
Критерий: "Количество комнат", введите +/-: +
Критерий: "Площадь, м2", введите +/-: +
Критерий: "Этаж", введите +/-: -


In [None]:
maximizationMinimizationParametrDict

## Максимизируем/минимизируем столбцы двумя типами

In [None]:
normalizedType1DF = df.copy()
normalizedType2DF = df.copy()
for columnName in df.columns:
    
    denominator = df[columnName]['max'] - df[columnName]['min']
    
    if maximizationMinimizationParametrDict[columnName] == '+':
        normalizedType1DF[columnName].iloc[0:originalDataLen] = \
            df[columnName].iloc[0:originalDataLen] / df[columnName]['max']
        
        normalizedType2DF[columnName].iloc[0:originalDataLen] = \
            (df[columnName].iloc[0:originalDataLen] - df[columnName]['min']) / denominator
    else:
        normalizedType1DF[columnName].iloc[0:originalDataLen] = \
            1 - df[columnName].iloc[0:originalDataLen] / df[columnName]['max']
        
        normalizedType2DF[columnName].iloc[0:originalDataLen] = \
            (df[columnName]['max'] - df[columnName].iloc[0:originalDataLen]) / denominator


### Типом 1: текущее / максимальное; 1 - текущее / максимальное

In [None]:
normalizedType1DF.head(originalDataLen+1)

### Типом 2: ( текущее - мин ) / ( макс - мин ); ( макс - текущее  ) / ( макс - мин ) 

In [None]:
normalizedType2DF.head(originalDataLen)

In [None]:
normalizedType1DF['Обобщенная функ. цели Fi'] = \
    (normalizedType1DF[:][0:originalDataLen]*normalizedType1DF[:].loc['Веса критериев']).sum(axis=1)
print('Fi max =',normalizedType1DF['Обобщенная функ. цели Fi'].max())

In [None]:
normalizedType1DF.head(originalDataLen+1)

In [None]:
normalizedType2DF['Обобщенная функ. цели Fi'] = \
    (normalizedType2DF[:][0:originalDataLen]*normalizedType2DF[:].loc['Веса критериев']).sum(axis=1)
print('Fi max =',normalizedType2DF['Обобщенная функ. цели Fi'].max())

In [None]:
normalizedType2DF.head(originalDataLen+1)