# **Carregar conjunto de dados**

In [None]:
import pandas as pd
from sklearn.ensemble import RandomForestClassifier

df = pd.read_excel('/Cap - Rotulados ELECTRE TRI-rC.xlsx')
df.set_index('Suppliers', inplace=True)
display(df.head())  # Mostra as primeiras linhas do DataFrame



X_criterios = df.iloc[:, 0:9].values

X_criterios

Y_classe = df.iloc[:, 9].values

Y_classe

# **Treinando modelo final**

In [None]:
from sklearn.svm import SVC

svc_final = SVC(probability=True, random_state=1, C=1.0, degree=1, kernel='linear', tol=0.01)
svc_final.fit(X_criterios, Y_classe)


In [None]:

from sklearn.metrics import f1_score, make_scorer, accuracy_score

# Previsões
previsao = svc_final.predict(X_criterios)

# Calculando a acurácia (não necessário para o f1, mas deixado para referência)
accuracy = accuracy_score(Y_classe, previsao)
print("Acurácia:", accuracy)


In [None]:
Y_classe

In [None]:
previsao

# **SHAP**

In [None]:
!pip install shap

In [None]:
from sklearn.svm import SVC
import numpy as np
import shap


In [None]:
# Nomes dos novos features
feature_names = ['Critério 1', 'Critério 2', 'Critério 3', 'Critério 4', 'Critério 5', 'Critério 6', 'Critério 7', 'Critério 8', 'Critério 9']


In [None]:
svc_final.predict_proba(X_criterios)[19]

In [None]:
svc_final.predict(X_criterios)[19]

In [None]:
# Get SHAP values
explainer = shap.Explainer(svc_final.predict_proba, X_criterios)
shap_values_svm = explainer(X_criterios)

In [None]:
# Atualize os valores SHAP com os novos nomes
shap_values_svm.feature_names = feature_names

In [None]:
print(np.shape(shap_values_svm))

In [None]:
# Waterfall plot for first observation
shap.plots.waterfall(shap_values_svm[12, :, 0])

# Waterfall plot for first observation
shap.plots.waterfall(shap_values_svm[12, :, 1])

# Waterfall plot for first observation
shap.plots.waterfall(shap_values_svm[12, :, 2])

In [None]:
import pandas as pd

# Supondo que shap_values_nb seja o objeto contendo os valores SHAP
# Extrair os valores SHAP para a 26ª observação (índice 25) para as três classes
shap_values_class_0 = shap_values_svm[25, :, 0]
shap_values_class_1 = shap_values_svm[25, :, 1]
shap_values_class_2 = shap_values_svm[25, :, 2]



# Criar DataFrames para cada classe
df_shap_class_0 = pd.DataFrame({'Feature': feature_names, 'SHAP Value': shap_values_class_0.values})
df_shap_class_1 = pd.DataFrame({'Feature': feature_names, 'SHAP Value': shap_values_class_1.values})
df_shap_class_2 = pd.DataFrame({'Feature': feature_names, 'SHAP Value': shap_values_class_2.values})

# Exibir os DataFrames
print("SHAP values for class 0:")
print(df_shap_class_0)

print("\nSHAP values for class 1:")
print(df_shap_class_1)

print("\nSHAP values for class 2:")
print(df_shap_class_2)


In [None]:
# Número de fornecedores e classes
num_fornecedores = 50
num_classes = 3
num_criterios = shap_values_svm.shape[1]

# Nome das features (supondo que você tenha uma lista com os nomes das features)
feature_names = [f'Critério {i+1}' for i in range(num_criterios)]

# Criar uma lista para armazenar os dados
dados = []

# Iterar sobre cada fornecedor
for i in range(num_fornecedores):
    for c in range(num_classes):
        shap_values = shap_values_svm[i, :, c].values
        dados.append([f'Fornecedor {i+1}', f'Classe {c}'] + list(shap_values))

# Criar o DataFrame
colunas = ['Fornecedor', 'Classe'] + feature_names
df_shap_values = pd.DataFrame(dados, columns=colunas)

# Exibir o DataFrame
print(df_shap_values)

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
# Especificar o caminho no Google Drive onde você quer salvar o arquivo
file_path = '/content/drive/My Drive/shap_values_fornecedores_cap.csv'

# Salvar o DataFrame em um arquivo CSV no Google Drive
df_shap_values.to_csv(file_path, index=False)

print(f"Arquivo salvo em: {file_path}")



In [None]:
# Especificar o caminho no Google Drive onde você quer salvar o arquivo
file_path = '/content/drive/My Drive/shap_values_fornecedores_cap.csv'

# Salvar o DataFrame em um arquivo CSV no Google Drive
df_shap_values.to_csv(file_path, index=False)

print(f"Arquivo salvo em: {file_path}")



In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Supondo que shap_values_svm.values seja uma matriz numpy com as contribuições SHAP
# e X_criteria.shape[1] é o número de características

# Cálculo das médias dos valores SHAP para cada classe
mean_0 = np.mean(np.abs(shap_values_svm.values[:, :, 0]), axis=0)
mean_1 = np.mean(np.abs(shap_values_svm.values[:, :, 1]), axis=0)
mean_2 = np.mean(np.abs(shap_values_svm.values[:, :, 2]), axis=0)


In [None]:
mean_0


In [None]:
import numpy as np

# Normalizando os valores
mean_0_normalized = mean_0 / np.sum(mean_0)

# Exibindo os valores normalizados
for i, mean_0_shap_importance in enumerate(mean_0_normalized):
    print(f'Critério {i+1}: {mean_0_shap_importance}')

In [None]:
mean_1


In [None]:
import numpy as np

# Normalizando os valores
mean_1_normalized = mean_1 / np.sum(mean_1)

# Exibindo os valores normalizados
for i, mean_1_shap_importance in enumerate(mean_1_normalized):
      print(f'Critério {i+1}: {mean_1_shap_importance}')

In [None]:
mean_2

In [None]:
import numpy as np

# Normalizando os valores
mean_2_normalized = mean_2 / np.sum(mean_2)

# Exibindo os valores normalizados
for i, mean_2_shap_importance in enumerate(mean_2_normalized):
      print(f'Critério {i+1}: {mean_2_shap_importance}')

In [None]:

# Criação do DataFrame para plotagem
df = pd.DataFrame({"Baixo": mean_0, "Médio": mean_1, "Alto": mean_2})

# Plotagem dos valores SHAP
fig, ax = plt.subplots(1, 1, figsize=(20, 10))
df.plot.bar(ax=ax)

# Configuração dos rótulos dos eixos
ax.set_ylabel('Mean SHAP', size=30)
criteria_labels = [f'Critério {i+1}' for i in range(X_criterios.shape[1])]
ax.set_xticklabels(criteria_labels, rotation=45, size=20)
ax.legend(fontsize=30)

plt.show()


In [None]:

# Criação do DataFrame para plotagem
df = pd.DataFrame({"Baixo": mean_0, "Médio": mean_1, "Alto": mean_2})

# Plotagem dos valores SHAP
fig, ax = plt.subplots(1, 1, figsize=(20, 10))
df.plot.bar(ax=ax)

# Configuração dos rótulos dos eixos
ax.set_ylabel('Mean SHAP', size=30)
criteria_labels = [f'Critério {i+1}' for i in range(X_criterios.shape[1])]
ax.set_xticklabels(criteria_labels, rotation=45, size=20)
ax.legend(fontsize=30)

plt.show()


In [None]:
import pandas as pd
import matplotlib.pyplot as plt



# Criação do DataFrame para plotagem
df = pd.DataFrame({
    "Baixo": mean_0,
    "Médio": mean_1,
    "Alto": mean_2
})

# Cálculo do peso global para cada critério
df['Peso Global'] = df.sum(axis=1)

# Exibindo os valores absolutos dos pesos globais
print("Valores absolutos dos pesos globais:")
print(df['Peso Global'])


# Plotagem dos pesos globais
fig, ax = plt.subplots(figsize=(20, 10))
df['Peso Global'].plot.bar(ax=ax)

# Configuração dos rótulos dos eixos
ax.set_ylabel('Peso Global', size=30)
criteria_labels = [f'Critério {i+1}' for i in range(df.shape[0])]
ax.set_xticklabels(criteria_labels, rotation=45, size=20)
plt.show()

In [None]:
df = pd.DataFrame({
    "Baixo": mean_0,
    "Médio": mean_1,
    "Alto": mean_2
})

# Cálculo do peso global para cada critério
df['Peso Global'] = df.sum(axis=1)

df

In [None]:
# Normalização dos pesos globais
df['Peso Global Normalizado'] = df['Peso Global'] / df['Peso Global'].sum()

# Exibindo os valores absolutos dos pesos globais
print("Valores absolutos dos pesos globais:")
print(df['Peso Global Normalizado'] )

In [None]:
import pandas as pd
import matplotlib.pyplot as plt


# Criação do DataFrame para plotagem
df = pd.DataFrame({
    "Baixo": mean_0,
    "Médio": mean_1,
    "Alto": mean_2
})

# Cálculo do peso global para cada critério
df['Peso Global'] = df.sum(axis=1)

# Ordenar o DataFrame pelos pesos globais em ordem decrescente
df = df.sort_values(by='Peso Global', ascending=True)

# Exibindo os valores absolutos dos pesos globais
print("Valores absolutos dos pesos globais:")
print(df['Peso Global'])

# Plotagem dos pesos globais em gráfico de barras horizontal
fig, ax = plt.subplots(figsize=(10, 8))
df['Peso Global'].plot.barh(ax=ax, color='blue')

# Configuração dos rótulos dos eixos
ax.set_xlabel('Valor Shapley', size=15)
criteria_labels = [f'Critério {i+1}' for i in df.index]
ax.set_yticklabels(criteria_labels, rotation=0, size=12)
plt.show()

In [None]:
# get model predictions
preds = svc_final.predict(X_criterios)

new_shap_values = []
for i, pred in enumerate(preds):
    # get shap values for predicted class
    new_shap_values.append(shap_values_svm.values[i][:,pred])

In [None]:
# replace shap values
shap_values_svm.values = np.array(new_shap_values)
print(shap_values_svm.shape)

In [None]:
# Definindo os nomes das características
feature_names = ['criterio1', 'criterio2', 'criterio3', 'criterio4', 'criterio5', 'criterio6', 'criterio7', 'criterio8', 'criterio9']

In [None]:
# Plotando os valores SHAP
shap.summary_plot(shap_values_svm, X_criterios, feature_names=feature_names)



In [None]:
# Plotando o resumo dos valores SHAP como um gráfico de barras
shap.summary_plot(shap_values_svm, X_criterios, feature_names=feature_names, plot_type="bar")

In [None]:
import numpy as np
import pandas as pd

# Calculando a importância média de cada característica
shap_values_mean = np.mean(np.abs(shap_values_svm.values), axis=0)

# Agora você pode continuar com suas análises ou visualizações
print(shap_values_mean)

In [None]:
# Exibindo os valores de shap_values_mean
for i, shap_importance in enumerate(shap_values_mean):
    print(f'Critério {i+1}: {shap_importance}')

In [None]:
import numpy as np

# Normalizando os valores
shap_values_normalized = shap_values_mean / np.sum(shap_values_mean)

# Exibindo os valores normalizados
for i, shap_importance in enumerate(shap_values_normalized):
    print(f'Critério {i+1}: {shap_importance}')