# IT304S: Contratação de Energia para Grandes Consumidores.
##Prof. Dr. Luiz Carlos Pereira da Silva

# Definição de ciência de dados 

A ciência de dados pode ser definida como um conjunto de técnicas de analise de dados para obter e apresentar informações úteis para um usuario. 

# Metodologia

Uma metodologia muito utilizado para analisar dados é o chamado ``CRISP-DM", por suas siglas em inglês: Cross-Industry Standard Process for Data Mining. O CRISP-DM tem seis etapas que são:

* **Business Understanding:** Definição dos objetivos, declaração do problema, * * pergunta de interesse.
* **Data Understanding:** Utilização de nosso conhecimento para coletar os dados.
* **Data Preparation:** Manipulação de dados para a eliminação de outliers e dados faltantes.
* **Modeling:** Modelo ou abordagem utilizado para estudar o comportamento de nosso sistema a partir de nossos dados.
* **Evaluation:** Avaliação dos resultados obtidos, no contexto se são de ajuda para responder nossa pergunta de interesse.
* **Deployment:** Disponibilizar o análise de dados.

# Business Understanding

* **Definição dos objetivos:** O objetivo do presente notebook é apresentar as variaveis disponíveis no banco de dados UFFS.xlsx.
* **Declaração do problema:** O arquivo UFFS.xlsx, contém as informações disponíveis das planilhas elétricas da UFFS, precisamos de fazer um analize exploratorio dos dados para conhecer os dados disponíveis da UFFS.
* **Perguntas de Interesse:**
Há dados faltantes?

# Data Understanding:

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
!git clone https://github.com/juliobento9131/IT304S_Trabalho_Parte_2.git

In [None]:
import pandas as pd

In [None]:
abas_de_excel =  pd.ExcelFile("/content/drive/Shareddrives/IT304S - Comercialização de Energia Elétrica para Grandes Clientes/Projeto/Planilhas - Universidades/Grupo 15 - UFFS/Preencher_universidade.xlsx")
abas_de_excel.sheet_names

In [None]:
UC3 = abas_de_excel.parse("UC3")
UC3.shape

In [None]:
UC3.head()

# Data Preparation:

In [None]:
import numpy as np

In [None]:
np.nan + np.nan

In [None]:
np.nan == np.nan

In [None]:
np.isnan(np.nan)

In [None]:
data = []
for colm in UC3.columns[3:]:
  data.append([colm, UC3.shape[0]-UC3[colm].apply(np.isnan).sum(), UC3[colm].apply(np.isnan).sum(), (UC3[colm].apply(np.isnan).sum()/87)])
dados_faltantes = pd.DataFrame(data, columns=["Variavel", "Quantidade de dados Disponíveis", "Quantidade de dados Faltantes", "Percentagem de Dados Faltantes" ])
dados_faltantes = dados_faltantes[dados_faltantes["Quantidade de dados Faltantes"]>0].sort_values(by=['Quantidade de dados Faltantes'], ascending=False).reset_index(drop=True)
dados_faltantes['Percentagem de Dados Faltantes'] = dados_faltantes['Percentagem de Dados Faltantes'].astype(float).map("{:.2%}".format)
dados_faltantes

## Visualização de Dados Faltantes

In [None]:
import missingno as msno

In [None]:
msno.bar(UC3, color="RoyalBlue") #para visualizar a integridade do datafram

## Matriz de Dados Faltantes

In [None]:
msno.matrix(UC3, color = (0.25,0.4,0.8))

## Matriz de Correlação de Dados Faltantes

In [None]:
msno.heatmap(UC3)

### Dendogram de dados Faltantes

In [None]:
msno.dendrogram(UC3)

## Eliminação de colunas com excesso de dados Faltantes

In [None]:
UC3_df = UC3.drop(set(UC3.columns[UC3.isnull().mean() >0.9]), 1)
UC3_df.shape

## Visualização de Variaveis

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
msno.bar(UC3_df, color="RoyalBlue")

In [None]:
msno.matrix(UC3_df, color = (0.25,0.4,0.8))

## Tratamento dos dados

Tratamento das colunas com dados faltantes da UC3

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_df.DATA, UC3_df.PIS_PASEP, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("%")
_ = plt.legend(['Dados Originais'])
_ = plt.title("PIS_PASEP")
plt.show()


In [None]:
from fancyimpute import KNN
from sklearn.impute import SimpleImputer
UC3_mean = UC3_df.copy(deep= True)
imputer = SimpleImputer(strategy='mean')
imputer = imputer.fit(UC3_mean[["PIS_PASEP"]])
UC3_mean['PIS_PASEP'] = imputer.transform(UC3_mean[['PIS_PASEP']]).ravel()
sns.set()
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_mean.DATA, UC3_mean.PIS_PASEP, marker='o', color="r")
_ = plt.plot(UC3_df.DATA, UC3_df.PIS_PASEP, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("%")
_ = plt.legend(['Dados imputados'])
_ = plt.title("PIS_PASEP")
plt.show()

In [None]:
UC3_df = UC3_mean

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_df.DATA, UC3_df.COFINS, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("%")
_ = plt.legend(['Dados Originais'])
_ = plt.title("COFINS")
plt.show()


In [None]:
UC3_mean = UC3_df.copy(deep= True)
imputer = SimpleImputer(strategy='mean')
imputer = imputer.fit(UC3_mean[["COFINS"]])
UC3_mean['COFINS'] = imputer.transform(UC3_mean[['COFINS']]).ravel()
sns.set()
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_mean.DATA, UC3_mean.COFINS, marker='o', color="r")
_ = plt.plot(UC3_df.DATA, UC3_df.COFINS, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("%")
_ = plt.legend(['Dados imputados'])
_ = plt.title("COFINS")
plt.show()

In [None]:
UC3_df = UC3_mean

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_df.DATA, UC3_df.VALOR_DA_FATURA, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("R$")
_ = plt.legend(['Dados Originais'])
_ = plt.title("VALOR_DA_FATURA")
plt.show()


In [None]:
UC3_mean = UC3_df.copy(deep= True)
imputer = SimpleImputer(strategy='mean')
imputer = imputer.fit(UC3_mean[["VALOR_DA_FATURA"]])
UC3_mean['VALOR_DA_FATURA'] = imputer.transform(UC3_mean[['VALOR_DA_FATURA']]).ravel()
sns.set()
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_mean.DATA, UC3_mean.VALOR_DA_FATURA, marker='o', color="r")
_ = plt.plot(UC3_df.DATA, UC3_df.VALOR_DA_FATURA, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("R$")
_ = plt.legend(['Dados imputados'])
_ = plt.title("VALOR_DA_FATURA")
plt.show()

In [None]:
UC3_df = UC3_mean

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_df.DATA, UC3_df.CONSUMO_TOTAL, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("kWh")
_ = plt.legend(['Dados Originais'])
_ = plt.title("CONSUMO_TOTAL")
plt.show()


In [None]:
UC3_mean = UC3_df.copy(deep= True)
imputer = SimpleImputer(strategy='mean')
imputer = imputer.fit(UC3_mean[["CONSUMO_TOTAL"]])
UC3_mean['CONSUMO_TOTAL'] = imputer.transform(UC3_mean[['CONSUMO_TOTAL']]).ravel()
sns.set()
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_mean.DATA, UC3_mean.CONSUMO_TOTAL, marker='o', color="r")
_ = plt.plot(UC3_df.DATA, UC3_df.CONSUMO_TOTAL, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("kWh")
_ = plt.legend(['Dados imputados'])
_ = plt.title("CONSUMO_TOTAL")
plt.show()

In [None]:
UC3_df = UC3_mean

In [None]:
msno.matrix(UC3_df, color = (0.25,0.4,0.8))

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_df.DATA, UC3_df.DEMANDA_REGISTRADA_FP, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("kW")
_ = plt.legend(['Dados Originais'])
_ = plt.title("Demanda Registrada Fora de Ponta")
plt.show()


In [None]:
UC3_bfill = UC3_df.fillna(method='bfill')
sns.set()
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(UC3_bfill.DATA, UC3_bfill.DEMANDA_REGISTRADA_FP, marker='o', color="r")
_ = plt.plot(UC3_df.DATA, UC3_df.DEMANDA_REGISTRADA_FP, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("kW")
_ = plt.legend(['Imputações utilizando o método BFILL', 'Dados Originais'])
_ = plt.title("Demanda Registrada Fora de Ponta")
plt.show()

In [None]:
UC3_df = UC3_bfill

In [None]:
msno.matrix(UC3_df, color = (0.25,0.4,0.8))

## Outliers
https://en.wikipedia.org/wiki/Pearson_correlation_coefficient

Matriz de correlação 

In [None]:
cor = UC3_df
pear = round(cor.corr(),2)
teste = np.array(pear)
mask = np.zeros_like(pear)
mask[np.triu_indices_from(mask)] = True
with sns.axes_style("white"):
    f, ax = plt.subplots(figsize=(20, 15))
    ax = sns.heatmap(pear, mask=mask, vmax=1, square=True,center=0,annot=True,annot_kws={"fontsize":14}, cmap="RdBu")
    plt.title('''Pearson's Correlation Heatmap''',fontsize = 20)
    plt.xticks(fontsize=17,rotation=90)
    plt.yticks(fontsize=17,rotation=0)
    cax = plt.gcf().axes[-1] #para alterar fonte do eixo y direito
    cax.tick_params(labelsize=20) #para alterar fonte do eixo y direito

In [None]:
corr = UC3_df.corr()
corr.style.background_gradient(cmap='coolwarm').set_precision(2)

### Método Z score
https://en.wikipedia.org/wiki/Standard_score#/media/File:The_Normal_Distribution.svg

In [None]:
def z_score (data, treshold =4):
  outliers = []
  treshold = treshold
  mean, std = np.mean(data), np.std(data)
  for i in data:
    zscore = (i-mean)/std
    if np.abs(zscore) > treshold:
      outliers.append(i)
  
  return outliers

Avaliação de Outliers da UC3

In [None]:
outliers = z_score(UC3_df[["PERÍODO"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["PERÍODO"]].values)*100, "%")

In [None]:
index_value = UC3_df[["PERÍODO"]][UC3_df[["PERÍODO"]].eq(45).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'PERÍODO'] = UC3_df.PERÍODO.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
outliers = z_score(UC3_df[["PIS_PASEP"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["COFINS"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["DEMANDA_REGISTRADA_FP"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["DEMANDA_REGISTRADA_FP"]].values)*100, "%")

In [None]:
index_value = UC3_df[["DEMANDA_REGISTRADA_FP"]][UC3_df[["DEMANDA_REGISTRADA_FP"]].eq(124.8).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'DEMANDA_REGISTRADA_FP'] = UC3_df.DEMANDA_REGISTRADA_FP.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
outliers = z_score(UC3_df[["TAR_TUSD_KW_FP"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["ENERGIA_PONTA"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["ENERGIA_PONTA"]].values)*100, "%")

In [None]:
index_value = UC3_df[["ENERGIA_PONTA"]][UC3_df[["ENERGIA_PONTA"]].eq(2974.8).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'ENERGIA_PONTA'] = UC3_df.ENERGIA_PONTA.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
outliers = z_score(UC3_df[["ENERGIA_FPONTA"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["ENERGIA_FPONTA"]].values)*100, "%")

In [None]:
index_value = UC3_df[["ENERGIA_FPONTA"]][UC3_df[["ENERGIA_FPONTA"]].eq(9364.08).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'ENERGIA_FPONTA'] = UC3_df.ENERGIA_FPONTA.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
outliers = z_score(UC3_df[["TAR_TUSD_KWH_P"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["TAR_TUSD_KWH_FP"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["TAR_TE_KWH_P"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["TAR_TE_KWH_FP"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["REAT_KVAR_FPONTA"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["REAT_KVAR_FPONTA"]].values)*100, "%")

In [None]:
index_value = UC3_df[["REAT_KVAR_FPONTA"]][UC3_df[["REAT_KVAR_FPONTA"]].eq(0.738).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'REAT_KVAR_FPONTA'] = UC3_df.REAT_KVAR_FPONTA.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
outliers = z_score(UC3_df[["TAR_REAT_PONTA"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["TAR_REAT_FPONTA"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["VALOR_DA_FATURA"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["CONSUMO_TOTAL"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["ACRESCIMO_BAMAR"]].values, 4)
outliers

In [None]:
outliers = z_score(UC3_df[["ACRESCIMO_BVERM1"]].values, 4)
outliers

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
print(len(outliers)/len(UC3_df[["ACRESCIMO_BVERM1"]].values)*100, "%")

In [None]:
index_value = UC3_df[["ACRESCIMO_BVERM1"]][UC3_df[["ACRESCIMO_BVERM1"]].eq(888.11).any(1)].index.tolist()[0]
UC3_df.at[index_value, 'ACRESCIMO_BVERM1'] = UC3_df.ACRESCIMO_BVERM1.mode()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

## Matriz de Correlação de Dados sem outlier

In [None]:
cor = UC3_df
pear = round(cor.corr(),2)
teste = np.array(pear)
mask = np.zeros_like(pear)
mask[np.triu_indices_from(mask)] = True
with sns.axes_style("white"):
    f, ax = plt.subplots(figsize=(20, 15))
    ax = sns.heatmap(pear, mask=mask, vmax=1, square=True,center=0,annot=True,annot_kws={"fontsize":14}, cmap="RdBu")
    plt.title('''Pearson's Correlation Heatmap''',fontsize = 20)
    plt.xticks(fontsize=17,rotation=90)
    plt.yticks(fontsize=17,rotation=0)
    cax = plt.gcf().axes[-1] #para alterar fonte do eixo y direito
    cax.tick_params(labelsize=20) #para alterar fonte do eixo y direito

## Exemplo de Diagrama de Dispersão de Variaveis não Correlacionadas e Correlacionadas

In [None]:
fig, ax = plt.subplots(figsize=(16,8))
ax.scatter(UC3_df["REAT_KVAR_FPONTA"], UC3_df["TAR_REAT_FPONTA"])
ax.set_xlabel('REAT_KVAR_FPONTA')
ax.set_ylabel('TAR_REAT_FPONTA')
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(16,8))
ax.scatter(UC3_df["VALOR_DA_FATURA"], UC3_df["CONSUMO_TOTAL"])
ax.set_xlabel('Valor da Fatura')
ax.set_ylabel('Consumo Total')
plt.show()

# Exportação para csv

In [None]:
#import glob
#from google.colab import files

In [None]:
#UC3_df.to_csv('uc3.csv')
#files.download('uc3.csv')

# Modeling

In [None]:
df_train = UC3_df["CONSUMO_TOTAL"].iloc[:75]
df_test = UC3_df["CONSUMO_TOTAL"].iloc[75:]

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(df_test, marker='o', color="r")
_ = plt.plot(df_train, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("KVAR")
_ = plt.legend([ 'Dados de Test', 'Dados de Treino'])
_ = plt.title("Consumo Total")
plt.show()

In [None]:
! pip install pmdarima

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(df_test, marker='o', color="r")
_ = plt.plot(df_train, marker='o', color="b")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("KVAR")
_ = plt.legend([ 'Dados de Test', 'Dados de Treino'])
_ = plt.title("Consumo Total")
plt.show()

In [None]:
from pmdarima.arima import ADFTest

In [None]:
from pmdarima.arima import auto_arima

In [None]:
adf_test = ADFTest(alpha=0.05)

In [None]:
adf_test.should_diff(df_train)

In [None]:
arima_model = auto_arima(df_train, start_p=0, d=1, start_q=0, max_p=5, max_d=5, max_q=5, start_P=0, D=1, start_Q=0, max_P = 5, max_D = 5, max_Q=5, m=12, seasonal = True, error_action = 'warn', trace = True, supress_warning = True, stepwise = True, random_state= 20, nfits = 50)

In [None]:
arima_model.summary()

In [None]:
predicoes = pd.DataFrame(arima_model.predict(n_periods = 12), index =df_test.index)
predicoes.columns = ['predicoes']

In [None]:
fig, ax = plt.subplots(figsize=(15, 5))
_ = plt.plot(df_test, marker='o', color="r")
_ = plt.plot(df_train, marker='o', color="b")
_ = plt.plot(predicoes, marker='o', color="g")
_ = plt.xlabel("Tempo")
_ = plt.ylabel("KWH")
_ = plt.legend([ 'Dados de Test', 'Dados de Treino', 'Previsões'])
_ = plt.title("Consumo Total")
plt.show()

# Avaliação

$R M S E=\sqrt{\sum_{i=1}^{n} \frac{\left(\hat{y}_{i}-y_{i}\right)^{2}}{n}}$

In [None]:
def RMSE(yh, y):
  er = yh - y
  RMSE = sum(er*er/len(er))**0.5
  return RMSE

In [None]:
np.mean(RMSE(df_test.values, predicoes.values))

# Resultado Banco de dados com imputações

In [None]:
UC3_df.describe()

In [None]:
UC3_df.info()

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,30))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  sns.boxplot(x=UC3_df[col])

In [None]:
f, axs = plt.subplots(5, 5,figsize=(20,20))
for i,col in enumerate(UC3_df.columns[3:]):
  plt.subplot(5, 5, i+1)
  plt.title(col)
  plt.plot(UC3_df.DATA, UC3_df[col])

In [None]:
fig = plt.figure(figsize = (15,20))
ax = fig.gca()
UC3_df.hist(ax = ax);

In [None]:
UC3_df.to_csv(r'UC3.csv', index = False)

In [None]:
#sns.pairplot(UC3_df[3:], palette='bwr')