# UNIDADE 5:  Redes Neurais


<div style="background-color: #ff87b2; padding: 20px; border-radius: 10px;">
<h3>Atividade 5:</h3>

Para o estudo de caso do Classificação de Casos de Alzheimer discutido na Unidade 1. Gere uma base de dados fictícia com uma quantidade maior de dados (pode usar a IA para te ajudar nisso) ou utilize uma base real. Usando os conhecimentos de limpeza, transformação e criação de um modelo, tratados até o momento, crie um modelo de classificação de dados (escolha o algoritmo) que possua uma acurácia maior do que a aprendida na Unidade 1.

Poste no AVA o Jupyter Notebook ou o link para o repositório GitHub.
  
</div>.

<div style="border: 2px solid #00008B; padding: 15px; border-radius: 10px; background-color: #00008B; color: #FFFFFF; font-family: Arial;">
  <h1 style="margin-top: 0;"> Predição de Tempo de Atravessamento de Ações na Justiça</h1>
  <p>Descrição: Prever o tempo de atravessamento do processo (da solicitação até a efetiva entrega) utilizando informações históricas e considerando as características do processo no momento de autuação.
</p>
</div>

<div style="background-color: #f0f8ff; padding: 20px; border-radius: 10px;">
  <ul>
    <li>Rito (valores: trabalhista ou sumaríssimo)</li>
    <li>Tempo de Serviço do Reclamante (valores: tempo em meses até a data da despensa)</li>
    <li>Último salário do reclamante  (valores: número real)</li>
    <li>Profissão do reclamante (valores: comércio, indústria ou serviço)</li>
    <li>Cargo do reclamante (valores: direção ou execução)</li>
    <li>Objeto do processo (valores: falta de registro em carteira, diferença salarial, verbas recisórias, multa do Art, 477, multa do Art. 467, horas extras e reflexos, fundo de garantia por tempo de serviço, indenização por dados morais, seguro desemprego, vale transporte, adicional de insalubridade, adicional noturno, plano de saúde)</li>
    <li>Quantidade de depoimentos em cada audiência (valores: número inteiro entre 1 e 200)</li>
    <li>Acordo (valores: presença ou ausência)</li>
    <li>Necessidade de perícia (valores: S para Sim e N para Não)</li>
    <li>Solicitação de recurso ordinário contra sentença emitida pelo Juiz de 1 grau  (valores: S para Sim e N para Não)</li>
    <li>Solicitação de recurso de revista contra acordão (valores: S para Sim e N para Não)</li>
    <li>Número de audiências até a emissão da sentença (valores: número inteiro entre 1 e 200)</li>
    <li>Tempo médio de cada audiência (valor inteiro em minutos entre 30 e 1000)</li>
    <li>Duração do processo (valor inteiro em meses entre 1 e 500)</li>
 </ul>
</div>

In [None]:
!pip install pandas

In [None]:
!pip install numpy

In [None]:
!pip install scikit-learn

In [None]:
!pip install seaborn

In [None]:
!pip install streamlit

In [None]:
import pandas as pd
import numpy as np

pd.set_option('display.float_format', '{:.5f}'.format)

import streamlit as st
import joblib

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler
import scipy.stats as stats

import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

import warnings
warnings.filterwarnings('ignore')

# Ingestão de Dados

In [None]:
df_servidor = pd.read_csv("../data/raw/tempo_audiencias.csv")

In [None]:
df_servidor.head(5)

In [None]:
df_servidor.shape

In [None]:
df_servidor.info()

In [None]:
df_servidor.describe()

In [None]:
df_servidor.describe(include=['O'])

In [None]:
for col in df_servidor.select_dtypes(include=['object']).columns:
    print(f'{col}:\n{df_servidor[col].value_counts()}\n')

In [None]:
df_servidor.isna().sum()

# Limpeza e Transformação

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: rito</h3>
</div>

In [None]:
df_servidor["rito"].unique()

In [None]:
categorias = df_servidor['rito'].astype('category').cat.categories
codigos = df_servidor['rito'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['rito'] = df_servidor['rito'].astype('category').cat.codes
df_servidor["rito"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: profissao</h3>
</div>

In [None]:
df_servidor["profissao"].unique()

In [None]:
categorias = df_servidor['profissao'].astype('category').cat.categories
codigos = df_servidor['profissao'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['profissao'] = df_servidor['profissao'].astype('category').cat.codes
df_servidor["profissao"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: cargo</h3>
</div>

In [None]:
df_servidor["cargo"].unique()

In [None]:
categorias = df_servidor['cargo'].astype('category').cat.categories
codigos = df_servidor['cargo'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['cargo'] = df_servidor['profissao'].astype('category').cat.codes
df_servidor["cargo"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: objeto_processo</h3>
</div>

In [None]:
df_servidor["objeto_processo"].unique()

In [None]:
categorias = df_servidor['objeto_processo'].astype('category').cat.categories
codigos = df_servidor['objeto_processo'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['objeto_processo'] = df_servidor['objeto_processo'].astype('category').cat.codes
df_servidor["objeto_processo"].unique()

In [None]:
#df_servidor = pd.get_dummies(df_servidor, columns=['objeto_processo'], prefix='objeto_processo')
#dummy_columns = [col for col in df_servidor.columns if col.startswith('objeto_processo')]
#df_servidor[dummy_columns] = df_servidor[dummy_columns].astype(int)
df_servidor

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: acordo</h3>
</div>

In [None]:
df_servidor["acordo"].unique()

In [None]:
categorias = df_servidor['acordo'].astype('category').cat.categories
codigos = df_servidor['acordo'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['acordo'] = df_servidor['acordo'].astype('category').cat.codes
df_servidor["acordo"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: pericia</h3>
</div>

In [None]:
df_servidor["pericia"].unique()

In [None]:
categorias = df_servidor['pericia'].astype('category').cat.categories
codigos = df_servidor['pericia'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['pericia'] = df_servidor['pericia'].astype('category').cat.codes
df_servidor["pericia"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: recurso_ordinario</h3>
</div>

In [None]:
df_servidor["recurso_ordinario"].unique()

In [None]:
categorias = df_servidor['recurso_ordinario'].astype('category').cat.categories
codigos = df_servidor['recurso_ordinario'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['recurso_ordinario'] = df_servidor['recurso_ordinario'].astype('category').cat.codes
df_servidor["recurso_ordinario"].unique()

<div style="background-color: #f0f8ff; padding: 7px; border-radius: 10px;">
<h3>Variável: recurso_revista</h3>
</div>

In [None]:
df_servidor["recurso_revista"].unique()

In [None]:
categorias = df_servidor['recurso_revista'].astype('category').cat.categories
codigos = df_servidor['recurso_revista'].astype('category').cat.codes
print({codigo: categoria for codigo, categoria in enumerate(categorias)})

In [None]:
df_servidor['recurso_revista'] = df_servidor['recurso_revista'].astype('category').cat.codes
df_servidor["recurso_revista"].unique()

In [None]:
df_servidor

### Normalização (Min-Max Scaling)

In [None]:
scaler = MinMaxScaler()
df_normalizado = pd.DataFrame(scaler.fit_transform(df_servidor), columns=df_servidor.columns)
df_normalizado

In [None]:
# Salvar o scaler ajustado
joblib.dump(scaler, '../models/scaler.pkl')

In [None]:
# Salvar o DataFrame como um arquivo CSV
df_normalizado.to_csv('../data/processed/tempo_audiencias.csv', index=False)