# Algoritmo: Diagnóstico Diferencial (Parte 1)

## Preparando o dataset...
<br>
<li>One-Hot Encoding para features</li>
<li>Label Encoding para target</li>

In [1]:
import pandas as pd
from sklearn.preprocessing import OneHotEncoder, LabelEncoder

In [2]:
df = pd.read_csv('dd.csv')

# Importa o dataset construído anteriormente.

In [3]:
features = ['HUMOR', 'COGNICAO', 'COMPORTAMENTO', 'PERCEPCAO', 'FISIOLOGICO', 'RISCO', 'DURACAO']
df_features = df[features]

# Armazena as colunas com as características diagnósticas (features).

one_hot_encoder = OneHotEncoder(sparse_output=False)
encoded_features = one_hot_encoder.fit_transform(df_features)

# Cria e aplica o One-Hot Encoder nas features.

encoded_df = pd.DataFrame(encoded_features, columns=one_hot_encoder.get_feature_names_out(features))

# Transforma as novas colunas em um novo dataframe.

In [4]:
target = 'RESULTADO'

# Armazena a coluna que contém o nome dos transtornos mentais (target).

label_encoder = LabelEncoder()
df[target] = label_encoder.fit_transform(df[target])

# Cria e aplica o Label Encoder para transformar cada transtorno mental em um número inteiro único;
# Altera o dataframe original.

In [5]:
df['TRANSTORNO'] = label_encoder.inverse_transform(df[target])

# Cria uma nova coluna no dataframe com os dados originais.

In [6]:
df.head(10)

Unnamed: 0,HUMOR,COGNICAO,COMPORTAMENTO,PERCEPCAO,FISIOLOGICO,RISCO,DURACAO,RESULTADO,TRANSTORNO
0,culpa delirante,recordacao intrusiva,suicida,nao especificado,alteracoes de peso significativas,neuroticismo,> 2 semanas,3,transtorno depressivo maior
1,autoaversao,dificuldade de concentracao,suicida,nao especificado,perturbacoes do sono,evento traumatico,> 2 semanas,3,transtorno depressivo maior
2,disforia,dificuldade para pensar,tentativa de suicidio,nao especificado,catatonia,neuroticismo,> 2 semanas,3,transtorno depressivo maior
3,medo de dano cerebral,acreditar que esta enlouquecendo,robotico,distorcoes visuais,perda de controle dos movimentos,ataques de panico,variavel,0,transtorno de despersonalizacao/desrealizacao
4,reatividade emocional,lembranca recorrente,imprudente,flashbacks,sintomas pos-concussivos,evento traumatico,< 1 mes,1,transtorno de estresse agudo
5,raiva,pesadelos,agressivo,despersonalizacao,resposta de sobressalto exagerada,transtorno mental anterior,< 1 mes,1,transtorno de estresse agudo
6,tristeza,dificuldade de concentracao,irritadico,despersonalizacao,perturbacao do sono,transtorno mental anterior,< 1 mes,1,transtorno de estresse agudo
7,irritacao,pesadelos,automutilante,despersonalizacao,resposta de sobressalto exagerada,transtorno mental anterior,> 2 meses,2,transtorno de estresse pos-traumatico
8,tristeza,ideacao suicida,choro,nao especificado,perda de energia,condicoes medicas incapacitantes,> 2 semanas,3,transtorno depressivo maior
9,vergonha,pesadelos,imprudente,despersonalizacao,sintomas pos-concussivos,transtorno mental anterior,< 1 mes,1,transtorno de estresse agudo


### Target
<br>
<li>0 = Transtorno de Despersonalizacao/Desrealizacao</li>
<li>1 = Transtorno de Estresse Agudo</li>
<li>2 = Transtorno de Estresse Pós-Traumático</li>
<li>3 = Transtorno Depressivo Maior</li>

In [7]:
target_df = df[['RESULTADO', 'TRANSTORNO']]

# Serapa e armazena as 2 colunas referentes ao target no dataframe.

In [8]:
df_final = pd.concat([encoded_df, target_df], axis=1)

# Concatena as colunas dos dataframes criados (features e target).

In [9]:
df_final.shape

(2000, 116)

In [10]:
df_final.to_csv('dd_df.csv', index=False)

# Salva o dataframe como um arquivo csv, sem o índice.