## Estatísticas da Pesquisa sobre estrabismo da Dra. Carmen

In [3]:
# Importar bibliotecas e funções
import pandas as pd
import plotly.graph_objects as go

def histograma_escore(df, title, column1, column2):

    hist_data1 = df[column1]
    hist_data2 = df[column2]
    
    bins = {
        "start": min(hist_data1.min(), hist_data2.min()), #min_value
        "end": max(hist_data1.max(), hist_data2.max()), # max_value
        "size": 4 #bin_size
    }

    histogram_data1 = go.Histogram(
        x=hist_data1, 
        opacity=0.7, 
        xbins=bins, 
        name="Antes",
        text=hist_data1.values,
        textposition='auto'
        )

    histogram_data2 = go.Histogram(
        x=hist_data2, 
        opacity=0.7, 
        xbins=bins, 
        name="Depois",
        text=hist_data2.values,
        textposition='auto'
    )

    fig = go.Figure()
    fig.add_trace(histogram_data1)
    fig.add_trace(histogram_data2)
    fig.update_layout(
        title=title,
        xaxis_title="Escore",
        yaxis_title="Frequência",
        barmode='overlay',
        width=800,
        bargap=0.01, 
        bargroupgap=0.01
    )

    return fig

def pizza(df, column):
    
    value_counts = df[column].sort_values(by=column).value_counts()

    fig = go.Figure(data=[go.Pie(labels=value_counts.index, values=value_counts)])
    fig.update_layout(title=f"Distribuição por {column}", width=800 )
    return fig

def barchart(df, col, order=None):
    
    value_counts = df[col].value_counts().sort_index()
    if order is not None: 
        value_counts = value_counts.reindex(order)

    data = [go.Bar(
        x=value_counts.index, 
        y=value_counts,
        text=value_counts.values,
        textposition='auto'
    )]
    
    fig = go.Figure(data=data)
    fig.update_layout(
        title=f"Distribuição de {col}",
        xaxis_title="Grupo",
        yaxis_title="Quantidade"
    )

    return fig

### DASS-21

In [71]:
# Importar CSVs
df_dass = pd.read_csv('data_dass.csv', delimiter=',')

#Escore depressão é composto pelas questões:
# 3,5,10,13,16 e 17
df_dass['escore_depressao_antes'] = df_dass['Q3A'] + df_dass['Q5A'] + df_dass['Q10A'] + df_dass['Q13A'] + df_dass['Q16A'] + df_dass['Q17A'] + df_dass['Q21A']
df_dass['escore_depressao_depois'] = df_dass['Q3D'] + df_dass['Q5D'] + df_dass['Q10D'] + df_dass['Q13D'] + df_dass['Q16D'] + df_dass['Q17D'] + df_dass['Q21D']

#Escore ansiedade é composto pelas questões:
# 2,4,7,9,15,19 e 20
df_dass['escore_ansiedade_antes'] = df_dass['Q2A'] + df_dass['Q4A'] + df_dass['Q7A'] + df_dass['Q9A'] + df_dass['Q15A'] + df_dass['Q19A'] + df_dass['Q20A']
df_dass['escore_ansiedade_depois'] = df_dass['Q2D'] + df_dass['Q4D'] + df_dass['Q7D'] + df_dass['Q9D'] + df_dass['Q15D'] + df_dass['Q19D'] + df_dass['Q20D']

#Escore estresse é composto pelas questões:
# 1,6,8,11,12,14 e 18
df_dass['escore_estresse_antes'] = df_dass['Q1A'] + df_dass['Q6A'] + df_dass['Q8A'] + df_dass['Q11A'] + df_dass['Q12A'] + df_dass['Q14A'] + df_dass['Q18A']
df_dass['escore_estresse_depois'] = df_dass['Q1D'] + df_dass['Q6D'] + df_dass['Q8D'] + df_dass['Q11D'] + df_dass['Q12D'] + df_dass['Q14D'] + df_dass['Q18D']

In [76]:
# Gráficos

escores_dass = [
    { 
        "titulo": "Histograma - Depressão (antes e depois)",
        "antes": 'escore_depressao_antes',
        "depois": 'escore_depressao_depois',
    },
    { 
        "titulo": "Histograma - Ansiedade (antes e depois)",
        "antes": 'escore_ansiedade_antes',
        "depois": 'escore_ansiedade_depois',
    },
    { 
        "titulo": "Histograma - Estresse (antes e depois)",
        "antes": 'escore_estresse_antes',
        "depois": 'escore_estresse_depois',
    }
]
i = 1
for escore in escores_dass:
    fig = histograma_escore(df_dass, escore['titulo'], escore['antes'], escore['depois'])
    fig.show()
    fig.write_image(f"2.{i}. DASS-21 - {escore['titulo']}.png", format="png")
    i += 1

### SIBID-S

In [74]:
# Importar CSVs
import pandas as pd
df_sbids = pd.read_csv('data_sbids.csv', delimiter=',')

#Escore SBDI-S é composto pela soma das questões 1 a 7:
df_sbids['escore_antes'] = df_sbids.iloc[:, 1:8].sum(axis=1)
df_sbids['escore_depois'] = df_sbids.iloc[:, 8:15].sum(axis=1)

In [75]:
# Gráficos
fig = histograma_escore(df_sbids, "SIBID-S", "escore_antes", "escore_depois")
fig.show()
fig.write_image("3. SIBID-S.png", format="png")

### Sociodemografico

In [1]:
import pandas as pd
df_sociodemografico = pd.read_csv('data_sociodemografico.csv', delimiter=',')

df_sociodemografico.rename(columns={"Sexo": "Genero"}, inplace=True)

education_mapping = {
    'Ensino fundamental incompleto': 'Fundamental incompleto', 
    'Ensino fundamental completo': 'Fundamental completo', 
    'Ensino médio incompleto': 'Médio incompleto',
    'Ensino médio completo': 'Médio completo',
    'Superior incompleto': 'Superior incompleto',
    'Superior completo': 'Superior completo'
}

df_sociodemografico['Grau de instrução'] = df_sociodemografico['Grau de instrução'].map(education_mapping)

order = {
    'Faixa etária': None, 
    'Raça e etnia': None, 
    'Com quem mora': None, 
    'Grau de instrução': [
        'Fundamental incompleto', 
        'Fundamental completo', 
        'Médio incompleto',
        'Médio completo',
        'Superior incompleto',
        'Superior completo'
    ], 
    'Renda familiar': [
        'Até 1 salário mínimo',
        'Entre 2 a 3 salários mínimos',
        'De 3 a 5 salários mínimos', 
        'Acima de 5 salários mínimos', 
    ], 
    'PNE': None, 
    'Profissão': None, 
    'Fumante': None, 
    'Bebida alcoólica': None, 
    'Exercício': [
        'Sim', 
        'Raramente', 
        'Não', 
        'Não informou'
    ], 
    'Obeso': None, 
    'Genero': None, 
    'Estado civil': None, 
    'Tempo com estrabismo': None
}

In [None]:
print(df_sociodemografico.columns[1:].tolist())
print(df_sociodemografico['Exercício'].unique())
fig = barchart(df_sociodemografico, 'Grau de instrução')
fig.show()

### Dados Sociodemograficos

In [4]:
i = 1
for col in df_sociodemografico.columns[1:].tolist():
    fig = barchart(df_sociodemografico, col, order[col])
    fig.show()
    fig.write_image(f"1.{i}. Sociodemografico - {col}.png", format="png")
    i += 1