## Manifesto do TPC6
* *Identificador:* Algoritmos e Técnicas de Programação
* *Título:* Aplicação para Gerir um Cinema
* *Data de início:* 2023-10-22
* *Data de fim:* 2023-10-22
* *Supervisor:* José Carlos Leite Ramalho, jcr@di.uminho.pt; Luís Filipe Costa Cunha, lfc@di.uminho.pt
* *Autor:* Liliana Miranda Quelha A93767

*Resumo:* Este trabalho tem como objetivo desenvolver um programa de tabelamento de informação referente as doença cardíacas e fatores que o influenciam. Para esse objetivo, o programa terá as seguintes funções: 

* função que lê a informação do ficheiro para um modelo, previamente pensado em memória;
* função que calcula a distribuição da doença por sexo em que se deve ter em atenção que existem indivíduos doentes e não doentes no dataset;
* função que calcula a distribuição da doença por escalões etários. Considerando os seguintes escalões: [0-10], [11-24], [25-29], [30-34], [35-39], [40-44], ...
* função que calcula a distribuição da doença por níveis de glucose em que se coonsidera um nível igual a um intervalo de 10 unidades
* função que imprime na forma de uma tabela uma distribuição;

In [9]:
pip install pandas

Note: you may need to restart the kernel to use updated packages.


In [None]:
import os
import numpy as np
import pandas as pd

# Função para ler o arquivo CSV e carregar os dados em um DataFrame
def carregar_dados_csv(diabetes_prediction_dataset):
    if os.path.exists(diabetes_prediction_dataset):
        data = pd.read_csv(diabetes_prediction_dataset)
        return data
    else:
        print("Error: File not found")
        return None

# Função para calcular a distribuição da doença por sexo
def distribuicao_por_sexo(df):
    distribuicao_sexo = df['gender'].value_counts()
    return distribuicao_sexo

# Função para calcular a distribuição da doença por escalões etários
def distribuicao_por_idade(df):
    bins = [0, 10, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
    labels = ['0-10', '11-24', '25-29', '30-34', '35-39', '40-44', '45-49', '50-54', '55-59', '60-64', '65-69', '70-74', '75-79', '80-84', '85-89', '90-95']
    df['age'] = pd.cut(df['age_group'], bins=bins, labels=labels, right=False)
    distribuicao = df['age'].value_counts()
    return distribuicao

# Função para calcular a distribuição da doença por níveis de glucose
def distribuicao_por_glucose(df):
    bins = list(range(50, 200, 10))
    df['blood_glucose_level'] = pd.cut(df['glucose'], bins=bins, right=False)
    distribuicao = df['blood_glucose_level'].value_counts()
    return distribuicao

# Função para imprimir uma distribuição na forma de uma tabela
def imprimir_distribuicao(distribuicao, titulo):
    print(titulo)
    print('-' * 40)
    print(distribuicao)
    print('-' * 40)

# Programa principal
if __name__ == "__main__":
    file_path = "diabetes_prediction_dataset.csv"
    df = carregar_dados_csv(file_path)

    distribuicao_sexo = distribuicao_por_sexo(df)
    imprimir_distribuicao(distribuicao_sexo, "Distribuição por Sexo")

    distribuicao_idade = distribuicao_por_idade(df)
    imprimir_distribuicao(distribuicao_idade, "Distribuição por Escalões Etários")

    distribuicao_glucose = distribuicao_por_glucose(df)
    imprimir_distribuicao(distribuicao_glucose, "Distribuição por Níveis de Glucose")