# TPC1: Análise de dados: doença cardíaca

Descarregue o ficheiro de dados: `myheart.csv`
Crie um programa em Python, conjunto de funções, que responda às seguintes questões:
* Crie uma função que lê a informação do ficheiro para um modelo, previamente pensado em memória;
* Pense num modelo para guardar uma distribuição;
* Crie uma função que calcula a distribuição da doença por sexo;
* Crie uma função que calcula a distribuição da doença por escalões etários. Considere os seguintes escalões: [30-34], [35-39], [40-44], ...
* Crie uma função que calcula a distribuição da doença por níveis de colesterol. Considere um nível igual a um intervalo de 10 unidades, comece no limite inferior e crie os níveis necessários até abranger o limite superior;
* Crie uma função que imprime na forma de uma tabela uma distribuição;
* Especifique um programa que ao executar apresenta as tabelas correspondentes às distribuições pedidas;
* Extra: explore o módulo matplotlib e crie gráficos para as suas distribuições.

### Ex 1:

In [None]:
def read_csv(file) -> list[str]:
    _, *content = file.readlines()
    return content

from functools import reduce

class person:
    def __init__(self, line: str):
        raw = line.split(',')
        self.data_fields = {}
        self.data_fields['age'] = int(raw[0])
        self.data_fields['sex'] = raw[1]
        self.data_fields['tension'] = int(raw[2])
        self.data_fields['colesterol'] = int(raw[3])
        self.data_fields['heart_bpm'] = int(raw[4])
        self.data_fields['has_disease'] = raw[5][0] == '1'

    def __str__(self):
        return str(self.data_fields)
    
    def __repr__(self):
        return str(self)

class db:
    def __init__(self, content: list[str]):
        self.db_content = []
        for line in content:
            self.db_content.append(person(line))

    def __eq__(self, other: object) -> bool:
        return self.db_content == other.content

    def __str__(self):
        return reduce(lambda x, y: f'{x}{y}\n', self.db_content, '')
    
    def __repr__(self):
        return str(self)

### Ex 2:

In [None]:
from db import db
from typing import Callable, Any

class distribution:
    def __init__(self, db: db, key: str, key_func: Callable[[Any], str] = None):
        self.dist: dict = {}
        self.key = key
        if key_func == None:
            for person in db.db_content:
                new_key = person.data_fields[key]
                if new_key not in self.dist:
                    self.dist[new_key] = [0, 0]
                i: int = 1 if person.data_fields['has_disease'] else 0
                self.dist[new_key][i] += 1
        else:
            for person in db.db_content:
                new_key = key_func(person.data_fields[key])
                if new_key not in self.dist:
                    self.dist[new_key] = [0, 0]
                i: int = 1 if person.data_fields['has_disease'] else 0
                self.dist[new_key][i] += 1

    def __str__(self) -> str:
        rep: str = ''
        rep += f'distribution by {self.key}\n[has disease]\t[doesn\'t have disease]\n'
        
        for k, v in self.dist.items():
            rep += f'{k}: {v[0]} {v[1]}\n'
        return rep

    def __repr__(self) -> str:
        return str(self)


### Ex 3:

In [None]:
def disease_by_sex(db: db):
    return distribution(db, 'sex')

### Ex 4:

In [None]:
def disease_by_age_group(db: db):
    grouper = lambda k: f'{(k // 5) * 5}-{((k // 5) * 5) + 4}'
    return distribution(db, 'age', grouper)

### Ex 5:

In [None]:
def disease_by_colesterol(db: db):
    grouper = lambda k: f'{(k // 10) * 10}-{((k // 10) * 10) + 9}'
    return distribution(db, 'colesterol', grouper)

### Ex 6:

In [None]:
# na class distribution
def __str__(self) -> str:
    rep: str = ''
    rep += f'distribution by {self.key}\n[has disease]\t[doesn\'t have disease]\n'
    
    for k, v in self.dist.items():
        rep += f'{k}: {v[0]} {v[1]}\n'
    return rep

### Ex 7:

In [None]:
if __name__ == '__main__':
    file = open('myheart.csv', 'r')
    data_base = db(read_csv(file))
    print(disease_by_sex(data_base))
    print(disease_by_age_group(data_base))
    print(disease_by_colesterol(data_base))

### Extra:
###### Ex 3:
![Sex distribuition](Dist_sex.png)
###### Ex 4:
![Age distribuition](Dist_age.png)
###### Ex 5:
![Colesterol distribuition](Dist_colesterol.png)