# Aula 23 - Projeto Multidisciplinar I

## Apresentação e discussão

O Projeto Multidisciplinar I consiste na simulação de dados envolvendo pesos e alturas de indivíduos, calculando o IMC (índice de Massa Corporal) e relacionando com dados simulados sobre existência de problemas cardíacos. A simulação deverá contar com dados pseudoaleatórios gerados por simulação computacional e deverá haver correspondência entre problemas cardiácos com a medida do IMC. Ou seja, iremos supor que exista uma correspondência óbvia entre as medidas (modelada matematicamente por equção e coeificentes arbitrariamente definidos). Para cada sexo (sendo eles definidos de forma aleatória).

Você, portanto, simulará via randomização (aleatoriedade) as alturas dentro de uma faixa bem definida. Em seguida, aplicará uma equação que determine, com algum grau de aleatoriedade, os pesos dos indivíduos. Logo depois, calculará o IMC e definirá para cada indivíduo a existência (sim ou não) de problemas cardiácos, ambos com algum grau mnimo de correspondência com o IMC.

Ao final, faça as análises necessárias com medidas de dispersão e de tendência central. Crie as funções para tal. E interprete os IMCs obtido conforme WHO (Organização Mundial da Saúde).

Os dados devem estar reunidos em uma tabela. Todas as técnicas aplicadas aqui são vistas na Aula 22.

### Importando bibliotecas 

In [1]:
import numpy as np #Importando biblioteca numpy
from random import * #Importando biblioteca para randommização
import pandas as pd #Importando Pandas
from sympy import * #Importando biblioteca para escrever equações
import matplotlib.pyplot as plt #Biblioteca para plotagem de gráficos


### Gerando alturas

In [13]:
#Parâmetros iniciais
amostras = 3000 #Tamanho da amostra
media= 1.73
desvio = 0.30


#Gerando alturas aleatórias 
alturas = np.random.normal(media,desvio,amostras)
alturas = alturas.tolist()

### Gerando Pesos

In [14]:
#Equação para gerar pesos
x1 = symbols('alturas_i')
x2 = symbols('n_i')
equation = symbols('pesos')

#Abs para evitar números aleatórios negativos
equation = x1*50 + abs(x2)
equation

50*alturas_i + Abs(n_i)

In [22]:

pesos = []
for i in range (len(alturas)):
    #Gerando números aleatórios em distribuição uniforme de -5 a 5
    #Números negativos serão transformados em positivos devido ao abs
    distribuicao = abs(round(float(uniform(-5,5)),2))
    #armazenando equação
    eq= round(alturas[i]*50 + distribuicao,2)
    pesos.append(eq) #adicionando valores na lista
    
len(pesos)

3000

### Calculando IMC

In [25]:
#Formúla do IMC
#Peso/altura**2
#Arredondando resultados para duas casas decimais
imc = [round(pesos[i]/alturas[i]**2,2) for i in range (amostras)]
len(imc)

3000

### Gerando sexos

In [37]:
#variáveis com as duas possibilidades de sexo
masc,fem = 'M','F'

#random.choice retorna elemento aleatório da lista
sexos = [masc if round(np.random.rand()) == 0 else fem for i in range(amostras)]

#verificando tamanho
print(len(sexos))

3000


### Gerando correspondência com problemas cardíacos

In [None]:
#Fonte: https://progep.ufpb.br/progep/contents/em-destaque/dia-mundial-de-combate-e-prevencao-da-obesidade
#IMC >40. Obesidade Grau III
#IMC > 35. Obesidade Grau II
#IMC > 30. Obesidade Grau I
#IMC >25 E IMC<30. Sobrepeso, possiveis problemas cardiacos

In [36]:
#LEGENDA: S= SIM,POSSUI PROBLEMAS CARDIACOS, P = PROVALVEMENTE POSSUI
# R = REMOTAMANTE POSSUI, N = NÃO POSSUI


cardiacos = []
for i in range (len(imc)):
    if imc[i] >= 40:
        cardiacos.append("S")
    elif imc[i] >= 30 and imc[i]< 40:
        cardiacos.append("P")
    elif imc[i] <30 and imc[i] >=25:
        cardiacos.append("R")
    elif imc[i] < 25:
        cardiacos.append("N")
        
print(len(cardiacos))#verificando tamanho

3000


### Gerando tabelas e funções

In [39]:
#Unindo as listas
dados = alturas,pesos,imc,sexos,cardiacos

df = pd.DataFrame(dados, index=['Altura','Peso','IMC','Sexo','Problema cardiaco']).T
df

Unnamed: 0,Altura,Peso,IMC,Sexo,Problema cardiaco
0,1.975965,103.53,26.52,F,R
1,2.038725,106.68,25.67,F,R
2,1.646826,85.39,31.49,F,P
3,1.970746,102.92,26.5,F,R
4,1.995408,104.15,26.16,M,R
...,...,...,...,...,...
2995,1.972774,102.35,26.3,M,R
2996,1.841377,94.12,27.76,M,R
2997,1.777349,93.52,29.6,M,R
2998,1.943456,99.83,26.43,M,R


In [40]:
#Convertendo para arquivo csv
df.to_csv('df.csv')

In [None]:
#Função para calcular média das colunas
def media(coluna):
    pass
def variancia(coluna):
    pass
def desvio_padrao(coluna):
    pass
def mediana(coluna):
    pass
def coorelacao_person():
    pass
def frequencias()

### Conclusão