# Analisa Variabel Kontinu (CFD)

1. Mencari peluang besar tagihan berdasarkan BMI
2. Mencari kemungkin terjadi, seorang perokok dengan BMI diatas 25 akan mendapatkan
tagihan kesehatan di atas 16.700.
3. Berapa peluang seseorang acak tagihan kesehatannya diatas 16.7k diketahui dia adalah
perokok
4. Mana yang lebih mungkin terjadi
        a. Seseorang dengan BMI diatas 25 mendapatkan tagihan kesehatan diatas 16.7k,
           atau
        b. Seseorang dengan BMI dibawah 25 mendapatkan tagihan kesehatan diatas
           16.7k
    
5. Mana yang lebih mungkin terjadi
        a. Seseorang perokok dengan BMI diatas 25 mendapatkan tagihan kesehatan
           diatas 16.7k, atau
        b. Seseorang non perokok dengan BMI diatas 25 mendapatkan tagihan kesehatan
           diatas 16.7k

In [1]:
import pandas as pd
import numpy as np
from numpy import cov
import seaborn as sns
import matplotlib.pyplot as plt

In [2]:
def load_data_insurance():
    data_insurance = pd.read_csv("insurance.csv")
    data_insurance = data_insurance.assign(bmi_category=pd.cut(data_insurance['bmi'], 
                               bins=[0, 25, 60], 
                               labels=['normal', 'over']))
    data_insurance = data_insurance.assign(charges_category=pd.cut(data_insurance['charges'], 
                               bins=[0, 16_700, 65_000], 
                               labels=['normal', 'high']))
    return data_insurance

In [3]:
data_insurance = load_data_insurance()
data_smoker = data_insurance.query('smoker=="yes"')
data_non_smoker = data_insurance.query('smoker=="no"')

In [4]:
# 2. Mencari kemungkinan terjadi, seorang perokok dengan BMI diatas 25 akan mendapatkan tagihan kesehatan di atas 16.700.

crosstab_bmi_vs_charges_of_smoker = pd.crosstab(data_smoker['charges_category'], data_smoker['bmi_category'])
total_smoker = crosstab_bmi_vs_charges_of_smoker['normal'].sum() + crosstab_bmi_vs_charges_of_smoker['over'].sum()
smoker_bmi_over_charges_high = crosstab_bmi_vs_charges_of_smoker['over']['high']

p_smoker_bmi_over_charges_high = smoker_bmi_over_charges_high/total_smoker

print(f"Peluang perokok dengan BMI di atas 25 (over) akan mendapatkan tagihan kesehatan di atas 16.700 (high) adalah {p_smoker_bmi_over_charges_high:.2f}\n")
print(crosstab_bmi_vs_charges_of_smoker)

Peluang perokok dengan BMI di atas 25 (over) akan mendapatkan tagihan kesehatan di atas 16.700 (high) adalah 0.78

bmi_category      normal  over
charges_category              
normal                16     4
high                  39   215


In [5]:
# 3. Berapa peluang seseorang acak tagihan kesehatannya diatas 16.7k diketahui dia adalah perokok?

crosstab_charges_vs_smoker = pd.crosstab(data_insurance['charges_category'], data_insurance['smoker'])

charges_high_and_smoker = crosstab_charges_vs_smoker['yes']['high']

p_charges_high_given_smoker = charges_high_and_smoker/total_smoker

print(f"Peluang seseorang acak tagihan kesehatannya diatas 16.7k diketahui dia adalah perokok adalah {p_charges_high_given_smoker:.2f}\n")
print(crosstab_charges_vs_smoker)

Peluang seseorang acak tagihan kesehatannya diatas 16.7k diketahui dia adalah perokok adalah 0.93

smoker             no  yes
charges_category          
normal            984   20
high               80  254


In [6]:
# 4. Mana yang lebih mungkin terjadi
#    a. Seseorang dengan BMI diatas 25 mendapatkan tagihan kesehatan diatas 16.7k,
#       atau
#    b. Seseorang dengan BMI dibawah 25 mendapatkan tagihan kesehatan diatas 16.7k

crosstab_bmi_vs_charges = pd.crosstab(data_insurance['charges_category'], data_insurance['bmi_category'])

total = crosstab_bmi_vs_charges['normal'].sum() + crosstab_bmi_vs_charges['over'].sum()
bmi_over_charges_high = crosstab_bmi_vs_charges['over']['high']
bmi_normal_charges_high = crosstab_bmi_vs_charges['normal']['high']

p_bmi_over_charges_high = bmi_over_charges_high/total
p_bmi_normal_charges_high = bmi_normal_charges_high/total

print(f"Peluang seseorang dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan diatas 16.7k (high) adalah {p_bmi_over_charges_high:.2f}")
print(f"Peluang seseorang dengan BMI di bawah 25 (normal) mendapatkan tagihan kesehatan diatas 16.7k (high) adalah {p_bmi_normal_charges_high:.2f}\n")

print(crosstab_bmi_vs_charges)

Peluang seseorang dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan diatas 16.7k (high) adalah 0.21
Peluang seseorang dengan BMI di bawah 25 (normal) mendapatkan tagihan kesehatan diatas 16.7k (high) adalah 0.04

bmi_category      normal  over
charges_category              
normal               196   808
high                  51   283


In [7]:
# 5. Mana yang lebih mungkin terjadi
#    a. Seseorang perokok dengan BMI diatas 25 mendapatkan tagihan kesehatan diatas 16.7k, atau
#    b. Seseorang non perokok dengan BMI diatas 25 mendapatkan tagihan kesehatan diatas 16.7k

print(f"Peluang seseorang perokok dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan di atas 16.700 (high) adalah {p_smoker_bmi_over_charges_high:.2f}\n")
print(crosstab_bmi_vs_charges_of_smoker)


crosstab_bmi_vs_charges_of_non_smoker = pd.crosstab(data_non_smoker['charges_category'], data_non_smoker['bmi_category'])
total_non_smoker = crosstab_bmi_vs_charges_of_non_smoker['normal'].sum() + crosstab_bmi_vs_charges_of_non_smoker['over'].sum()
non_smoker_bmi_over_charges_high = crosstab_bmi_vs_charges_of_non_smoker['over']['high']

p_non_smoker_bmi_over_charges_high = non_smoker_bmi_over_charges_high/total_non_smoker

print()
print(f"Peluang seseorang non perokok dengan BMI di atas 25 (over) akan mendapatkan tagihan kesehatan di atas 16.700 (high) adalah {p_non_smoker_bmi_over_charges_high:.2f}\n")
print(crosstab_bmi_vs_charges_of_non_smoker)

Peluang seseorang perokok dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan di atas 16.700 (high) adalah 0.78

bmi_category      normal  over
charges_category              
normal                16     4
high                  39   215

Peluang seseorang non perokok dengan BMI di atas 25 (over) akan mendapatkan tagihan kesehatan di atas 16.700 (high) adalah 0.06

bmi_category      normal  over
charges_category              
normal               180   804
high                  12    68


In [8]:
# 1. Peluang seseorang dengan BMI di atas 25 mendapatkan tagihan kesehatan di bawah 16.7k

bmi_over_charges_normal = crosstab_bmi_vs_charges['over']['normal']

p_bmi_over_charges_normal = bmi_over_charges_normal/total

print(f"Peluang seseorang dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan di bawah 16.7k (high) adalah {p_bmi_over_charges_normal:.2f}")

Peluang seseorang dengan BMI di atas 25 (over) mendapatkan tagihan kesehatan di bawah 16.7k (high) adalah 0.60
