# Koszty ubezpieczeń medycznych USA

W tym projekcie przyjrzymy się zestawowi danych pacjentów, których informacje zostały zebrane. Głównym celem jest obliczenie przewidywanych kosztów ubezpieczeń medycznych dla każdego pacjenta oraz skupienie się na analizie tych kosztów. Te dane ustanowią fundament naszej nowej bazy danych - zapisy medyczne, która ma być czysta, czytelna oraz możliwa do aktuaizowania, w przypadku jeśli takowe aktualizacje wystąpią. Na końcu będziemy analizować oraz sortować naszą własną bazę danych.

Na początku powinien zostać zimportowany moduł csv, ponieważ będziemy pracować na zestawie danych zebranych w pliku o rozszerzeniu csv.

In [1]:
import csv

Teraz, kiedy mam pełny dostęp do modułu csv, możemy czytać zestaw danych naszych pacjentów. Poszczególne informacje o naszych pacjentach będą dodawane do różnych list aby nadać naszemu kodu trochę czystości.

In [7]:
age_list = []
sex_list = []
bmi_list = []
children_list = []
smoker_list = []
region_list = []
charges_list = []

with open("insurance.csv", "r") as insurance_csv:

    insurance_csv_reader = csv.DictReader(insurance_csv)
    for insurance in insurance_csv_reader:

        age_list.append(insurance["age"])
        sex_list.append(insurance["sex"])
        bmi_list.append(insurance["bmi"])
        children_list.append(insurance["children"])
        smoker_list.append(insurance["smoker"])
        region_list.append(insurance["region"])
        charges_list.append(insurance["charges"])
        

Informacje o wszystkich naszych pacjentach zostały zebrane i przydzielone do poszczególnych list. To umożliwi nam obliczenie przewidywanego kosztu ubezpieczenia dla każdej jednostki. W tym celu będziemy przeprowadzać iterację przez każdą listę aby upewnić się że żaden element nie zostanie pominięty, a potem użyjemy schematu do obliczeń.

In [3]:
estimated_insurance_cost_list = []

for age, sex, bmi, children, smoker in zip(age_list, sex_list, bmi_list, children_list, smoker_list):
    if sex == "male":
        sex = 1
    else:
        sex = 0

    if smoker == "yes":
        smoker = 1
    else:
        smoker = 0

    estimated_cost = 250 * int(age )- 128 * int(sex) + 370 * float(bmi) + 425 * int(children) + 24000 * int(smoker) - 12500
    estimated_cost_rounded = round(estimated_cost, 2)
    estimated_insurance_cost_list.append(estimated_cost_rounded)

print(estimated_insurance_cost_list)

[26573.0, 4791.9, 7857.0, 4022.85, 6057.6, 4773.8, 11797.8, 8288.8, 8509.1, 12060.8, 3323.4, 36727.3, 5850.0, 16233.4, 33710.1, 1649.0, 12313.6, 1944.65, 16283.0, 31933.0, 15821.85, 7413.0, 4489.0, 32235.4, 7841.25, 13781.4, 11791.45, 14226.75, -20.55, 33403.0, 30044.0, 1736.55, 4957.0, 13596.7, 32265.0, -320.75, 16472.05, 1568.0, 34114.9, 41135.0, 3342.0, 9653.1, 6105.6, 8996.0, 11005.5, 14923.0, 7156.05, 7364.9, 11576.1, 33821.0, 5181.25, 6043.1, 34157.0, 33111.1, 9390.3, 40395.35, 14625.25, 28443.6, 33640.6, 10663.95, 9520.2, 7776.2, 12936.0, 4520.95, 24795.4, 2943.0, 18067.0, 7533.55, 10890.3, 28519.6, 27407.5, 7792.0, 12422.0, 14140.7, 9360.0, 14205.7, 6123.3, 5768.1, 7727.85, 9947.05, 5494.45, 12915.45, 31216.4, 16455.1, 34476.0, 31943.15, 37279.2, 11564.0, 9263.8, 11232.6, 7361.3, 10349.15, 38434.1, 9836.9, 39931.0, 8844.4, 13671.0, 15285.6, 32753.5, 28013.0, 9442.0, 4292.2, 3142.55, 39095.4, 6600.0, 27166.25, 3183.0, 6145.75, 4959.8, 40105.3, 13740.1, 13089.0, 8018.0, 5966.4, 1

Na tym poziomie badania, jesteśmy zdolni do obliczenia średniego kosztu w naszych zapisach medycznych i dać naszym pacjentom cenne informacje o ich kosztach ubecpieczenia. W następnym kroku skupimy się na wyświetlaniu wiadomości dla naszych pacjentów, które będą informowały o tym, czy ich koszt ubezpieczenia jest ponad, czy poniżej średniej oraz co powinni zrobić aby obniżyć ich koszta, jeśli chcą.

In [4]:
total_cost = sum(estimated_insurance_cost_list)
costs_ammount = len(estimated_insurance_cost_list)
averge_estimated_insurance_cost = round(total_cost / costs_ammount, 2)

print(f"Średnia przewidywanych kosztów ubezpieczeń naszych zapisów medycznych jak dotąd: {averge_estimated_insurance_cost}$")

Średnia przewidywanych kosztów ubezpieczeń naszych zapisów medycznych jak dotąd: 13962.68$


In [10]:
for estimated_insurance_cost in estimated_insurance_cost_list:
    if estimated_insurance_cost < averge_estimated_insurance_cost:
        print(f"\nTwój przewidywany koszt ubezpieczenia: {estimated_insurance_cost}$.") 

        difference = round(averge_estimated_insurance_cost - estimated_insurance_cost, 2)
        print(f"To o {difference}$ poniżej średniej wszystkich zebranych zapisów medycznych jak dotąd.")

    elif estimated_insurance_cost == averge_estimated_insurance_cost:
        print(f"\nTwój przewidywany koszt ubezpieczenia: {estimated_insurance_cost}$.") 
        print("To równa się średniej wszystkich zebranych zapisów medycznych jak dotąd.")

    elif estimated_insurance_cost > averge_estimated_insurance_cost:
        print(f"\nTwój przewidywany koszt ubezpieczenia: {estimated_insurance_cost}$.") 

        difference = round(estimated_insurance_cost - averge_estimated_insurance_cost, 2)
        print(f"To o {difference}$ powyżej średniej wszystkich zebranych zapisów medycznych jak dotąd.")

ystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 15091.6$.
To o 1128.92$ powyżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 32024.9$.
To o 18062.22$ powyżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 3610.0$.
To o 10352.68$ poniżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 8226.75$.
To o 5735.93$ poniżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 6224.35$.
To o 7738.33$ poniżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 14411.15$.
To o 448.47$ powyżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ubezpieczenia: 13032.75$.
To o 929.93$ poniżej średniej wszystkich zebranych zapisów medycznych jak dotąd.

Twój przewidywany koszt ub

In [6]:
def analyze_bmi(bmi_value):
  if bmi_value > 30:
    return('Twoje BMI jest na poziomie otyłości. Aby obniżyć koszt, twoje BMI powinno zostać znacząco obniżone.')
  elif bmi_value >= 25:
    return('Twoje BMI jest na poziomie nadwagi. Aby obniżyć koszt, twoje BMI  powinno zostać obniżone.')
  elif bmi_value >= 18.5 and bmi_value < 25:
    return('Twoje BMI jest na zdrowym poziomie')
  elif bmi_value < 18.5:
    return('Twoje BMI jest na poziomie niedowagi. Podwyższenie twojego BMI nie pomoże w redukowaniu kosztu, lecz poprawi twoje zdrowie.')

def bmi_advice(bmi_value):
  if bmi_value > 25:
      bmi_reduction = bmi_value - 25
      return(f'BMI powinno zostać obniżone o {bmi_reduction} aby utrzymać je na zdrowym poziomie.')
  if bmi_value < 18.5:
      bmi_increase = 18.5 - bmi_value
      return(f'BMI powinno zostać podwyższone o {bmi_increase} aby utrzymać je na zdrowym poziomie.')
  if bmi_value < 25 and bmi_value > 18.5:
      return

import decimal

for bmi in bmi_list:
    bmi = decimal.Decimal(bmi)

    print(f"Analiza: {analyze_bmi(round(bmi, 2))}")
    print(f"Porada: {bmi_advice(round(bmi, 2))}")
    print("\n")

Analiza: Twoje BMI jest na poziomie nadwagi. Aby obniżyć koszt, twoje BMI  powinno zostać obniżone.
Porada: BMI powinno zostać obniżone o 2.90 aby utrzymać je na zdrowym poziomie.


Analiza: Twoje BMI jest na poziomie otyłości. Aby obniżyć koszt, twoje BMI powinno zostać znacząco obniżone.
Porada: BMI powinno zostać obniżone o 8.77 aby utrzymać je na zdrowym poziomie.


Analiza: Twoje BMI jest na poziomie otyłości. Aby obniżyć koszt, twoje BMI powinno zostać znacząco obniżone.
Porada: BMI powinno zostać obniżone o 8.00 aby utrzymać je na zdrowym poziomie.


Analiza: Twoje BMI jest na zdrowym poziomie
Porada: None


Analiza: Twoje BMI jest na poziomie nadwagi. Aby obniżyć koszt, twoje BMI  powinno zostać obniżone.
Porada: BMI powinno zostać obniżone o 3.88 aby utrzymać je na zdrowym poziomie.


Analiza: Twoje BMI jest na poziomie nadwagi. Aby obniżyć koszt, twoje BMI  powinno zostać obniżone.
Porada: BMI powinno zostać obniżone o 0.74 aby utrzymać je na zdrowym poziomie.


Analiza: Twoj

TypeError: unsupported operand type(s) for -: 'float' and 'decimal.Decimal'

In [28]:
def analyze_smoker(smoker_status):
  if smoker_status == 1:
    return('Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.')
  else:
    return('Palenie nie jest dla Ciebie problemem.')

for smoker in smoker_list:
    if smoker == "yes":
        smoker = 1
    else:
        smoker = 0
    
    print(analyze_smoker(smoker))
    print("\n")


zucenie palenia.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.


Palenie nie jest dla Ciebie problemem.


Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Palenie nie jest dla Ciebie problemem.


Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.


Aby zmniejszyć koszt, radzimy przemyśleć rzucenie palenia.


Palenie nie jest dla

Udało się nam poszerzyć naszą bazę danych o wartościowe dane naszych pacjentów w zapisach medycznych. Teraz możemy przejść do kolejnego kroku i stworzyć możliwość aby budować indywidualne profile pacjentów, złożonych z ich własnych danych. Będziemy do tego używać klas pythona aby uczynić je jasnymi i prostymi tak, jak to tylko możliwe. Ponadto napiszemy kilka metod, które zapewnią możliwość aktualizowania danych dla naszych klientów. 

In [35]:
class Patient:

    def __init__(self, first_name, last_name, age, sex, bmi, num_of_children, smoker, region, charges, estimated_insurance_cost):
        self.first_name = first_name
        self.last_name = last_name
        self.age = age

        if sex == "male":
            sex = 1
        else:
            sex = 0

        self.sex = sex
        self.bmi = bmi
        self.num_of_children = num_of_children

        if smoker == "yes":
            smoker = 1
        else:
            smoker = 0

        self.smoker = smoker
        self.region = region 
        self.charges = charges 

        self.estimated_insurance_cost = estimated_insurance_cost

    def estimated_insurance_cost_calculation(self):
        estimated_cost = 250 * int(self.age)- 128 * int(self.sex) + 370 * float(self.bmi) + 425 * int(self.num_of_children) + 24000 * int(self.smoker) - 12500
        print(f"{self.first_name} {self.last_name}, twój przewidywany koszt ubezpieczenia wynosi {estimated_cost} dollarów.")

    
    def update_age(self, new_age):
        self.age = new_age
        print(f"{self.first_name} {self.last_name} ma teraz {new_age} lat.")
        self.estimated_insurance_cost_calculation()

    def update_num_children(self, new_num_children):
        self.num_of_children = new_num_children
        if new_num_children == 1:
            print(f"{self.first_name} {self.last_name} ma teraz {new_num_children} dziecko.")
        else:
            print(f"{self.first_name} {self.last_name} ma teraz {new_num_children} dzieci.")
        self.estimated_insurance_cost_calculation()

    def update_bmi(self, new_bmi):
        self.bmi = new_bmi
        print(f"{self.first_name} {self.last_name}, twoje nowe bmi wynosi {new_bmi}.")
        self.estimated_insurance_cost_calculation()

    def update_smoking_status(self, new_smoking_status):
        self.smoker = new_smoking_status
        if new_smoking_status == 0:
            print(f"{self.first_name} {self.last_name} nie jest już palaczem.")
        elif new_smoking_status == 1:
            print(f"{self.first_name} {self.last_name} jest od tąd palaczem.")
        self.estimated_insurance_cost_calculation()
  
    def patient_profile(self):
        patient_informations = {
        "Imię":self.first_name,
        "Nazwisko":self.last_name,
        "Wiek":self.age,
        "Płeć":self.sex,
        "BMI":self.bmi,
        "Liczba Dzieci":self.num_of_children,
        "Palacz":self.smoker,
        "Region":self.region,
        "Opłaty":self.charges,
        "Przewidywany koszt ubezpieczenia":self.estimated_insurance_cost
        }

        for patient_information_key, patient_information_value in patient_informations.items():
            print (f"{patient_information_key} : {patient_information_value}")



patient_0 = Patient(
    first_name = "Pacjent",
    last_name = "Zero",
    age = age_list[0], 
    sex = sex_list[0],
    bmi = bmi_list[0], 
    num_of_children = children_list[0],
    smoker = smoker_list[0],
    region = region_list[0],
    charges = charges_list[0],
    estimated_insurance_cost = estimated_insurance_cost_list[0]
    )

patient_0.patient_profile()
print("\n")

patient_0.update_age(20)
print("\n")
patient_0.update_bmi(28.0)
print("\n")
patient_0.update_num_children(1)
print("\n")
patient_0.update_smoking_status(0)



Imię : Pacjent
Nazwisko : Zero
Wiek : 19
Płeć : 0
BMI : 27.9
Liczba Dzieci : 0
Palacz : 1
Region : southwest
Opłaty : 16884.924
Przewidywany koszt ubezpieczenia : 26573.0


Pacjent Zero ma teraz 20 lat.
Pacjent Zero, twój przewidywany koszt ubezpieczenia wynosi 26823.0 dollarów.


Pacjent Zero, twoje nowe bmi wynosi 28.0.
Pacjent Zero, twój przewidywany koszt ubezpieczenia wynosi 26860.0 dollarów.


Pacjent Zero ma teraz 1 dziecko.
Pacjent Zero, twój przewidywany koszt ubezpieczenia wynosi 27285.0 dollarów.


Pacjent Zero nie jest już palaczem.
Pacjent Zero, twój przewidywany koszt ubezpieczenia wynosi 3285.0 dollarów.


Ostatni punkt tego projektu zawierać będzie analizę naszej własnej bazy danych, stworzonej z danych naszych pacjentów.


# Analiza kosztów ubepieczeń

In [36]:
highest_estimated_insurance_cost = max(estimated_insurance_cost_list)
print(f"Najwyższy prezewidywany koszt ubezpieczenia w bazie danych: {highest_estimated_insurance_cost}$")

lowest_estimated_insurance_cost = min(estimated_insurance_cost_list)
print(f"Najniższy przewidywany koszt ubezpieczenia w bazie danych: {lowest_estimated_insurance_cost}$")

total_cost = sum(estimated_insurance_cost_list)
costs_ammount = len(estimated_insurance_cost_list)
averge_estimated_insurance_cost = round(total_cost / costs_ammount, 2)
print(f"Średnia kosztów ubezpieczenia w bazie danych: {averge_estimated_insurance_cost}$")

Najwyższy prezewidywany koszt ubezpieczenia w naszej bazie danych: 42541.7$
Najniższy przewidywany koszt ubezpieczenia w naszej bazie danych: -2222.8$
Średnia kosztów ubezpieczenia w naszej bazie danych: 13962.68$


# Analiza wieku

In [11]:
eldest_patient = max(age_list)
print(f"Najstarszy pacjent w bazie danych ma {eldest_patient} lat.")

youngest_patient = min(age_list)
print(f"Najmłodszy pacjent w bazie danych ma {youngest_patient} lat.")

total_age = 0
for age in age_list:
    total_age += int(age)

age_ammount = len(age_list)
averge_age = round(total_age / age_ammount, 0)
print(f"Średnia wieku pacjentów w bazie danych: {averge_age} lat.")

Najstarszy pacjent w bazie danych ma 64 lat.
Najmłodszy pacjent w bazie danych ma 18 lat.
Średnia wieku pacjentów w bazie danych: 39.0 lat.


# Analiza płci

In [44]:
males_ammount = 0
females_ammount = 0

for sex in sex_list:
    if sex == "male":
        males_ammount += 1
    elif sex == "female":
        females_ammount += 1

print(f"Ilość mężczyzn w bazie danych: {males_ammount}")
print(f"Ilość kobiet w bazie danych: {females_ammount}")
    
if males_ammount > females_ammount:
    difference = males_ammount - females_ammount
    print(f"W bazie danych jest o {difference} więcej mężczyzn niż kobiet.")
elif females_ammount > males_ammount:
    difference = females_ammount - males_ammount
    print(f"W bazie danych jest o {difference} więcej kobiet niż mężczyzn.")
elif males_ammount == females_ammount:
    print("Ilość mężczyzn oraz kobiet w bazie danych jest na równym poziomie")


Ilość mężczyzn w bazie danych: 676
Ilość kobiet w bazie danych: 662
W bazie danych jest o 14 więcej mężczyzn niż kobiet.


# Analiza BMI

In [131]:
highest_bmi = max(bmi_list)
lowest_bmi = min(bmi_list)

total_bmi = 0
for bmi in bmi_list:
    total_bmi += float(bmi)

bmi_ammount = len(bmi_list)

averge_bmi = round(total_bmi / bmi_ammount, 2)

print(f"The highest bmi in database: {highest_bmi}")
print(f"The lowest bmi in database: {lowest_bmi}")
print(f"Averge bmi in database: {averge_bmi}")


The highest bmi in database: 53.13
The lowest bmi in database: 15.96
Averge bmi in database: 30.66


# Analiza liczby dzieci

In [45]:
highest_children_ammount_per_parent = 0
lowest_children_ammount_per_parent = 0

for children in children_list:
    if int(children) > highest_children_ammount_per_parent:
        highest_children_ammount_per_parent = int(children)

    if int(children) < lowest_children_ammount_per_parent:
        lowest_children_ammount_per_parent = int(children)


total_children_ammount = 0

for children in children_list:
    total_children_ammount += int(children)



parents = len(children_list)
averge_children_ammount = round(total_children_ammount / parents, 0)

print(f"Najwyższa liczba dzieci przypadająca na rodzica: {highest_children_ammount_per_parent}")
print(f"Najniższa liczba dzieci przypadająca na rodzica: {lowest_children_ammount_per_parent}")
print(f"Średnia liczba dzieci przypadająca na rodzica: {averge_children_ammount}")


Najwyższa liczba dzieci przypadająca na rodzica: 5
Najniższa liczba dzieci przypadająca na rodzica: 0
Średnia liczba dzieci przypadająca na rodzica: 1.0


# Analiza liczby palaczy

In [46]:
smokers = 0
none_smokers = 0

for smoker in smoker_list:
    if smoker == "yes":
        smokers += 1
    elif smoker == "no":
        none_smokers += 1

print(f"Ilość osób palących w bazie danych: {smokers}")
print(f"Ilość osób niepalących w bazie danych: {none_smokers}")

if smokers > none_smokers:
    difference = smokers - none_smokers
    print(f"W bazie danych jest o {difference} więcej osób palących niż niepalących.")
elif none_smokers > smokers:
    difference = none_smokers - smokers
    print(f"W bazie danych jest o {difference} więcej osób nieplących niż palących.")
elif smokers == none_smokers:
    print(f"Ilość osób palących oraz nie palących jest na tym samym poziomie.")




Ilość osób palących w bazie danych: 274
Ilość osób niepalących w bazie danych: 1064
W bazie danych jest o 790 więcej osób nieplących niż palących


# Analiza regionu

In [51]:
region_names = set(region_list)

print(f"Lista regionów z których pochodzą nasi pacjenci:")
for region in region_names:
    print(f"-{region.title()}")
print("\n")

print(f"Liczba pacjentów z północnego zachodu: {region_list.count('northwest')}")
print(f"Liczba pacjentów z północnego wschodu: {region_list.count('northeast')}")
print(f"Liczba pacjentów z południowego zachodu: {region_list.count('southwest')}")
print(f"Liczba pacjentów z południowego wschodu: {region_list.count('southeast')}")








Lista regionów z których pochodzą nasi pacjenci:
-Northwest
-Southeast
-Southwest
-Northeast


Liczba pacjentów z północnego zachodu: 325
Liczba pacjentów z północnego wschodu: 324
Liczba pacjentów z południowego zachodu: 325
Liczba pacjentów z południowego wschodu: 364


# Analiza opłat

In [60]:
float_charges_list = []
for charge in charges_list:
    float_charges_list.append(float(charge))

highest_charges = round(max(float_charges_list), 2)
lowest_charges = round(min(float_charges_list), 2)

total_charges = 0
for charges in charges_list:
    total_charges += float(charges)
charges_ammount = len(charges_list)
averge_charges = round(total_charges / charges_ammount, 2)

print(f"Najwyższy zapis opłat w bazie danych: {highest_charges}$")
print(f"Najniższy zapis opłat w bazie danych: {lowest_charges}$")
print(f"Średnia opłat w bazie danych: {averge_charges}$")

Najwyższy zapis opłat w bazie danych: 63770.43$
Najniższy zapis opłat w bazie danych: 1121.87$
Średnia opłat w bazie danych: 13270.42$


## Podczas tego projektu wyjaśniliśmy poniższe aspekty:

### 1. Zdobyliśmy niezbędne informacje o pacjentach z pliku insurance.csv: ✓
        * wiek
        * płeć
        * bmi  
        * ilość dzieci
        * status palenia
        * region
        * opłaty
        
### 2. Obliczyliśmy przewidywany koszt ubezpieczenia dla każdego z pacjentów ✓

### 3. Poddaliśmy analizie koszt ubezpieczenia pacjentów: ✓
        * obliczyliśmy średni koszt ubezpieczenia wśród zapisów medycznych ✓
        * wyświetliliśmy informacje która powiadamia pacjenta o wysokości jego kosztu ubezpieczenia, o tym czy jest on powyżej czy poniżej średniej oraz o ile ✓
        * daliśmy poradę co dany pacjent powinien zrobić aby obniżyć ewentualny koszt ✓

### 4. Stworzyliśmy możliwość dla klientów aby mogli tworzyć swój własny profil pacjenta ✓

### 5. Stworzyliśmy możliwość wprowadzania aktualizacji do naszej bazy danych ✓

### 6. Poddaliśmy analizie naszą własną bazę danych ✓


# Dziękuję za uwagę, Jakub Weleziński