# Nama: Akhmad Haris
# Nim: A11.2022.14626 

# Deskripsi Dataset
> Dataset yang Anda analisis adalah data kesehatan yang berisi informasi tentang partisipan dalam suatu studi atau penelitian. Dataset ini diambil dari lembar kerja Excel yang bernama '2022' dan mencakup berbagai variabel yang berkaitan dengan kesehatan dan kondisi sosial ekonomi partisipan.

In [1]:
import pandas as pd

In [2]:
# Load the Excel file
file_path = r'dataKasus-1.xlsx'
xls = pd.ExcelFile(file_path)

In [3]:
# Load the data from the '2022' sheet
data_2022 = pd.read_excel(xls, sheet_name='2022')

In [4]:
# Drop the unnamed column that seems to be irrelevant
data_cleaned = data_2022.drop(columns=['Unnamed: 12'])

In [5]:
data_cleaned['USIA'] = pd.to_numeric(data_cleaned['USIA'].str.extract(r'(\d+)')[0], errors='coerce')

In [6]:
data_cleaned.dropna(subset=['USIA'], inplace=True)

In [7]:
data_cleaned['USIA'] = data_cleaned['USIA'].astype(int)

In [8]:
print(data_cleaned.head())

   NO    NAMA  USIA  PARITAS JARAK KELAHIRAN RIW HIPERTENSI RIW PE OBESITAS  \
0   1  NAMA 1    23        3       < 2 tahun          Tidak  Tidak    Tidak   
1   2  NAMA 2    29        2       < 2 tahun          Tidak    PEB    Tidak   
2   3  NAMA 3    20        1    anak pertama          Tidak  Tidak    Tidak   
3   4  NAMA 4    18        1    anak pertama          Tidak  Tidak    Tidak   
4   5  NAMA 5    34        3      > 2 tahun           Tidak  Tidak    Tidak   

  RIW DM RIW HIPERTENSI/PE DALAM KELUARGA SOSEK RENDAH PE/Non PE  
0     Ya                            Tidak         >UMR    Non PE  
1  Tidak                              Ada         >UMR        PE  
2  Tidak                            Tidak         >UMR    Non PE  
3  Tidak                            Tidak         >UMR    Non PE  
4  Tidak                            Tidak         >UMR    Non PE  


In [9]:
pe_counts = data_cleaned['PE/Non PE'].value_counts()
print("\nJumlah kasus PE dan Non-PE:")
print(pe_counts)


Jumlah kasus PE dan Non-PE:
PE/Non PE
Non PE                    507
PEB                        19
PE                         17
Eklamsia                    1
PE gemelli                  1
PEB impending eklampsi      1
PE                          1
Name: count, dtype: int64


In [10]:
average_age = data_cleaned['USIA'].mean()
print("\nRata-rata usia partisipan:", average_age)


Rata-rata usia partisipan: 28.195612431444243


In [11]:
conditions = ['RIW HIPERTENSI', 'OBESITAS', 'RIW DM']
for condition in conditions:
    condition_counts = data_cleaned[condition].value_counts()
    print(f"\nJumlah partisipan berdasarkan {condition}:")
    print(condition_counts)


Jumlah partisipan berdasarkan RIW HIPERTENSI:
RIW HIPERTENSI
Tidak    496
Ya        51
Name: count, dtype: int64

Jumlah partisipan berdasarkan OBESITAS:
OBESITAS
Tidak    542
Ya         5
Name: count, dtype: int64

Jumlah partisipan berdasarkan RIW DM:
RIW DM
Tidak    542
Ya         5
Name: count, dtype: int64


In [12]:
sosek_counts = data_cleaned['SOSEK RENDAH'].value_counts()
print("\nStatus sosial ekonomi partisipan:")
print(sosek_counts)


Status sosial ekonomi partisipan:
SOSEK RENDAH
>UMR    544
<UMR      3
Name: count, dtype: int64


# Hasil Analisis
1. - Jumlah Kasus PE dan Non-PE:
Dataset menunjukkan jumlah partisipan dengan kondisi PE dan Non PE, yang memberikan gambaran tentang prevalensi penyakit dalam populasi yang diteliti.

2. - Rata-rata Usia Partisipan:
Rata-rata usia partisipan memberikan wawasan tentang demografi peserta. Hal ini penting untuk memahami karakteristik populasi dalam studi ini.

3. - Distribusi Kondisi Kesehatan:
Analisis terhadap kondisi kesehatan seperti hipertensi, obesitas, dan diabetes memberikan gambaran tentang faktor risiko yang mungkin ada dalam populasi. Ini dapat membantu dalam merumuskan intervensi kesehatan yang lebih baik.

4. - Status Sosial Ekonomi:
Mengetahui status sosial ekonomi partisipan bisa menjadi indikator penting dalam penelitian kesehatan. Ada kemungkinan bahwa status sosial ekonomi berkorelasi dengan kesehatan dan akses terhadap perawatan kesehatan.

# Kesimpulan
> Dataset ini menawarkan informasi yang berharga untuk penelitian kesehatan, terutama dalam memahami kondisi kesehatan masyarakat. Dengan menganalisis usia, prevalensi penyakit, dan status sosial ekonomi, peneliti dapat mengidentifikasi pola, faktor risiko, dan area di mana intervensi kesehatan mungkin diperlukan. Dataset ini dapat menjadi dasar untuk analisis lebih lanjut dan pengembangan strategi kesehatan masyarakat yang lebih efektif.