In [2]:
import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

In [3]:
covid = pd.read_csv(
    "/content/rekap-data-bulanan-covid-19-bulan-januari-tahun-2021.csv",
    parse_dates=["tanggal"],
).dropna()

covid.head()

Unnamed: 0,tanggal,id_kel,nama_provinsi,nama_kota,nama_kecamatan,nama_kelurahan,kategori,sub_kategori,jumlah
0,2021-01-02,3172051003,DKI JAKARTA,JAKARTA UTARA,PADEMANGAN,ANCOL,SUSPEK,Perawatan RS,2
1,2021-01-02,3173041007,DKI JAKARTA,JAKARTA BARAT,TAMBORA,ANGKE,SUSPEK,Perawatan RS,2
2,2021-01-02,3175041005,DKI JAKARTA,JAKARTA TIMUR,KRAMAT JATI,BALE KAMBANG,SUSPEK,Perawatan RS,1
3,2021-01-02,3175031003,DKI JAKARTA,JAKARTA TIMUR,JATINEGARA,BALI MESTER,SUSPEK,Perawatan RS,0
4,2021-01-02,3175101006,DKI JAKARTA,JAKARTA TIMUR,CIPAYUNG,BAMBU APUS,SUSPEK,Perawatan RS,0


# **Data Exploration**

In [20]:
covid

Unnamed: 0,tanggal,id_kel,nama_provinsi,nama_kota,nama_kecamatan,nama_kelurahan,kategori,sub_kategori,jumlah
0,2021-01-02,3172051003,DKI JAKARTA,JAKARTA UTARA,PADEMANGAN,ANCOL,SUSPEK,Perawatan RS,2
1,2021-01-02,3173041007,DKI JAKARTA,JAKARTA BARAT,TAMBORA,ANGKE,SUSPEK,Perawatan RS,2
2,2021-01-02,3175041005,DKI JAKARTA,JAKARTA TIMUR,KRAMAT JATI,BALE KAMBANG,SUSPEK,Perawatan RS,1
3,2021-01-02,3175031003,DKI JAKARTA,JAKARTA TIMUR,JATINEGARA,BALI MESTER,SUSPEK,Perawatan RS,0
4,2021-01-02,3175101006,DKI JAKARTA,JAKARTA TIMUR,CIPAYUNG,BAMBU APUS,SUSPEK,Perawatan RS,0
...,...,...,...,...,...,...,...,...,...
26428,2021-01-30,3175011006,DKI JAKARTA,JAKARTA TIMUR,MATRAMAN,UTAN KAYU SELATAN,POSITIF,Self Isolation,84
26429,2021-01-30,3175011002,DKI JAKARTA,JAKARTA TIMUR,MATRAMAN,UTAN KAYU UTARA,POSITIF,Self Isolation,60
26430,2021-01-30,3171031008,DKI JAKARTA,JAKARTA PUSAT,KEMAYORAN,UTAN PANJANG,POSITIF,Self Isolation,96
26431,2021-01-30,3172021007,DKI JAKARTA,JAKARTA UTARA,TANJUNG PRIOK,WARAKAS,POSITIF,Self Isolation,127


In [21]:
covid.dtypes

tanggal           datetime64[ns]
id_kel                     int64
nama_provinsi             object
nama_kota                 object
nama_kecamatan            object
nama_kelurahan            object
kategori                  object
sub_kategori              object
jumlah                     int64
dtype: object

# 2.Rata-rata covid tiap kelurahan perhari

In [23]:
covid_kelurahan = covid.loc[:, ["tanggal", "nama_kelurahan", "kategori", "jumlah"]]
covid_kelurahan

Unnamed: 0,tanggal,nama_kelurahan,kategori,jumlah
0,2021-01-02,ANCOL,SUSPEK,2
1,2021-01-02,ANGKE,SUSPEK,2
2,2021-01-02,BALE KAMBANG,SUSPEK,1
3,2021-01-02,BALI MESTER,SUSPEK,0
4,2021-01-02,BAMBU APUS,SUSPEK,0
...,...,...,...,...
26428,2021-01-30,UTAN KAYU SELATAN,POSITIF,84
26429,2021-01-30,UTAN KAYU UTARA,POSITIF,60
26430,2021-01-30,UTAN PANJANG,POSITIF,96
26431,2021-01-30,WARAKAS,POSITIF,127


In [24]:
covid_kelurahan['kategori'] = covid_kelurahan['kategori'].astype('str')
covid_kelurahan.dtypes

tanggal           datetime64[ns]
nama_kelurahan            object
kategori                  object
jumlah                     int64
dtype: object

In [25]:
data_kelurahan = covid_kelurahan[covid_kelurahan['kategori'] == 'POSITIF']
data_kelurahan

Unnamed: 0,tanggal,nama_kelurahan,kategori,jumlah
21360,2021-01-02,ANCOL,POSITIF,2
21361,2021-01-02,ANGKE,POSITIF,12
21362,2021-01-02,BALE KAMBANG,POSITIF,10
21363,2021-01-02,BALI MESTER,POSITIF,8
21364,2021-01-02,BAMBU APUS,POSITIF,9
...,...,...,...,...
26428,2021-01-30,UTAN KAYU SELATAN,POSITIF,84
26429,2021-01-30,UTAN KAYU UTARA,POSITIF,60
26430,2021-01-30,UTAN PANJANG,POSITIF,96
26431,2021-01-30,WARAKAS,POSITIF,127


In [26]:
perhari = data_kelurahan.groupby(['tanggal', 'nama_kelurahan']).mean()
perhari.round()

Unnamed: 0_level_0,Unnamed: 1_level_0,jumlah
tanggal,nama_kelurahan,Unnamed: 2_level_1
2021-01-02,ANCOL,145.0
2021-01-02,ANGKE,94.0
2021-01-02,BALE KAMBANG,118.0
2021-01-02,BALI MESTER,80.0
2021-01-02,BAMBU APUS,119.0
...,...,...
2021-01-30,UTAN KAYU SELATAN,242.0
2021-01-30,UTAN KAYU UTARA,178.0
2021-01-30,UTAN PANJANG,160.0
2021-01-30,WARAKAS,228.0


# 3. Titik tertinggi perbulan tiap kota

In [27]:
covid_kota = covid.loc[:, ["tanggal", "nama_kota", "kategori", "jumlah"]]
covid_kota['kategori'] = covid_kota['kategori'].astype('str')
covid_kota

Unnamed: 0,tanggal,nama_kota,kategori,jumlah
0,2021-01-02,JAKARTA UTARA,SUSPEK,2
1,2021-01-02,JAKARTA BARAT,SUSPEK,2
2,2021-01-02,JAKARTA TIMUR,SUSPEK,1
3,2021-01-02,JAKARTA TIMUR,SUSPEK,0
4,2021-01-02,JAKARTA TIMUR,SUSPEK,0
...,...,...,...,...
26428,2021-01-30,JAKARTA TIMUR,POSITIF,84
26429,2021-01-30,JAKARTA TIMUR,POSITIF,60
26430,2021-01-30,JAKARTA PUSAT,POSITIF,96
26431,2021-01-30,JAKARTA UTARA,POSITIF,127


In [28]:
data_kota = covid_kota[covid_kelurahan['kategori'] == 'POSITIF']
data_kota

Unnamed: 0,tanggal,nama_kota,kategori,jumlah
21360,2021-01-02,JAKARTA UTARA,POSITIF,2
21361,2021-01-02,JAKARTA BARAT,POSITIF,12
21362,2021-01-02,JAKARTA TIMUR,POSITIF,10
21363,2021-01-02,JAKARTA TIMUR,POSITIF,8
21364,2021-01-02,JAKARTA TIMUR,POSITIF,9
...,...,...,...,...
26428,2021-01-30,JAKARTA TIMUR,POSITIF,84
26429,2021-01-30,JAKARTA TIMUR,POSITIF,60
26430,2021-01-30,JAKARTA PUSAT,POSITIF,96
26431,2021-01-30,JAKARTA UTARA,POSITIF,127


In [29]:
max_perkota = data_kota.groupby(['nama_kota']).max()
max_perkota

Unnamed: 0_level_0,tanggal,kategori,jumlah
nama_kota,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
JAKARTA BARAT,2021-01-30,POSITIF,1735
JAKARTA PUSAT,2021-01-30,POSITIF,1202
JAKARTA SELATAN,2021-01-30,POSITIF,1481
JAKARTA TIMUR,2021-01-30,POSITIF,1589
JAKARTA UTARA,2021-01-30,POSITIF,1564
KAB.ADM.KEP.SERIBU,2021-01-30,POSITIF,94


In [30]:
max_kategori = covid_kota.groupby(['nama_kota', 'kategori']).max()
max_kategori

Unnamed: 0_level_0,Unnamed: 1_level_0,tanggal,jumlah
nama_kota,kategori,Unnamed: 2_level_1,Unnamed: 3_level_1
JAKARTA BARAT,DISCARDED,2021-01-30,94
JAKARTA BARAT,KONTAK ERAT,2021-01-30,4193
JAKARTA BARAT,PELAKU PERJALANAN,2021-01-30,49
JAKARTA BARAT,POSITIF,2021-01-30,1735
JAKARTA BARAT,PROBABLE,2021-01-30,23
JAKARTA BARAT,SUSPEK,2021-01-30,3962
JAKARTA PUSAT,DISCARDED,2021-01-30,123
JAKARTA PUSAT,KONTAK ERAT,2021-01-30,3604
JAKARTA PUSAT,PELAKU PERJALANAN,2021-01-30,47
JAKARTA PUSAT,POSITIF,2021-01-30,1202


# 4. Perbandingan Suspek Meninggal dan Selesai Isolasi

In [4]:
perbandingan = covid.loc[covid["sub_kategori"].isin(['Suspek Meninggal' , 'Selesai Isolasi'])]
perbandingan

Unnamed: 0,tanggal,id_kel,nama_provinsi,nama_kota,nama_kecamatan,nama_kelurahan,kategori,sub_kategori,jumlah
2670,2021-01-02,3172051003,DKI JAKARTA,JAKARTA UTARA,PADEMANGAN,ANCOL,SUSPEK,Suspek Meninggal,0
2671,2021-01-02,3173041007,DKI JAKARTA,JAKARTA BARAT,TAMBORA,ANGKE,SUSPEK,Suspek Meninggal,2
2672,2021-01-02,3175041005,DKI JAKARTA,JAKARTA TIMUR,KRAMAT JATI,BALE KAMBANG,SUSPEK,Suspek Meninggal,1
2673,2021-01-02,3175031003,DKI JAKARTA,JAKARTA TIMUR,JATINEGARA,BALI MESTER,SUSPEK,Suspek Meninggal,1
2674,2021-01-02,3175101006,DKI JAKARTA,JAKARTA TIMUR,CIPAYUNG,BAMBU APUS,SUSPEK,Suspek Meninggal,1
...,...,...,...,...,...,...,...,...,...
21355,2021-01-30,3175011006,DKI JAKARTA,JAKARTA TIMUR,MATRAMAN,UTAN KAYU SELATAN,DISCARDED,Selesai Isolasi,163
21356,2021-01-30,3175011002,DKI JAKARTA,JAKARTA TIMUR,MATRAMAN,UTAN KAYU UTARA,DISCARDED,Selesai Isolasi,54
21357,2021-01-30,3171031008,DKI JAKARTA,JAKARTA PUSAT,KEMAYORAN,UTAN PANJANG,DISCARDED,Selesai Isolasi,39
21358,2021-01-30,3172021007,DKI JAKARTA,JAKARTA UTARA,TANJUNG PRIOK,WARAKAS,DISCARDED,Selesai Isolasi,88


In [15]:
data_perbandingan = perbandingan.loc[:,['tanggal','sub_kategori','jumlah']]
data_perbandingan['sub_kategori'] = data_perbandingan['sub_kategori'].astype('str')
data_perbandingan.dtypes

tanggal         datetime64[ns]
sub_kategori            object
jumlah                   int64
dtype: object

In [19]:
compare_data = data_perbandingan.groupby(['tanggal','sub_kategori']).sum()
compare_data

Unnamed: 0_level_0,Unnamed: 1_level_0,jumlah
tanggal,sub_kategori,Unnamed: 2_level_1
2021-01-02,Selesai Isolasi,600852
2021-01-02,Suspek Meninggal,511
2021-01-09,Selesai Isolasi,627467
2021-01-09,Suspek Meninggal,513
2021-01-16,Selesai Isolasi,780675
2021-01-16,Suspek Meninggal,513
2021-01-23,Selesai Isolasi,795820
2021-01-23,Suspek Meninggal,513
2021-01-30,Selesai Isolasi,861511
2021-01-30,Suspek Meninggal,513
