# Pendahuluan

In [1]:
# Library yang dibutuhkan

# Pertama-tama, import terlebih dahulu library yang dibutuhkan, antara lain secara berurutan adalah :
# json,
# numpy,
# pandas, dan
# requests.

# Library numpy dan pandas diimport sebagai aliasnya.

import json
import numpy as np
import pandas as pd
import requests
from pandas import json_normalize

# Mengakses Data Covid-19 dari https://covid19-api.org

In [2]:
# Membuat Fungsi get API

# Buat fungsi python get_json dengan parameter api_url. fungsi ini akan mengembalikan value berupa python dictionary. 
# Jika status_code yang dihasilkan adalah 200. Jika tidak, maka value yang dikembalikan adalah None.

def get_json(api_url):
 response = requests.get(api_url)
 if response.status_code == 200:
  return json.loads(response.content.decode('utf-8'))
 else:
  return None

In [3]:
# Memanggil API Covid-19

# Rekapitulasi data COVID-19 global berada di https://covid19-api.org/. 
# Gunakan parameter record_date untuk mengambil data covid19 di seluruh negara pada tanggal tertentu. 
# Untuk kasus ini, gunakan record_date '2020-08-17', dan masukkan hasil respon api ke variable df_covid_worldwide.

# Untuk mendapatkan dataframe covid19, gunakan fungsi pd.io.json.json_normalize dan panggil function yang sudah dibuat sebelumnya, 
# yaitu get_json() Print sample data covid dengan menggunakan head() function.

record_date = '2020-08-17'
covid_url = 'https://covid19-api.org/api/status?date='+record_date
df_covid_worldwide = pd.json_normalize(get_json(covid_url))

print(df_covid_worldwide.head())

TypeError: 'NoneType' object is not iterable

In [None]:
# Merubah Format date

# Ubah format kolom 'last_update' menggunakan fungsi to_datetime dengan format YYYY-mm-dd HH:MM:SS. 
# Lalu ubah bentuk datetime ke bentuk date dengan fungsi date() melalui fungsi lambda untuk mengubah setiap row-nya.

df_covid_worldwide['last_update'] = pd.to_datetime(df_covid_worldwide['last_update'], format='%Y-%m-%d %H:%M:%S')
df_covid_worldwide['last_update'] = df_covid_worldwide['last_update'].apply(lambda x: x.date())

In [None]:
# Mengambil Data Countries

# Buatlah dataframe countries dengan memanggil variable countries_url ke api covid19-api.org. 
# Lalu ubah nama kolom alpha2 menjadi country, kemudian ambil hanya kolom name dan country saja untuk dataframe countries (df_countries) ini.

# Akhirnya cetaklah lima data teratas dari dataframe countries (df_countries).

countries_url = 'https://covid19-api.org/api/countries'
df_countries = pd.json_normalize(get_json(countries_url))
df_countries = df_countries.rename(columns={'alpha2': 'country'})[['name','country']]
print(df_countries.head())

# Kasus Covid-19 di Dunia dan Negara Mana yang Tertinggi

In [None]:
# Merge Covid-19 Data dan Countries

# Selanjutnya adalah mapping data covid19 dan data country. 
# Gunakan fungsi merge pada pandas untuk menggabungkan df_covid_worldwide dan df_countries. 
# Untuk merge, gunakan kolom country. Lalu print sample data dengan menggunakan head().

df_covid_denormalized = pd.merge(df_covid_worldwide, df_countries, on='country')
print(df_covid_denormalized.head())

In [None]:
# Menghitung Fatality Ratio

# Tambahkan satu kolom tambahan yaitu fatality_ratio, yang merupakan pembagian antara kolom deaths dan cases.

df_covid_denormalized['fatality_ratio'] = df_covid_denormalized['deaths']/df_covid_denormalized['cases']

In [None]:
# Negara-negara dengan Fatality Ratio Tertinggi

# Ambil top 20 negara dengan value kolom fatality_ratio tertinggi dengan menggunakan fungsi sort_values.

df_top_20_fatality_rate = df_covid_denormalized.sort_values(by='fatality_ratio', ascending=False).head(20)

In [None]:
# Import Library Visualisasi

# Importlah library matplotlib.pyplot sebagai aliasnya plt.

import matplotlib.pyplot as plt

In [None]:
# Visualisasi Negara dengan Fatality Ratio Tertinggi

# Untuk memvisualisasikan negara-negara dengan kasus fatality rate tertinggi akibat covid-19, 
# dapat dilakukan dengan menggunakan bar chart.  Di sini tentukan terlebih dahulu isi dari variable x axis dan y axis.

# Variabel x axis adalah kolom name, dan kolom y atau value nya adalah kolom fatality_ratio 
# dan gunakan fungsi plt.bar([value x axis, value y axis]).

# Label sumbu x diputar 90 derajat untuk menghindari bertumpuknya nama-nama negara pada posisi 0 derajat.

plt.figure(figsize=(20, 8))
x = df_top_20_fatality_rate['name']
y = df_top_20_fatality_rate['fatality_ratio']
plt.bar(x,y)
plt.xlabel('Country Name')
plt.ylabel('Fatality Rate')
plt.title('Top 20 Highest Fatality Rate Countries')
plt.xticks(rotation=90)
plt.tight_layout()
plt.show()