# Analisis Peningkatan Kasus Positif COVID - 19

In [1]:
import pandas as pd
import sklearn
import numpy as np
import matplotlib.pyplot as plt
from datetime import timedelta
import joblib
import os
from sklearn.model_selection import train_test_split
from sklearn.svm import SVR
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.metrics import r2_score
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline


%matplotlib inline

plt.style.use("ggplot")

# Model Machine learning

### Penjelasan Method pada Class Model

#### 1. Inisiasi objek
Pada saat menginisiasi objek harus disertai parameter nama wilayah dan model yang diinginkan, jika tidak secara otomatis akan diambil World dan model SVM sebagai default.


#### 2. buat_model
Method ini digunakan untuk membuat model dengan parameter banyaknya input data yang ingin dimasukan dan nilai filter yang diinginkan (mulai menggunakan data semenjak total kasus positif mencapat berapa), misalkan diinput 40,100 maka model ini akan dilatih dengan 40 data pertama pada tabel yang total kasusnya sudah melebihi 100, setelah mengadakan training model lalu disimpan ke folder model. Mereturn skor R-Squared model tersebut jika digunakan untuk menghitung semua Total kasus.

#### 3. buat_grafik_prediksi_realita
Method ini menampilkan grafik perbandingan antara model yang sudah dibuat dengan grafik sebenarnya.

#### 4. buat_grafik_realita
Menampilkan grafik kasus persebaran pada wilayah tersebut.

#### 5. export_model
atribut untuk mengakses model.

#### 6. export_tabel
atribut untuk mengakses tabel yang sudah difilter.

#### 7. buat_skor_per_banyak_hari
Method ini membuat skor R-Squared yang didapat untuk setiap banyaknya data yang diinputkan, dalam method ini memanggil method buat_model, lalu menyimpannya kebentuk csv.

#### 8. buat_grafik_skor_per_banyak_hari
Method ini membuat grafik dari tabel csv yang telah dibuat oleh method buat_skor_per_banyak_hari.

#### 9. skor_stabil
Method ini mengambil tabel csv yang telah dibuat method buat_skor_per_banyak_hari dan memfilternya dengan parameter skor_stabil yang bisa diubah ubah, defaultnya 80%.

#### 10. prediksi_hari_ke
Method ini menampilkan prediksi berdasarkan model yang telah dibuat untuk parameter hari yang dimasukan.

#### 11. ambil_semua_skor_stabil
Atribut ini mengambil skor stabil untuk model SVM dan Polinomial suatu negara

#### 12. buat_semua_skor_per_banyak_hari
method ini membuat skor_per_banyak_hari dan grafiknya untuk setiap negara dengan model SVM dan Regresi Polinomial

#### 13. cari_model_terbaik 
Method ini mencari model terbaik di antara SVM dan Polinomial untuk setiap negara



In [39]:
class Model:
    
    def __init__(self,negara='World',model ='svm'):
        self.negara = negara
        self.model = model.lower()
        self.df = pd.read_csv('new_cases.csv')
        
        
        self.df = self.df.fillna(0)
        # Merubah Format tanggal
        self.df['date'] = pd.to_datetime(self.df['date'])
        self.df['date'] = self.df.loc[:,'date'].apply(lambda x:x.strftime('%d %b %Y'))
        
        # Mengubah Data yang masih Float menjadi Bilangan Bulat
        for i in self.df.columns:
            try:
                self.df.loc[:,i] = self.df.loc[:,i].apply(lambda x : int(x))
            except:
                None
                
        # Membuat Index Hari Ke -
        self.df['Hari ke'] = self.df.index + 1
                
        

    def buat_model(self,panjang=0,filt=100):
        # Mempersimple tabel
        self.tabel = self.df[['date','Hari ke',self.negara]].copy()
        
        self.tabel['Jumlah'] = 0

        # Menambah Kolom Jumlah
        for i in range(0,len(self.tabel)):
            if i == 0:
                self.tabel.loc[i,'Jumlah'] = self.tabel.loc[i,self.negara]
            else:
                self.tabel.loc[i,'Jumlah'] = self.tabel.loc[i-1,'Jumlah'] + self.tabel.loc[i,self.negara]
        
        
        
        # Menghilangkan outliner
        filt = self.tabel['Jumlah']>=filt
        self.tabel = self.tabel.loc[filt]
        
        #Mengcopy tabel untuk proses penilaian
        self.tabel2 = self.tabel.copy()
        
        try:
            os.mkdir('tabel')
        except:
            pass
        
        joblib.dump(self.tabel2,f'tabel/tabel_filter_{self.negara}.joblib')
        
        if panjang==0:
            self.tabel = self.tabel.iloc[0:len(self.tabel)+1]
        else :
            self.tabel = self.tabel.iloc[0:panjang+1]
            
        self.tabel.reset_index(inplace=True) # mereset index
                
        
        # Model Machine Learning
        
        if self.model == 'svm':
            model = SVR(kernel='poly')
            
        elif self.model == 'linear':
            model = LinearRegression()
            
        elif self.model == 'log':
            model = LogisticRegression()
            
        elif self.model == 'gaussian':
            model = GaussianProcessRegressor()
            
        elif self.model == 'randomforest':
            model = RandomForestRegressor()

        elif self.model == 'decisiontree':
            model = DecisionTreeRegressor()
            
        elif self.model == 'polinomial':
            model = make_pipeline(PolynomialFeatures(3),LinearRegression())
            
        else:
            pesan = "Model Tidak ada di pilihan, hanya tersedia: svm,linear,log,gaussian,randomforest,decision tree,polinomial"
            raise TypeError(pesan)

        x_train,x_test,y_train,y_test = train_test_split(self.tabel[["Hari ke"]],self.tabel["Jumlah"],test_size=0.25)
        model.fit(x_train,y_train)
    
        # Simpan Model
        try:
            os.mkdir('model')
        except:
            pass
        
        joblib.dump(model,f"model/model_{self.negara}_{self.model}.joblib")
        
        #print(r2_score(self.tabel2['Jumlah'],model.predict(self.tabel2[["Hari ke"]])))
        
        return r2_score(self.tabel2['Jumlah'],model.predict(self.tabel2[["Hari ke"]]))

        
        
    def buat_grafik_prediksi_realita(self,skala='log'):
        model = joblib.load(f"model/model_{self.negara}_{self.model}.joblib")
        
        fig,ax = plt.subplots()
        ax.clear()
        fig.set_size_inches(6,4)
        
        ax.set_title("Realita & Prediksi Total Kasus Positif")
        ax.set_yscale(skala)
       
        ax.plot(self.tabel2["Hari ke"],self.tabel2["Jumlah"],label="Realita",lw = 5,alpha=0.4)
        ax.plot(self.tabel2[["Hari ke"]],model.predict(self.tabel2[["Hari ke"]]),label="Prediksi",ls='-',lw = 5,alpha=0.4)

        
        ax.legend()
        
        try :
            os.mkdir('Grafik')
        except:
            pass
        
        plt.savefig(f'Grafik/grafik_total_{self.negara}_{self.model}',bbox_inches="tight")
        
        print(r2_score(self.tabel2['Jumlah'],model.predict(self.tabel2[["Hari ke"]])))
            
    def buat_grafik_realita(self,skala='log'):
        fig,ax = plt.subplots()
        ax.clear()
        fig.set_size_inches(6,4)
        
        ax.set_title("Grafik Realita")
        ax.set_yscale(skala)
       
        ax.plot(self.tabel2["Hari ke"],self.tabel2["Jumlah"],label="Realita",lw = 5,alpha=0.4)
        
        
        ax.legend()
        
        
    @property
    def export_model(self):
        model = joblib.load(f"model/model_{self.negara}_{self.model}.joblib")
        return model

    @property
    def export_tabel(self):
        tabel = joblib.load(f'tabel/tabel_filter_{self.negara}.joblib')
        return tabel
    
    def buat_skor_per_banyak_hari(self):
        
        # dictionary untuk menyimpan hasil skor
        skorHari = {
        "Hari":[], # Banyak Hari yang diinput
        "Skor":[] # skor berdasarkan banyak hari yang diinput
        }
    
        if self.model == 'log':
            k = 2 # model logaritma butuh minimal 2 input
            
        else:
            k = 1
            
            
        for i in range(k,len(self.export_tabel)+1): # 
    
            skorHari['Hari'].append(i)
            skorHari['Skor'].append(self.buat_model(i))

        tabel_skor = pd.DataFrame(skorHari)
    
        # Coba buat folder Export
        try:
            os.mkdir('Export')
        except:
            pass
        
        #Export hasil dalam bentuk CSV
        
        tabel_skor.to_csv(f'Export/tabel_skor_{self.negara}_{self.model}.csv',index=False)

    def buat_grafik_skor_per_banyak_hari(self):
        
        #Ambil data tabel skor
        tabel_skor = pd.read_csv(f'Export/tabel_skor_{self.negara}_{self.model}.csv')
        plt.cla()
        plt.ylim([-0.5,1.2])
        plt.title(f"Grafik Skor $R^2$ Berdasarkan Banyak Input Data\n Negara: {self.negara}\n Model : {self.model} ")
        plt.plot(tabel_skor['Hari'],tabel_skor['Skor'])
        
        try :
            os.mkdir('Grafik')
        except:
            pass
        
        plt.savefig(f'Grafik/grafik_skor_{self.negara}_{self.model}',bbox_inches="tight")
        
    @property
    def skor_stabil(self,skor_stabil=0.8):
        
        #Ambil data tabel skor
        tabel_skor = pd.read_csv(f'Export/tabel_skor_{self.negara}_{self.model}.csv',index_col='Hari')
        
        filt = tabel_skor['Skor'] >=skor_stabil
        
        
        return tabel_skor[filt]
    
    def prediksi_hari_ke(self,hari_ke):
        
        #Import model
        model = joblib.load(f"model/model_{self.negara}_{self.model}.joblib")
        
        tanggal = (pd.to_datetime(self.tabel['date'][0])+timedelta(hari_ke)).strftime("%d %b %Y")
        banyak_kasus_positif = int(model.predict([[hari_ke]])[0])

        print("Pada Tanggal",tanggal,f"jumlah Kasus Positif di {self.negara} :",banyak_kasus_positif)
        
    @property
    def ambil_semua_skor_stabil(self,skor_stabil =0.8):
        svm = pd.read_csv(f'Export/tabel_skor_{self.negara}_svm.csv')
        polinomial = pd.read_csv(f'Export/tabel_skor_{self.negara}_polinomial.csv')
        
        
        panjang_svm = len(svm.loc[svm['Skor']>=skor_stabil])
        panjang_polinomial = len(polinomial.loc[polinomial['Skor']>=skor_stabil])
      
        
        
        return panjang_svm,panjang_polinomial
    
    def buat_semua_skor_per_banyak_hari(self):
        semua_model = ['svm','polinomial']

        for negara in self.df.columns:
            for model in semua_model:
                try:
                    negara_model = Model(negara,model)
                    negara_model.buat_model()
                    negara_model.buat_skor_per_banyak_hari()
                    negara_model.buat_grafik_skor_per_banyak_hari()
                except Exception as e:
                    print(e)
                
    def cari_model_terbaik(self):
        model_terbaik ={
            'svm':0,
            'polinomial':0,
            
        }
        panjang = 0
        
        for negara in self.df.columns:
            negara_model = Model(negara)
            try:
                
                
                panjang_svm,panjang_polinomial = negara_model.ambil_semua_skor_stabil

                if panjang_svm>panjang_polinomial:
                    model_terbaik['svm'] += 1

                elif panjang_polinomial>panjang_svm:
                    model_terbaik['polinomial'] += 1
                    
                elif panjang_polinomial==panjang_svm:
                    model_terbaik['polinomial'] += 1
                    model_terbaik['svm'] += 1
                    
                panjang += 1
                
            except:
                pass
            
        
        print(model_terbaik)
        print('Banyak Negara/Wilayah yang memiliki skor stabil :',panjang," Negara/Wilayah")
        