### Deklarasi Pustaka

In [1]:
# => pustaka manipulasi data
import datetime
import math
import numpy as np
import pandas as pd

# => pustaka visualisasi data
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
from matplotlib.dates import DateFormatter

# pustaka pra proses data
from sklearn import preprocessing
from sklearn.preprocessing import MinMaxScaler
from mlxtend.preprocessing import minmax_scaling

# => pusataka deep learning
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Dense, LSTM, Dropout

# => pustaka evaluasi model
from sklearn.metrics import mean_squared_error

### fungsi parse dataset temp

In [2]:
# transform dataset
def parse_dataset(nm_dataset, nm_kolom):
    hasil = pd.DataFrame(nm_dataset, columns=[nm_kolom])
    return hasil

### fungsi membaca data

In [3]:
def load_dataset (nm_dataset, nm_kolom):
    hasil = pd.read_csv(nm_dataset, usecols=[nm_kolom], engine="python")
    return hasil

In [4]:
# fungsi membaca csv
def load_dataset_csv(nm_dataset):
    #hasil = pd.read_csv("D:/Belajar Python/dataset/dataset tesis/"+nm_dataset, dtype='unicode')
    hasil = pd.read_csv("D:/Belajar Python/tesis/dataset/"+nm_dataset, engine="python")
    return hasil

In [5]:
# fungsi membaca xlsx
def load_dataset_excel(nm_dataset, nm_sheet):
    hasil = pd.read_excel("D:/Belajar Python/tesis/dataset/"+nm_dataset, sheet_name=nm_sheet, engine="openpyxl")
    return hasil

In [6]:
# fungsi untuk load data hotspot berdasarkan periode waktu tertentu
def data_hotspot(nm_dataset):
    # memanggil fungsi untuk membaca datanya
    hasil = load_dataset_csv(nm_dataset)
    
    # melakukan konversi data menjadi format tanggal pada kolom acq_date
    hasil["acq_date"] = pd.to_datetime(hasil["acq_date"], format="%Y-%m-%d")
    
    # pengembalian nilai dataset
    return hasil

In [7]:
# fungsi untuk load data iklim berdasarkan periode waktu tertentu
def data_iklim(nm_dataset, nm_sheet):
    # memanggil fungsi untuk membaca datanya
    hasil = load_dataset_excel(nm_dataset, nm_sheet)
    
    # melakukan konversi data menjadi format tanggal pada kolom tanggal
    hasil["Tanggal"] = pd.to_datetime(hasil["Tanggal"], format="%d-%m-%Y")
    
    # pengembalian nilai dataset
    return hasil

In [8]:
# fungsi konversi tanggal
def format_tanggal(df, format_bawaan):
    # proses konversi tanggal
    if format_bawaan == "ymd":
        hasil = pd.to_datetime(df, format="%Y-%m-%d")
    elif format_bawaan == "dmy":
        hasil = pd.to_datetime(df, format="%d-%m-%Y")
    else:
        hasil = print("format tanggal salah")
    # mengembalikan nilai tanggal
    return hasil

### fungsi normalisasi data

In [9]:
# membuat fungsi distribusi normal
# menggunakan pustaka scikit-learn
def normalisasi(df):
    hasil = preprocessing.normalize(df)
    return hasil

In [10]:
# membuat fungsi z-score scaler
# menggunakan pustaka scikit-learn
# def normalisasi_z(df, nm_kolom): # belum selesai
    # return hasil

In [11]:
# membuat fungsi max-min scaler
# menggunakan pustaka scikit-learn
def normalisasi_max_min(df):
    # memanggil fungsi max min scaler
    hasil = preprocessing.MinMaxScaler(feature_range=(-1, 1))
    
    # proses max min scaler
    hasil = hasil.fit_transform(df)
    
    # pengembalian nilai
    return hasil

In [12]:
# membuat fungsi max-min scaler
# menggunakan pustaka mlxtend
def scaling_max_min(df, nm_kolom):
    hasil = minmax_scaling(df, columns=nm_kolom)
    return hasil

### fungsi anggregasi data

In [13]:
## => Aggregasi data harian
def hotspot_harian(df):
    # Menghitung jumlah titik panas berdasarkan tanggal
    hasil = df.groupby(['acq_date']).size().reset_index(name='hotspot')

    # memalukan indexing berdasarkan tanggal
    hasil = hasil.set_index("acq_date")
    
    # return value data hotspot harian
    return hasil

In [14]:
## => Aggregasi data bulanan
def hotspot_bulanan(df):
    # Menghitung jumlah titik panas berdasarkan tanggal
    hasil = df.groupby(['acq_date']).size().reset_index(name='hotspot')

    # memalukan indexing berdasarkan tanggal
    hasil = hasil.set_index("acq_date")

    # proses aggregasi ke data bulanan
    hasil = hasil.resample('M').sum()

    # return value data hotspot harian
    return hasil

In [15]:
## => Aggregasi data bulanan
def hotspot_tahunan(df):
    # Menghitung jumlah titik panas berdasarkan tanggal
    hasil = df.groupby(['acq_date']).size().reset_index(name='hotspot')

    # memalukan indexing berdasarkan tanggal
    hasil = hasil.set_index("acq_date")

    # proses aggregasi ke data bulanan
    hasil = hasil.resample('Y').sum()

    # return value data hotspot harian
    return hasil

### fungsi visualisasi data

In [16]:
# => Visualisasi Time Series
def visual_time_series(nilai_x, nilai_y, nm_xlabel, nm_ylabel, nm_label, nm_title, custom_date):
    # membuat frame
    fig, ax = plt.subplots(figsize = (20,7))
    
    # membuat time series plot
    ax.plot(nilai_x, nilai_y, color="tab:blue", label=nm_label, linewidth=2.5)
    
    # membuat label-label
    ax.set_title(nm_title, fontsize=14)
    ax.set_xlabel(nm_xlabel, fontsize=12)
    ax.set_ylabel(nm_ylabel, fontsize=12)
    ax.legend(loc='upper left')
    ax.grid(True)
    
    # Define the date format
    if custom_date == "True":
        date_form = DateFormatter("%b-%Y")
        ax.xaxis.set_major_formatter(date_form)
        
    # menampilkan plot
    plt.show()

In [17]:
# => Visualisasi Time Series
def visual_time_series_v1(nilai_x1, nilai_x2, nilai_y1, nilai_y2, nm_xlabel, nm_ylabel, nm_label1, nm_label2, nm_title, custom_date):
    # membuat frame
    fig, ax = plt.subplots(figsize = (20,7))
    
    # membuat time series plot
    ax.plot(nilai_x1, nilai_y1, color="tab:blue", label=nm_label1, linewidth=2.5)
    ax.plot(nilai_x2, nilai_y2, color="tab:red", label=nm_label2, linewidth=2.5)
    
    # membuat label-label
    ax.set_title(nm_title, fontsize=14)
    ax.set_xlabel(nm_xlabel, fontsize=12)
    ax.set_ylabel(nm_ylabel, fontsize=12)
    ax.legend(loc='upper left')
    ax.grid(True)
    
    # Define the date format
    if custom_date == "True":
        date_form = DateFormatter("%b-%Y")
        ax.xaxis.set_major_formatter(date_form)
        
    # menampilkan plot
    plt.show()

In [18]:
# => Visualisasi Time Series ENSO
def visual_time_series_v2(nilai_x, nilai_y, nm_xlabel, nm_ylabel, nm_label, nm_title, custom_date):
    # membuat frame
    fig, ax = plt.subplots(figsize = (20,7))
    
    # membuat time series plot
    ax.plot(nilai_x, nilai_y, color="tab:blue", label=nm_label, linewidth=2.5)
    ax.axhline(y = 0, color = "red", linestyle = '-')
    
    # membuat label-label
    ax.set_title(nm_title, fontsize=14)
    ax.set_xlabel(nm_xlabel, fontsize=12)
    ax.set_ylabel(nm_ylabel, fontsize=12)
    ax.legend(loc='upper left')
    ax.grid(True)
    
    # Define the date format
    if custom_date == "True":
        date_form = DateFormatter("%b-%Y")
        ax.xaxis.set_major_formatter(date_form)
    
    # menampilkan plot
    plt.show()

In [19]:
# visualisasi netsed time serie
def visual_time_series_v3(df, nm_color, nm_label, nm_xlabel, nm_ylabel, nm_title):
    # membuat frame
    fig, ax = plt.subplots(figsize = (20,7))
    
    # membuat time series plot
    for x in range(len(df.columns.values)):
        ax.plot(df.index.values, df.iloc[:, x:x+1], color="tab:"+nm_color[x], label=nm_label[x], linewidth=2.5)
    
    # membuat label-label
    ax.set_title(nm_title, fontsize=14)
    ax.set_xlabel(nm_xlabel, fontsize=12)
    ax.set_ylabel(nm_ylabel, fontsize=12)
    ax.legend(loc='upper left')
    ax.grid(True)
    
    # menampilkan plot
    plt.show()

In [20]:
# fungsi menampilkan viusalisasi heatmap correlation
def visual_heatmap(df, nm_corr):
    # membuat perhitungan korelasi terlebih dahulu
    df_corr = df.corr(method=nm_corr)
    
    # membuat frame heatmap
    fig,ax = plt.subplots(figsize=(10,5))
    
    # proses visual heatmap
    # => pilihan warna lain untuk visual heatmap (coolwarm, Blues, RdYlGn_r, viridis, YlGnBu)
    sns.heatmap(df_corr, cmap="viridis", vmax=1, vmin=-1, annot=True, linewidths=1, fmt='.2f', ax=ax)
    
    # membuat title atau judul
    plt.title("Heatmap Iklim, ENSO dan Hotspot", fontsize=16)
    
    # Menampilkan hasil visualisasi
    plt.show()

In [21]:
# fungsi menampilkan viusalisasi scatter plot
def visual_scatter(nilai_x, nilai_y, nm_color, nm_label, nm_xlabel, nm_ylabel, nm_title):
    # membuat frame scatter plot
    fig, ax = plt.subplots(figsize = (20,7))

    # membuat scatter plot
    ax.scatter(nilai_x, nilai_y, color="tab:"+nm_color, label=nm_label, linewidth=5, alpha=0.5)

    # membuat label-label
    ax.set_title(nm_title, fontsize=14)
    ax.set_xlabel(nm_xlabel, fontsize=12)
    ax.set_ylabel(nm_ylabel, fontsize=12)
    ax.legend(loc='upper left')
    ax.grid(True)

    # Menampilkan Hasil Visualisasi
    plt.show()

In [22]:
# fungsi menampilkan viusalisasi barplot
def visual_barplot(nilai_x, nilai_y, nm_color, nm_title):
    # Membuat frame barplot
    fig, ax = plt.subplots(figsize=(20, 7))

    # Membuat barplot jumlah positif
    ax.bar(nilai_x, nilai_y, color=nm_color)

    # membuat label-label
    ax.set_title(nm_title, fontsize=16)
    
    # Menampilkan hasilnya
    plt.xticks(rotation=90)
    plt.yticks(rotation=0)
    plt.grid(True)
    plt.show()