# Model Pendugaan Radiasi Matahari

## Pendahuluan 

Radiasi matahari merupakan sumber energi utama dan berperan penting dalam siklus iklim bumi. Besaran radiasi matahari yang datang kemudian mengalami proses pemantulan, pemancaran, dan penerusan baik secara langsung maupun tidak langsung ke dan dari permukaan bumi. Radiasi matahari yang datang tersebut berpengaruh terhadap pergerakan massa udara dan massa air di bumi, selanjutnya melalui proses evaporasi maupun transpirasi, uap air dilepaskan ke udara dan membentuk awan sehingga terjadi hujan.

Pengukuran radiasi matahari secara langsung masih terbilang sedikit dengan periode perekaman data historis yang pendek. Padahal pengamatan radiasi matahari sangat penting dalam menjelaskan variabilitas dan perubahan iklim. Pada pemodelan iklim yang terus berkembang untuk menjelaskan kondisi iklim di masa lalu, saat ini dan masa depan tak lepas dari input data radiasi matahari dan kondisi karbon di atmosfer. Untuk mengetahui besaran nilai penduga radiasi matahari di suatu wilayah dapat dilakukan melalui model berdasarkan data historis parameter iklim lainnya seperti curah hujan dan suhu udara. Pendekatan dapat dilakukan dengan menggunakan model empirik dan model mekanistik.

Aplikasi pengolahan data yang digunakan dalam praktikum ini adalah R dan Python (pilih salah satu). Data contoh yang digunakan adalah data cuaca di Bandara Laguardia, New York, Amerika Serikat. 

## Model Pendugaan Ball et al. (2004) {#sec-modelball}

Ball et al. [@ball2004] membangun model empiris untuk menduga radiasi matahari di permukaan bumi dengan masukan suhu udara maksimum, suhu udara minimum, curah hujan, dan *julian days*. Persamaan yang digunakan berupa regresi linier berganda, yaitu

$$
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + ... + \beta_{12} X_{12}
$$

di mana keterangan setiap variabel bebas dapat dilihat pada tabel berikut.

| Prediktor |                Keterangan                |
| :-------: | :--------------------------------------: |
|  $X_{1}$  |             Curah hujan (mm)             |
|  $X_{2}$  |         Suhu udara maksimum (°C)         |
|  $X_{3}$  |         Suhu udara minimum (°C)          |
|  $X_{4}$  |               Day of Year                |
|  $X_{5}$  |              (Curah hujan)²              |
|  $X_{6}$  |          (Suhu udara maksimum)²          |
|  $X_{7}$  |          (Suhu udara minimum)²           |
|  $X_{8}$  |              (Day of Year)²              |
|  $X_{9}$  |     Curah hujan * Suhu udara minimum     |
| $X_{10}$  | Suhu udara maksimum * Suhu udara minimum |
| $X_{11}$  |    Curah hujan * Suhu udara maksimum     |
| $X_{12}$  |    Suhu udara maksimum * Day of Year     |

: Keterangan variabel bebas dari persamaan empirik [@ball2004] {#tbl-modelball}

## Model Pendugaan Hunt et al. (1998) {#sec-modelhunt}

Model pendugaan radiasi matahari lain adalah oleh Hunt [@hunt1998], yaitu gabungan model mekanistik dan empirik dengan masukan suhu udara maksimum, suhu udara minimum, dan curah hujan. Model mekanistik digunakan untuk menduga radiasi matahari yang berada di permukaan atmosfer (radiasi ekstraterestrial, $S_0$). Model pendugaan Hunt (1998) adalah sebagai berikut.

$$
R_s = a_0 S_0 (T_{max} - T_{min})^{0.5} + a_1 T_{max} + a_2 P + a_3 P^2 + a_4
$$

dimana $R_s$ adalah radiasi matahari harian ($MJ~m^{−2}~hari^{−1}$), $S_0$ adalah radiasi matahari di puncak atmosfer ($MJ~m^{−2}~hari^{−1}$), $P$ adalah curah hujan (mm), $T_{max}$ adalah suhu udara maksimum ($^o C$), dan $T_{min}$ adalah suhu udara minimum ($^o C$). Untuk mengestimasi nilai $S_0$, Hunt menggunakan persamaan mekanistik dalam Spitters [@spitters1986], yaitu:

$$
S_0 = S_{sc} \left[ 1 + 0.033 \cos \left( \frac{360~t_d}{365} \right) \right] sin(β)
$$

dimana, $S_0$ adalah irradiasi ekstra terestrial ($J~m^{−2} s^{−1}$), $S_{sc}$ konstanta matahari ($1370~J~m^{−2} s^{−1}$), suku $cos$ adalah jarak tahunan antara bumi dan matahari yang dinyatakan dalam derajat, $t_d$ adalah julian day, dan $sin(β)$ adalah sinus sudut elevasi matahari (satuan detik) yang didefinisikan pada persamaan:

$$
sin(β) = 3600 \left[ D ~ sin(λ) ~ sin(δ) + \frac{24}{\pi} ~ cos(λ) ~ cos(δ) ~ \sqrt{(1 - tan^2(λ) ~ tan^2(δ))} \right]
$$

dimana, $λ$ adalah letak lintang dari lokasi stasiun dan δ adalah sudut deklinasi matahari pada saat julian day dan dinyatakan dalam derajat dengan estimasi pada persamaan:

$$
sin(δ) = -sin(23.45) ~ cos \left( \frac{360~(t_d + 10)}{365} \right)
$$

dan $D$ adalah panjang hari (jam) dengan persamaan:

$$
D = 12 + \frac{24}{180} arcsin(tan(λ) ~ tan(δ))
$$

## Pengolahan Data

Data yang akan diolah bernama `LaguardiaAirport-NYC.xlsx` yang terdiri dari tiga *worksheet*. *Worksheet* ke-3 (`RawData`) adalah data yang akan diolah dengan berisikan 7 kolom: `DOY` (*Day of Year*, 1 - 365/366), `YEAR` (tahun), `PRCP` (curah hujan, mm), `TAVG` (suhu udara rata-rata, °C), `TMAX` (suhu udara maksimum, °C), `TMIN` (suhu udara minimum, °C), dan `SRAD` (radiasi matahari langsung, W/m²). Data pada *worksheet* tersebut sudah dirapikan sehingga Anda dapat langsung mengolahnya. Periode data yang digunakan dibagi menjadi 2, yaitu untuk pembuatan dan validasi model dengan pemilihan tahun 1998-2018 dan 2019-2020, secara berturut-turut.

### 1. R

Package yang digunakan dalam pengolahan data di R adalah `tidyverse` dan `readxl`. Jika Anda belum memasang package ini, gunakan perintah berikut. 

```r
install.packages(c("tidyverse", "readxl"))
```

Pengetikan kode R dapat dilakukan di aplikasi RStudio atau teks editor lainnya yang Anda kuasai.

#### Model Ball et al. (2004) {.unnumbered}

Langkah-langkah pengolahan data untuk model Ball et al. (2004) adalah sebagai berikut.

1. Impor data excel (`LaguardiaAirport-NYC.xlsx`) pada sheet `RawData` dengan perintah berikut. 
   
   ```r
   dpath <- "data/" # Lokasi folder data
   data <- read_excel(paste0(dpath, "LaguardiaAirport-NYC.xlsx"), sheet = "RawData")
   data
   ```

   ```
      # A tibble: 8,401 × 7
       YEAR   DOY  PRCP  TAVG  TMAX  TMIN  SRAD
      <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
    1  1998     1   0    -5    -1.1  -8.9 253.
    2  1998     2   0     4.7  10    -0.6 136.
    3  1998     3   0    12    15.6   8.3  97.8
    4  1998     4   0    11.7  17.2   6.1 122.
    5  1998     5   0     5.9   6.7   5   129.
    6  1998     6   1    10.3  15     5.6  14.4
    7  1998     7  28.7   9.5  13.9   5     2.6
    8  1998     8   0.8  10.3  16.1   4.4  10.2
    9  1998     9   0    12    15     8.9  24.7
   10  1998    10   0     7.8  10     5.6 199.
   # … with 8,391 more rows
   # ℹ Use `print(n = ...)` to see more rows
   ```

2. Pilih periode tahun untuk pembuatan dan validasi model dengan perintah berikut. 
   
   ```r
   # Pembuatan model
   data_train <- data %>% filter(YEAR <= 2018)
   
   # Validasi model
   data_test <- data %>% filter(YEAR >= 2019)
   ```

3. Lakukan perhitungan prediktor ke-5 sampai ke-12 sesuai dengan [@tbl-modelball]
   
   ```r
   data_train <- data_train %>%
      mutate(
         PRCP_sq = PRCP^2, TMAX_sq = TMAX^2, TMIN_sq = TMIN^2, DOY_sq  = DOY^2,
         PRCP_TMAX = PRCP * TMAX, PRCP_TMIN = PRCP * TMIN,
         TMAX_TMIN = TMAX * TMIN, TMAX_DOY  = TMAX * DOY
      )
   
   data_test <- data_test %>%
      mutate(
         PRCP_sq = PRCP^2, TMAX_sq = TMAX^2, TMIN_sq = TMIN^2, DOY_sq  = DOY^2,
         PRCP_TMAX = PRCP * TMAX, PRCP_TMIN = PRCP * TMIN,
         TMAX_TMIN = TMAX * TMIN, TMAX_DOY  = TMAX * DOY
      )
   ```
   
4. Lakukan pembuatan model regresi linier berganda pada data `data_train` sesuai dengan model Ball et al. (2004). 
   
   ```r
   model <- lm(SRAD ~ PRCP + TMAX + TMIN + DOY + 
                      PRCP_sq + TMAX_sq + TMIN_sq + DOY_sq + 
                      PRCP_TMAX + PRCP_TMIN + TMAX_TMIN + TMAX_DOY, 
               data = data_train)
   summary(model)
   ```

   ```
   Call:
   lm(formula = SRAD ~ PRCP + TMAX + TMIN + DOY + PRCP_sq + TMAX_sq +
       TMIN_sq + DOY_sq + PRCP_TMAX + PRCP_TMIN + TMAX_TMIN + TMAX_DOY,
       data = data_train)
   
   Residuals:
       Min      1Q  Median      3Q     Max
   -528.48  -76.07    0.39   76.62  405.14
   
   Coefficients:
                 Estimate Std. Error t value Pr(>|t|)
   (Intercept) -4.466e+01  8.446e+00  -5.287 1.28e-07 ***
   PRCP        -5.623e+00  4.012e-01 -14.016  < 2e-16 ***
   TMAX         3.937e+01  1.790e+00  21.996  < 2e-16 ***
   TMIN        -5.211e+01  1.705e+00 -30.566  < 2e-16 ***
   DOY          1.421e+00  8.335e-02  17.048  < 2e-16 ***
   PRCP_sq      4.851e-02  2.749e-03  17.648  < 2e-16 ***
   TMAX_sq     -1.842e+00  9.502e-02 -19.383  < 2e-16 ***
   TMIN_sq     -2.657e+00  1.083e-01 -24.535  < 2e-16 ***
   DOY_sq      -3.800e-03  2.136e-04 -17.788  < 2e-16 ***
   PRCP_TMAX   -3.527e-01  4.081e-02  -8.643  < 2e-16 ***
   PRCP_TMIN    4.344e-01  4.295e-02  10.116  < 2e-16 ***
   TMAX_TMIN    4.606e+00  1.962e-01  23.478  < 2e-16 ***
   TMAX_DOY     5.286e-03  1.583e-03   3.340 0.000843 ***
   ---
   Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
   
   Residual standard error: 98.17 on 7657 degrees of freedom
   Multiple R-squared:  0.4214,    Adjusted R-squared:  0.4205
   F-statistic: 464.8 on 12 and 7657 DF,  p-value: < 2.2e-16
   ```

   Bisa Anda lihat pada bagian `Multiple R-squared` untuk mengetahui nilai dari koefisien determinasi (R²). Walaupun masih di bawah 50%, namun semua prediktor yang digunakan untuk mengestimasi radiasi matahari sudah signifikan (p-value $< 0.05$). 

5. Anda dapat melakukan estimasi nilai radiasi matahari pada model yang sudah dibangun dengan menggunakan data validasi (`data_test`) dengan perintah berikut. 
   
   ```r
   data_test <- data_test %>%
      mutate(
         SRAD_pred = predict(model, data_test)
      )
   ```
6. Kemudian, lakukan perhitungan koefisien determinasi (R²) dan korelasi Pearson (r) pada `data_test` dengan perintah berikut. 
   
   ```r
   # korelasi Pearson (r)
   r <- cor(data_test$SRAD, data_test$SRAD_pred)

   # koefisien determinasi (R²)
   R2 <- R^2

   # Print
   print(r); print(R2)
   ```

   ```
   [1] 0.6713033
   [1] 0.4506481
   ```

#### Model Hunt et al. (1998) {.unnumbered}

Langkah-langkah pembuatan model radiasi matahari dengan menggunakan model Hunt et al. (1998) adalah sebagai berikut.

1. Impor data Excel. Caranya sama seperti pada subbab sebelumnya.
2. Sebelum Anda melakukan pembuatan model regresi linier berganda, Anda harus melakukan perhitungan $S_0$ terlebih dahulu. Kami menyediakan fungsi untuk menghitung nilai $S_0$ seperti pada [@sec-modelhunt]. Anda hanya memasukkan nilai latitude serta *day of year* pada fungsi ini. 
   
   ```r
   S0 <- function(lat, doy){
      # Fungsi untuk menghitung sin (delta)
      sin_delta <- -sinpi(23.45 / 180) * cospi((360 * (doy + 10) / 365) / 180)
      asin_delt <- asin(sin_delta) * 180 / pi
      
      # sin(lat) * sin(delta)
      s_lat_delt <- sinpi(lat / 180) * sinpi(asin_delt / 180)
      
      # cos(lat) * cos(delta)
      c_lat_delt <- cospi(lat / 180) * cospi(asin_delt / 180)
      
      # (sin(lat) * sin(delta)) / (cos(lat) * cos(delta))
      t_lat_delt <- s_lat_delt / c_lat_delt
      
      # Fungi perhitungan panjang hari (D)
      D <- 12 + 24/180 * asin(t_lat_delt) * 180 / pi
      
      # Fungsi perhitungan sudut elevasi matahari
      sin_beta <- 3600 * (D * s_lat_delt + 24/pi * c_lat_delt * sqrt(1 - t_lat_delt^2))
      
      # Fungsi radiasi matahari ekstra terestrial
      S_0 <- 1370 * (1 + 0.033 * cospi(360 / 180 * doy / 365)) * sin_beta
      
      # Konversi J m-2 ke MJ m-2
      return(S_0 / 1000000)
   }
   ```

3. Kemudian, tambahkan kolom baru pada `data` yang berisi nilai $S_0$ dengan perintah berikut. 
   
   ```r
   data <- data %>%
      mutate(
         S0 = S0(40.77945, DOY) * 0.0864 # 0.0864 adalah konversi dari MJ m-2 ke W m-2
      )
   ```

4. Untuk membuat model, lakukan pembagian data menjadi `data_test` dan `data_train` dengan perintah berikut. 
   
   
   ```r
   data_train <- data %>% filter(YEAR <= 2018)
   data_test <- data %>% filter(YEAR >= 2019)
   ```

5. Hitunglah `S0 * (Tmax - Tmin)^0.5` dan `P^2` dengan menambahkan dua kolom baru pada `data_train` dan `data_test` dengan perintah berikut. 
   
   ```r
   data_train <- data_train %>%
      mutate(
         TMAX_TMIN = S0 * (TMAX - TMIN)^0.5,
         PRCP_sq = PRCP^2
      )
   
   data_test <- data_test %>%
      mutate(
         TMAX_TMIN = S0 * (TMAX - TMIN)^0.5,
         PRCP_sq = PRCP^2
      )
   ```
   
6. Buat model regresi linier berganda 
   
   ```r
   model <- lm(SRAD ~ TMAX_TMIN + TMAX + PRCP + PRCP_sq, data = data_train)
   summary(model)
   ```

   ``` 
   Call:
   lm(formula = SRAD ~ TMAX_TMIN + TMAX + PRCP + PRCP_sq, data = data_train)
   
   Residuals:
       Min      1Q  Median      3Q     Max
   -585.76  -88.05    3.24   92.61  285.44
   
   Coefficients:
                Estimate Std. Error t value Pr(>|t|)
   (Intercept) 99.691345   3.000258  33.228   <2e-16 ***
   TMAX_TMIN    1.817062   0.054639  33.256   <2e-16 ***
   TMAX        -1.705630   0.187361  -9.103   <2e-16 ***
   PRCP        -8.392630   0.218275 -38.450   <2e-16 ***
   PRCP_sq      0.061033   0.002892  21.101   <2e-16 ***
   ---
   Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
   
   Residual standard error: 105.6 on 7665 degrees of freedom
   Multiple R-squared:  0.3299,    Adjusted R-squared:  0.3295
   F-statistic: 943.3 on 4 and 7665 DF,  p-value: < 2.2e-16
   ```

7. Kemudian, lakukan prediksi pada `data_test` dan evaluasi hasil estimasi model menggunakan metrik $R^2$ dan korelasi Pearson dengan perintah berikut .
   
   ```r
   data_test <- data_test %>%
      mutate(
         SRAD_pred = predict(model, data_test)
   )

   # korelasi Pearson (r)
   r <- cor(data_test$SRAD, data_test$SRAD_pred)

   # koefisien determinasi (R²)
   R2 <- R^2

   print(r); print(R2)
   ```

   ```
   [1] 0.5991671
   [1] 0.3590012
   ```