In [13]:
import xarray as xr
import pandas as pd
import glob
import os
import numpy as np

In [None]:
# Folder NetCDF
folder = r"C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\Dataset\SSTv6"
files = sorted(glob.glob(os.path.join(folder, "ersst.v5.*.nc")))

all_data = []

# Ambil dimensi grid dari file pertama (buat tahu jumlah grid)
ds0 = xr.open_dataset(files[0])
grid_size = ds0["sst"].values.squeeze().size  # total lat*lon

for f in files:
    fname = os.path.basename(f)
    year = int(fname.split(".")[2][:4])
    month = int(fname.split(".")[2][4:6])

    ds = xr.open_dataset(f)
    sst = ds["sst"].values.squeeze().flatten()  # 2D jadi 1D, termasuk NaN

    row = [year, month] + sst.tolist()
    all_data.append(row)

# Buat DataFrame (semua grid termasuk NaN)
columns = ["Tahun", "Bulan"] + [f"Grid{i+1}" for i in range(grid_size)]
df = pd.DataFrame(all_data, columns=columns)

# Preview
print(df.head())
print(f"Total grid (dengan NaN): {grid_size}")

# Simpan CSV
df.to_csv(os.path.join(folder, "ERSST_1950_2024_full.csv"), index=False)
print("Selesai! CSV semua grid (termasuk daratan/NaN) tersimpan.")


   Tahun  Bulan  Grid1  Grid2  Grid3  Grid4  Grid5  Grid6  Grid7  Grid8  ...  \
0   1950      1    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
1   1950      2    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
2   1950      3    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
3   1950      4    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
4   1950      5    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   

   Grid16011  Grid16012  Grid16013  Grid16014  Grid16015  Grid16016  \
0       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
1       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
2       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
3       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
4       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   

   Grid16017  Grid16018  Grid16019  Grid16020  
0       -1.8       -1.8       -1.8       -1.

In [None]:
# Lokasi file NINO (ubah sesuai path kamu)
nino_file = r"C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\Dataset\NINO34\ersst5.nino.mth.91-20.ascii.txt"

# Baca file, skip baris komentar (#) dan pakai whitespace sebagai delimiter
df1 = pd.read_csv(nino_file, delim_whitespace=True, comment="#")

# Kolom asli biasanya seperti ini:
# YR MON NINO1+2 ANOM NINO3 ANOM NINO4 ANOM NINO3.4 ANOM
# Ambil hanya YR, MON, NINO3.4, dan ANOM terakhir
df1 = df1[["YR", "MON", "NINO3.4", "ANOM"]]

# Filter hanya sampai 2024-12
df1 = df1[(df1["YR"] < 2025)]

# Simpan ke CSV
output_file = r"C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\Dataset\NINO34\NINO34_1950_2024.csv"
df.to_csv(output_file, index=False)

print(f"Selesai! Data NINO3.4 tersimpan di {output_file}")
print(df1)

  df1 = pd.read_csv(nino_file, delim_whitespace=True, comment="#")


Selesai! Data NINO3.4 tersimpan di C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\Dataset\NINO34_1950_2024.csv
       YR  MON  NINO3.4  ANOM
0    1950    1    24.55 -1.55
1    1950    2    25.06 -1.78
2    1950    3    25.87 -1.38
3    1950    4    26.28 -1.90
4    1950    5    26.18 -1.74
..    ...  ...      ...   ...
895  2024    8    26.73 -0.42
896  2024    9    26.45 -0.75
897  2024   10    26.44 -0.32
898  2024   11    26.45  0.06
899  2024   12    26.00 -0.03

[900 rows x 4 columns]


In [None]:
# Hapus kolom YR dan MON dari df1
df1_clean = df1.drop(columns=["YR", "MON"])

# Gabungkan secara horizontal (baris 1 ketemu baris 1, dst)
enso_df = pd.concat([df, df1_clean], axis=1)

# Simpan ke CSV
output_file = r"C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\Dataset\ENSO_dataset.csv"
enso_df.to_csv(output_file, index=False)

print(f"Dataset ENSO berhasil disimpan di {output_file}")
print(enso_df.head())

Dataset ENSO berhasil disimpan di C:\Users\kettin\Documents\Lomba\GEMASTIKSciPaper\ENSO_dataset.csv
   Tahun  Bulan  Grid1  Grid2  Grid3  Grid4  Grid5  Grid6  Grid7  Grid8  ...  \
0   1950      1    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
1   1950      2    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
2   1950      3    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
3   1950      4    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   
4   1950      5    NaN    NaN    NaN    NaN    NaN    NaN    NaN    NaN  ...   

   Grid16013  Grid16014  Grid16015  Grid16016  Grid16017  Grid16018  \
0       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
1       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
2       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
3       -1.8       -1.8       -1.8       -1.8       -1.8       -1.8   
4       -1.8       -1.8       -1.8       -1.8       -1.8       -