diffusers.Unetモデルを流用したWRF学習
トレーニングのみ行う

1220
エンコーダをモデルに統合（いずれ時系列も）
TMP_model1220.pth ;

1219
前ブランチは統合済み
低解像度入力を条件付に導入したい
clipエンコーダによるベクトル化の導入...lossがあまり変わらない...
DLR_model1219.pth ;lossがあまり変わらない...
TMP_model1219.pth ;lossが4.0まで減少。やった！

画像による条件付をベクトルで行った。10回実行したもの

1218
UNet2DConditionModelによる日付条件付きモデル（大きな改変が予測されるので別ブランチへ）
日付をベクトルに変換し入力

DLR_model1218...100回実行したもの。lossはあまり変わらなかった（9.2339）。
わずかに収束が早くなった程度

1010
seedの確認と固定
モデルのパラメータ保存を試みる
条件付きモデルガイダンスを仕込んでみる
画像生成と学習を別にしたい

In [None]:
#seedを固定
#前提ライブラリを取得
import random
import numpy as np
import matplotlib.pyplot as plt
import xarray as xr
import os
import pandas as pd

from diffusers import UNet2DConditionModel
from transformers import CLIPVisionConfig, CLIPVisionModelWithProjection
import torch
import torchvision
from torchvision import transforms
from torch.utils.data import DataLoader
from torch.optim import Adam
import torch.nn.functional as F
from torch import nn

from dataclasses import dataclass

import math
from tqdm import tqdm

In [None]:
'''
条件設定
シード固定
'''


def torch_fix_seed(seed=42):
    # Python random
    random.seed(seed)
    # Numpy
    np.random.seed(seed)
    # Pytorch
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.deterministic = True
    torch.use_deterministic_algorithms = True

@dataclass

class TrainingConfig:

    image_size = 64  # the generated image resolution
    train_batch_size = 32
    eval_batch_size = 32  # how many images to sample during evaluation

    num_epochs = 20

    num_timesteps = 1000
    
    gradient_accumulation_steps = 1
    learning_rate = 1e-4
    lr_warmup_steps = 500

    save_model_epochs = 50

    seed = 42

config = TrainingConfig()
torch_fix_seed(config.seed)

In [None]:
'''
年別データ結合
'''

def make_tensor(data='TMP',area='manji',years=[2021,2022,2023],source='/mnt/nadaru/trainingdataset'):
    dss = []
    for y in years:
        filename = f"{data}_{y}_{area}.nc"
        filepath = os.path.join(source,filename)
        try:
            d = xr.load_dataset(filepath)
            dss.append(d)
            print(filename)
        except:
            pass
    ds = xr.concat(dss,dim="t")
    if np.sum(np.isnan(ds['amgsd'].values)) != 0:
        print('Warning:nan detected')
        ds.dropna(dim='y',how='any')
    return ds

In [None]:
'''
ノイズ除去拡散モデル


'''

from tqdm import tqdm

class Diffuser:
    def __init__(self, num_timesteps=1000, beta_start=0.0001, beta_end=0.02,device='cpu'):
        self.num_timesteps = num_timesteps
        self.device = device
        self.betas = torch.linspace(beta_start, beta_end, num_timesteps, device=device)
        self.alphas = 1 - self.betas
        self.alpha_bars = torch.cumprod(self.alphas, dim=0)
        
    def add_noise(self, x_0, t):
        T = self.num_timesteps
        assert (t >= 1).all() and ((t <= self.num_timesteps).all())
        t_idx = t - 1
        
        alpha_bar = self.alpha_bars[t_idx]
        N = alpha_bar.size(0)
        alpha_bar = alpha_bar.view(N, 1, 1, 1)
        
        noise = torch.randn_like(x_0, device=self.device)
        x_t = torch.sqrt(alpha_bar) * x_0 + torch.sqrt(1 - alpha_bar) * noise

        return x_t, noise
    
    def denoise(self, model, x, cond, t, gamma):
        T = self.num_timesteps
        assert (t >= 1).all() and ((t <= self.num_timesteps).all())
        
        t_idx = t - 1
        alpha = self.alphas[t_idx]
        alpha_bar = self.alpha_bars[t_idx]
        alpha_bar_prev = self.alpha_bars[t_idx - 1]
        
        N = alpha_bar.size(0)
        alpha = alpha.view(N, 1, 1, 1)
        alpha_bar = alpha_bar.view(N, 1, 1, 1)
        alpha_bar_prev = alpha_bar_prev.view(N, 1, 1, 1)
        
        model.eval()
        with torch.no_grad():
                
            input = torch.cat([x,cond],dim=1)
            
            #if torch.isnan(input).sum() != 0:
            #    print('input!:')
                
            eps_cond = model(input, t).sample

            if torch.isnan(eps_cond).sum() != 0:
                print(torch.isnan(eps_cond).sum())
            
            nocond = torch.zeros_like(x, device=self.device)
            input_uncond = torch.cat([x,nocond],dim=1)
                
            eps_uncond = model(input, t).sample
            
            eps = eps_uncond + gamma * (eps_cond - eps_uncond)

        model.train()

        noise = torch.randn_like(x, device=self.device)
        noise[t == 1] = 0

        mu = (x - ((1-alpha) / torch.sqrt(1-alpha_bar)) * eps ) / torch.sqrt(alpha)
    
        std = torch.sqrt((1-alpha) * (1-alpha_bar_prev) / (1-alpha_bar))

        return mu + noise * std
    
    def reverse_to_data(self, x):
        #標準化の解除、numpy化
        invTrans = transforms.Compose([ transforms.Normalize(mean = 0., std = 1/hr_std),
                                        transforms.Normalize(mean = -hr_mean, std = 1), ])
        
        image = x.to('cpu')
        image = invTrans(image)
        image = image.numpy()

        return np.transpose(image,(1,2,0))
        
    def sample(self, model, cond, x_shape=(16, 1, 64, 64),gamma=3.0):
        #ノイズ除去、データ変換まで
        batch_size = x_shape[0]
        x = torch.randn(x_shape, device=self.device)
        
        for i in tqdm(range(self.num_timesteps, 0, -1)): 
            t = torch.tensor([i] * batch_size, device=self.device, dtype=torch.long)
            x = self.denoise(model, x, cond, t, gamma)
            #print(x.shape)
        images = [self.reverse_to_data(x[i]) for i in range(batch_size)]
        return x, images

    def sample_asim(self, model, cond, obs, x_shape=(16, 1, 64, 64),gamma=3.0, asim_sample=100):
        #データ同化処理
        batch_size = x_shape[0]
        x = torch.randn(x_shape, device=self.device)
        obs = obs.to('cpu')
        
        obs_points = self.rsampling(obs.detach().numpy().copy(), asim_sample)
        interpolate = torch.tensor(self.makeinterpolategrid(obs_points, size=x_shape[2:]),device=self.device)
        mask = torch.tensor(self.positionmask(obs_points, size=x_shape[2:]),device=self.device)
        
        for i in tqdm(range(self.num_timesteps, 0, -1)): #逆順イテレータ
            t = torch.tensor([i] * batch_size, device=self.device, dtype=torch.long)    
            x = self.denoise(model, x, cond, t, gamma)
            
            noised_interp, noise = self.add_noise(interpolate, t)
            
            xunknown = (1-mask) * x
            xknown = interpolate * mask


                
            x = (xunknown + xknown).to(torch.float32)
            #print(x.shape)
        
        images = [self.reverse_to_data(x[i]) for i in range(batch_size)]
        return x, images

    def rsampling(self, darray, num_sample):
        x_size, y_size = darray.shape[2:]
        a = np.arange(x_size*y_size)
        np.random.shuffle(a)
        point = a[:num_sample]
        sample_array = []
        for i in point:
            y_idx = i // x_size
            x_idx = i % x_size
            sample = y_idx, x_idx, darray[:,:, x_idx, y_idx]
            sample_array.append(sample)
        return sample_array

    def fixedsampling(self, darray,coordarr):
        sample_array = []
        for i in coordarr:
            y_idx = i[0]
            x_idx = i[1]
            sample = y_idx, x_idx, darray[:,:, x_idx, y_idx]
            sample_array.append(sample)
        return sample_array

    #観測値補間
    def makeinterpolategrid(self, obsarr, size=(64,64)):
        coordarr = [i[0:2] for i in obsarr] 
        data = [i[2] for i in obsarr] 
        latarr, longarr = np.meshgrid(range(size[0]),range(size[1]))
        
        result1 = griddata(points=coordarr, values=data, xi=(latarr, longarr),method='cubic', fill_value=0).transpose(2,3,0,1)
        #gaisou
        result2 = griddata(points=coordarr, values=data, xi=(latarr, longarr),method='nearest').transpose(2,3,0,1)
    
        nan_mask = result1[0] == 0
        result = result2 * nan_mask + result1
        return result
    
    #ガウシアンマスクの作成
    def _positionmask(self, coord, maskarr, kernel):
        temp = np.zeros(maskarr.shape)
        
        latidx = coord[0] 
        lonidx = coord[1]
        
        temp[lonidx,latidx] = 1
        temp = cv2.filter2D(temp,-1,kernel,borderType=cv2.BORDER_ISOLATED)
        maskarr = np.fmax(temp,maskarr)
        return maskarr
    
    def positionmask(self, obsarr, size=(64,64)):
        #ガウシアンカーネルの用意
        kernelg=cv2.getGaussianKernel(11,2.)
        gaussian_2d = kernelg * kernelg.T
        
        maskarr = np.zeros(size)
        coordarr = [i[0:2] for i in obsarr]
        for coord in coordarr:
            maskarr = self._positionmask(coord, maskarr, gaussian_2d)
    
        return maskarr

In [None]:
#データセット取得：from WRFlearning.ipynb
#改造：amgsdと時系列を取り出せるようにした

img_size = config.image_size
batch = config.train_batch_size
epochs = config.num_epochs
lr_rate = config.learning_rate
device = 'cuda' if torch.cuda.is_available() else 'cpu'

#データセットの取得
print('dataset loading三( ﾟ∀ﾟ)...')
ds = make_tensor()

lr = ds['WRF_1km'].values
hr = ds['WRF_300m'].values
amgsd = ds['amgsd'].values
timeline = ds['WRF_300m'].t
timecode = np.arange(len(timeline))

hr_mean= hr.mean()
hr_std = hr.std()

print('dataset to tensor(jstammt)...')
lr_tensor = torch.tensor(lr.astype('float'),dtype=torch.float32)
hr_tensor = torch.tensor(hr.astype('float'),dtype=torch.float32)
timecode_tensor =  torch.tensor(timecode.astype('float'))
amgsd_tensor = torch.tensor(amgsd.astype('float'))


trans = torchvision.transforms.Compose([
                                        torchvision.transforms.Resize(size=(64, 64)),
                                        torchvision.transforms.Normalize((hr_mean), (hr_std))])

class WRFdatasets(torch.utils.data.Dataset):
    def __init__(self, LR, HR, amd, timeline, transform = None):
        self.transform = transform

        self.lr = LR.unsqueeze(1)
        self.hr = HR.unsqueeze(1)

        self.time = timeline.to(torch.int)
        self.amd  = amd.unsqueeze(1)
        
        self.datanum = len(timeline)

    def __len__(self):
        return self.datanum

    def __getitem__(self, idx):
        out_lr = self.lr[idx]
        out_hr = self.hr[idx]

        out_amd = self.amd[idx]
        out_time = self.time[idx]
        
        if self.transform:
            out_lr = self.transform(out_lr)
            out_hr = self.transform(out_hr)
            out_amd = self.transform(out_amd)
            

        return out_lr, out_hr, out_amd, out_time

print('dataset making...')
dataset = WRFdatasets(lr_tensor, hr_tensor, amgsd_tensor, timecode_tensor, transform=trans)

# 学習データ、検証データに 8:2 の割合で分割する。
train_size = int(0.8 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, test_dataset = torch.utils.data.random_split(
    dataset, [train_size, val_size]
)
print('kansei')
trainloader = torch.utils.data.DataLoader(train_dataset, batch_size = batch, shuffle = True, num_workers = 2)
testloader = torch.utils.data.DataLoader(test_dataset, batch_size = batch, shuffle = False, num_workers = 2)

dataset loading三(　ﾟ∀ﾟ)...
TMP_2021_manji.nc
TMP_2022_manji.nc
TMP_2023_manji.nc
dataset to tensor(jstammt)...
dataset making...
kansei


In [28]:
#モデル形成
model = DenoisingModel()

num_timesteps = config.num_timesteps
diffuser = Diffuser(config.num_timesteps, device=device)
model.to(device)
optimizer = torch.optim.AdamW(model.parameters(), lr=config.learning_rate)

#学習
losses = []
for epoch in range(epochs):
    loss_sum = 0.0
    cnt = 0
    
    for low, high, amd, time in tqdm(trainloader):
        
        #時系列エンコード
        #dates = pd.to_datetime(timeline[time].values)
        #dates_encoded = datetime_embedder(dates).unsqueeze(1).to(device)
        
        optimizer.zero_grad()
        low = low.to(device)
        high = high.to(device)
        t = torch.randint(1, config.num_timesteps+1, (len(high),), device=device)

        x_noisy, noise = diffuser.add_noise(high,t) #画像にノイズ付加
        noise_pred = model(t, x_noisy, low)
        loss = F.mse_loss(noise, noise_pred)
        
        loss.backward()
        optimizer.step()
        
        loss_sum += loss.item()
        cnt += 1
    print('loss:{:.4f}'.format(loss_sum))

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:12.0362


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.42it/s]


loss:3.3291


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.42it/s]


loss:2.7957


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.5462


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.42it/s]


loss:2.4456


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.42it/s]


loss:2.3388


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.42it/s]


loss:2.3002


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.3001


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.1110


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.44it/s]


loss:2.0621


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.0487


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:27<00:00,  4.44it/s]


loss:2.2027


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.44it/s]


loss:2.1049


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.0441


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:27<00:00,  4.44it/s]


loss:2.0911


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:1.9406


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.0408


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:2.0030


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.43it/s]


loss:1.9918


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 657/657 [02:28<00:00,  4.44it/s]

loss:1.9286





In [29]:
#学習後パラメータ保存
torch.save(model.state_dict(), 'saved_model/TMP_model1220.pth')


rmse(K):2.459355308909517