In [1]:
!pip install pykrige

Collecting pykrige
  Downloading PyKrige-1.7.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (8.1 kB)
Downloading PyKrige-1.7.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (909 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m909.7/909.7 kB[0m [31m24.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pykrige
Successfully installed pykrige-1.7.2


In [2]:
import os
import pandas as pd
import numpy as np
from sklearn.impute import KNNImputer
from pykrige.ok3d import OrdinaryKriging3D

In [3]:
import pandas as pd
import numpy as np
import os
from pykrige.ok3d import OrdinaryKriging3D
from sklearn.preprocessing import MinMaxScaler
import shutil

def process_and_save(train_path, val_path, test_path, output_dir):
    print(f"Processing {train_path} and {val_path}")
    
    df_train = pd.read_csv(train_path)
    df_val = pd.read_csv(val_path)
    
    # Kết hợp dữ liệu để có nhiều điểm hơn cho việc nội suy
    df = pd.concat([df_train, df_val], ignore_index=True)
    
    # Chuẩn bị dữ liệu
    df.rename(columns={'datetime': 'DATETIME', 'value': 'AWS'}, inplace=True)
    if 'time' in df.columns:
        df.rename(columns={'time': 'DATETIME'}, inplace=True)
    
    # Đảm bảo tên cột theo đúng yêu cầu
    if 'row' in df.columns and 'col' in df.columns:
        df.rename(columns={'row': 'ROW', 'col': 'COL'}, inplace=True)
    
    df['DATETIME'] = pd.to_datetime(df['DATETIME'])
    df['AWS_MISSING'] = df['AWS'].isna() | (df['AWS'] < 0)
    df.loc[df['AWS'] < 0, 'AWS'] = np.nan
    
    # Chuyển đổi thời gian thành giá trị số để sử dụng trong Kriging 3D
    df['time_numeric'] = (df['DATETIME'] - df['DATETIME'].min()).dt.total_seconds()
    
    # Scale các cột khác ngoài AWS, ROW, COL, DATETIME
    columns_to_scale = [col for col in df.columns if col not in ['AWS', 'ROW', 'COL', 'DATETIME', 'AWS_MISSING', 'time_numeric']]
    scalers = {}
    
    # Scale từng cột riêng biệt
    if columns_to_scale:
        for col in columns_to_scale:
            if col in df.columns:
                try:
                    scaler = MinMaxScaler()
                    # Reshape để đảm bảo 2D
                    data_2d = df[col].values.reshape(-1, 1)
                    df[col] = scaler.fit_transform(data_2d)
                    scalers[col] = scaler
                except Exception as e:
                    print(f"Không thể scale cột {col}: {e}")
    
    # Chia dữ liệu thành các điểm đã biết và điểm cần nội suy
    df_known = df[~df['AWS_MISSING']][['ROW', 'COL', 'time_numeric', 'AWS']]
    df_missing = df[df['AWS_MISSING']]
    
    print(f"Số điểm đã biết: {len(df_known)}, Số điểm cần nội suy: {len(df_missing)}")
    
    # Nếu có quá nhiều điểm, có thể cần phải lấy mẫu để tăng hiệu suất
    if len(df_known) > 400:
        df_known = df_known.sample(n=400, random_state=42)
        print(f"Lấy mẫu 400 điểm đã biết để tăng hiệu suất")
    
    # Nội suy bằng Ordinary Kriging 3D cho tất cả các điểm thiếu
    batch_size = 50
    num_batches = len(df_missing) // batch_size + 1
    kriging_results = []
    
    print(f"Thực hiện nội suy Kriging với {num_batches} batch...")
    
    for i in range(num_batches):
        batch = df_missing.iloc[i * batch_size:(i + 1) * batch_size]
        if batch.empty:
            continue
            
        try:
            # Khởi tạo và thực hiện Ordinary Kriging 3D
            OK3D = OrdinaryKriging3D(
                df_known['ROW'].values,
                df_known['COL'].values,
                df_known['time_numeric'].values,
                df_known['AWS'].values,
                variogram_model="linear",
                verbose=False,
                enable_plotting=False
            )
            
            # Thực hiện nội suy
            z_pred, _ = OK3D.execute("points", 
                                     batch['ROW'].values, 
                                     batch['COL'].values, 
                                     batch['time_numeric'].values)
            
            # Lưu kết quả
            for idx, (index, row) in enumerate(batch.iterrows()):
                if z_pred[idx] < 0:
                    z_pred[idx] = 0
                kriging_results.append({
                    'index': index,
                    'AWS_kriging': z_pred[idx]
                })
                
            print(f"Đã hoàn thành batch {i+1}/{num_batches}")
        except Exception as e:
            print(f"Lỗi ở batch {i+1}: {e}")
    
    # Áp dụng kết quả nội suy trực tiếp vào cột AWS
    for result in kriging_results:
        df.loc[result['index'], 'AWS'] = result['AWS_kriging']
    
    # Clipping để xử lý outlier, chặn trên là 10
    df['AWS'] = np.clip(df['AWS'], None, 10)
    
    # Loại bỏ các cột tạm thời
    df = df.drop(columns=['time_numeric'] + 
                 [col for col in df.columns if col.startswith('AWS_') and col not in ['AWS', 'AWS_MISSING']])
    
    # Chia lại thành tập train và validation
    df_train_processed = df.iloc[:len(df_train)]
    df_val_processed = df.iloc[len(df_train):]
    
    # Xử lý tập test nếu có
    if test_path and os.path.exists(test_path):
        try:
            df_test = pd.read_csv(test_path)
            
            # Chuẩn bị dữ liệu test
            df_test.rename(columns={'datetime': 'DATETIME', 'value': 'AWS'}, inplace=True)
            if 'time' in df_test.columns:
                df_test.rename(columns={'time': 'DATETIME'}, inplace=True)
            
            if 'row' in df_test.columns and 'col' in df_test.columns:
                df_test.rename(columns={'row': 'ROW', 'col': 'COL'}, inplace=True)
            
            # Áp dụng clipping cho AWS trong test set
            if 'AWS' in df_test.columns:
                df_test['AWS'] = np.clip(df_test['AWS'], None, 10)
            
            # Scale các cột trong test set
            for col in df_test.columns:
                if col in scalers and col not in ['AWS', 'ROW', 'COL', 'DATETIME']:
                    try:
                        # Scale cột sử dụng scaler tương ứng đã được fit từ tập train/val
                        data_2d = df_test[col].values.reshape(-1, 1)
                        df_test[col] = scalers[col].transform(data_2d)
                    except Exception as e:
                        print(f"Không thể scale cột {col} trong test set: {e}")
            
            # Lưu test set
            os.makedirs(output_dir, exist_ok=True)
            df_test.to_csv(os.path.join(output_dir, "merged_test.csv"), index=False)
            print(f"Processed test file saved to {os.path.join(output_dir, 'merged_test.csv')}")
        except Exception as e:
            print(f"Lỗi khi xử lý file test: {e}")
            # Sao chép file test gốc nếu không thể xử lý
            if os.path.exists(test_path):
                os.makedirs(output_dir, exist_ok=True)
                shutil.copy(test_path, os.path.join(output_dir, "merged_test.csv"))
                print(f"Đã sao chép file test gốc vào {os.path.join(output_dir, 'merged_test.csv')}")
    
    # Lưu kết quả
    os.makedirs(output_dir, exist_ok=True)
    df_train_processed.to_csv(os.path.join(output_dir, "processed_train.csv"), index=False)
    df_val_processed.to_csv(os.path.join(output_dir, "processed_val.csv"), index=False)
    
    print(f"Processed train saved to {os.path.join(output_dir, 'processed_train.csv')}")
    print(f"Processed val saved to {os.path.join(output_dir, 'processed_val.csv')}")
    
    return df_train_processed, df_val_processed

def process_all_folds():
    months = ["2019-04", "2019-10", "2020-04", "2020-10"]
    
    for month in months:
        print(f"\n{'='*50}")
        print(f"Processing month: {month}")
        print(f"{'='*50}")
        
        for fold in range(1, 6):  # Xử lý fold_1 đến fold_5
            base_root = f"/kaggle/input/dataset-k-fold/{month}/fold_{fold}"
            output_root = f"/kaggle/working/{month}/fold_{fold}"
            
            train_path = os.path.join(base_root, "merged_train.csv")
            val_path = os.path.join(base_root, "merged_val.csv")
            test_path = os.path.join(base_root, "merged_test.csv")
            
            if os.path.exists(train_path) and os.path.exists(val_path):
                print(f"\nProcessing {month} - fold_{fold}")
                process_and_save(train_path, val_path, test_path, output_root)
            else:
                print(f"Skipping {month} - fold_{fold} (files not found)")

# Chạy xử lý cho tất cả các fold trong tất cả các tháng
if __name__ == "__main__":
    process_all_folds()


Processing month: 2019-04

Processing 2019-04 - fold_1
Processing /kaggle/input/dataset-k-fold/2019-04/fold_1/merged_train.csv and /kaggle/input/dataset-k-fold/2019-04/fold_1/merged_val.csv
Số điểm đã biết: 43823, Số điểm cần nội suy: 20305
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 407 batch...
Đã hoàn thành batch 1/407
Đã hoàn thành batch 2/407
Đã hoàn thành batch 3/407
Đã hoàn thành batch 4/407
Đã hoàn thành batch 5/407
Đã hoàn thành batch 6/407
Đã hoàn thành batch 7/407
Đã hoàn thành batch 8/407
Đã hoàn thành batch 9/407
Đã hoàn thành batch 10/407
Đã hoàn thành batch 11/407
Đã hoàn thành batch 12/407
Đã hoàn thành batch 13/407
Đã hoàn thành batch 14/407
Đã hoàn thành batch 15/407
Đã hoàn thành batch 16/407
Đã hoàn thành batch 17/407
Đã hoàn thành batch 18/407
Đã hoàn thành batch 19/407
Đã hoàn thành batch 20/407
Đã hoàn thành batch 21/407
Đã hoàn thành batch 22/407
Đã hoàn thành batch 23/407
Đã hoàn thành batch 24/407
Đã hoàn thành batch 25/407
Đã hoà

  return op(a, b)
  return op(a, b)


Số điểm đã biết: 36687, Số điểm cần nội suy: 29553
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 592 batch...
Đã hoàn thành batch 1/592
Đã hoàn thành batch 2/592
Đã hoàn thành batch 3/592
Đã hoàn thành batch 4/592
Đã hoàn thành batch 5/592
Đã hoàn thành batch 6/592
Đã hoàn thành batch 7/592
Đã hoàn thành batch 8/592
Đã hoàn thành batch 9/592
Đã hoàn thành batch 10/592
Đã hoàn thành batch 11/592
Đã hoàn thành batch 12/592
Đã hoàn thành batch 13/592
Đã hoàn thành batch 14/592
Đã hoàn thành batch 15/592
Đã hoàn thành batch 16/592
Đã hoàn thành batch 17/592
Đã hoàn thành batch 18/592
Đã hoàn thành batch 19/592
Đã hoàn thành batch 20/592
Đã hoàn thành batch 21/592
Đã hoàn thành batch 22/592
Đã hoàn thành batch 23/592
Đã hoàn thành batch 24/592
Đã hoàn thành batch 25/592
Đã hoàn thành batch 26/592
Đã hoàn thành batch 27/592
Đã hoàn thành batch 28/592
Đã hoàn thành batch 29/592
Đã hoàn thành batch 30/592
Đã hoàn thành batch 31/592
Đã hoàn thành batch 32/592
Đã hoàn 

  return op(a, b)


Processed test file saved to /kaggle/working/2019-10/fold_1/merged_test.csv
Processed train saved to /kaggle/working/2019-10/fold_1/processed_train.csv
Processed val saved to /kaggle/working/2019-10/fold_1/processed_val.csv

Processing 2019-10 - fold_2
Processing /kaggle/input/dataset-k-fold/2019-10/fold_2/merged_train.csv and /kaggle/input/dataset-k-fold/2019-10/fold_2/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 55089, Số điểm cần nội suy: 44271
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 886 batch...
Đã hoàn thành batch 1/886
Đã hoàn thành batch 2/886
Đã hoàn thành batch 3/886
Đã hoàn thành batch 4/886
Đã hoàn thành batch 5/886
Đã hoàn thành batch 6/886
Đã hoàn thành batch 7/886
Đã hoàn thành batch 8/886
Đã hoàn thành batch 9/886
Đã hoàn thành batch 10/886
Đã hoàn thành batch 11/886
Đã hoàn thành batch 12/886
Đã hoàn thành batch 13/886
Đã hoàn thành batch 14/886
Đã hoàn thành batch 15/886
Đã hoàn thành batch 16/886
Đã hoàn thành batch 17/886
Đã hoàn thành batch 18/886
Đã hoàn thành batch 19/886
Đã hoàn thành batch 20/886
Đã hoàn thành batch 21/886
Đã hoàn thành batch 22/886
Đã hoàn thành batch 23/886
Đã hoàn thành batch 24/886
Đã hoàn thành batch 25/886
Đã hoàn thành batch 26/886
Đã hoàn thành batch 27/886
Đã hoàn thành batch 28/886
Đã hoàn thành batch 29/886
Đã hoàn thành batch 30/886
Đã hoàn thành batch 31/886
Đã hoàn thành batch 32/886
Đã hoàn 

  return op(a, b)


Processed test file saved to /kaggle/working/2019-10/fold_2/merged_test.csv
Processed train saved to /kaggle/working/2019-10/fold_2/processed_train.csv
Processed val saved to /kaggle/working/2019-10/fold_2/processed_val.csv

Processing 2019-10 - fold_3
Processing /kaggle/input/dataset-k-fold/2019-10/fold_3/merged_train.csv and /kaggle/input/dataset-k-fold/2019-10/fold_3/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 73235, Số điểm cần nội suy: 59245
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1185 batch...
Đã hoàn thành batch 1/1185
Đã hoàn thành batch 2/1185
Đã hoàn thành batch 3/1185
Đã hoàn thành batch 4/1185
Đã hoàn thành batch 5/1185
Đã hoàn thành batch 6/1185
Đã hoàn thành batch 7/1185
Đã hoàn thành batch 8/1185
Đã hoàn thành batch 9/1185
Đã hoàn thành batch 10/1185
Đã hoàn thành batch 11/1185
Đã hoàn thành batch 12/1185
Đã hoàn thành batch 13/1185
Đã hoàn thành batch 14/1185
Đã hoàn thành batch 15/1185
Đã hoàn thành batch 16/1185
Đã hoàn thành batch 17/1185
Đã hoàn thành batch 18/1185
Đã hoàn thành batch 19/1185
Đã hoàn thành batch 20/1185
Đã hoàn thành batch 21/1185
Đã hoàn thành batch 22/1185
Đã hoàn thành batch 23/1185
Đã hoàn thành batch 24/1185
Đã hoàn thành batch 25/1185
Đã hoàn thành batch 26/1185
Đã hoàn thành batch 27/1185
Đã hoàn thành batch 28/1185
Đã hoàn thành batch 29/1185
Đã hoàn thành batch 30/1185
Đã hoàn thành batch 31/1185
Đã 

  return op(a, b)


Processed test file saved to /kaggle/working/2019-10/fold_3/merged_test.csv
Processed train saved to /kaggle/working/2019-10/fold_3/processed_train.csv
Processed val saved to /kaggle/working/2019-10/fold_3/processed_val.csv

Processing 2019-10 - fold_4
Processing /kaggle/input/dataset-k-fold/2019-10/fold_4/merged_train.csv and /kaggle/input/dataset-k-fold/2019-10/fold_4/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 91443, Số điểm cần nội suy: 74157
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1484 batch...
Đã hoàn thành batch 1/1484
Đã hoàn thành batch 2/1484
Đã hoàn thành batch 3/1484
Đã hoàn thành batch 4/1484
Đã hoàn thành batch 5/1484
Đã hoàn thành batch 6/1484
Đã hoàn thành batch 7/1484
Đã hoàn thành batch 8/1484
Đã hoàn thành batch 9/1484
Đã hoàn thành batch 10/1484
Đã hoàn thành batch 11/1484
Đã hoàn thành batch 12/1484
Đã hoàn thành batch 13/1484
Đã hoàn thành batch 14/1484
Đã hoàn thành batch 15/1484
Đã hoàn thành batch 16/1484
Đã hoàn thành batch 17/1484
Đã hoàn thành batch 18/1484
Đã hoàn thành batch 19/1484
Đã hoàn thành batch 20/1484
Đã hoàn thành batch 21/1484
Đã hoàn thành batch 22/1484
Đã hoàn thành batch 23/1484
Đã hoàn thành batch 24/1484
Đã hoàn thành batch 25/1484
Đã hoàn thành batch 26/1484
Đã hoàn thành batch 27/1484
Đã hoàn thành batch 28/1484
Đã hoàn thành batch 29/1484
Đã hoàn thành batch 30/1484
Đã hoàn thành batch 31/1484
Đã 

  return op(a, b)


Processed test file saved to /kaggle/working/2019-10/fold_4/merged_test.csv
Processed train saved to /kaggle/working/2019-10/fold_4/processed_train.csv
Processed val saved to /kaggle/working/2019-10/fold_4/processed_val.csv

Processing 2019-10 - fold_5
Processing /kaggle/input/dataset-k-fold/2019-10/fold_5/merged_train.csv and /kaggle/input/dataset-k-fold/2019-10/fold_5/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 110380, Số điểm cần nội suy: 88340
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1767 batch...
Đã hoàn thành batch 1/1767
Đã hoàn thành batch 2/1767
Đã hoàn thành batch 3/1767
Đã hoàn thành batch 4/1767
Đã hoàn thành batch 5/1767
Đã hoàn thành batch 6/1767
Đã hoàn thành batch 7/1767
Đã hoàn thành batch 8/1767
Đã hoàn thành batch 9/1767
Đã hoàn thành batch 10/1767
Đã hoàn thành batch 11/1767
Đã hoàn thành batch 12/1767
Đã hoàn thành batch 13/1767
Đã hoàn thành batch 14/1767
Đã hoàn thành batch 15/1767
Đã hoàn thành batch 16/1767
Đã hoàn thành batch 17/1767
Đã hoàn thành batch 18/1767
Đã hoàn thành batch 19/1767
Đã hoàn thành batch 20/1767
Đã hoàn thành batch 21/1767
Đã hoàn thành batch 22/1767
Đã hoàn thành batch 23/1767
Đã hoàn thành batch 24/1767
Đã hoàn thành batch 25/1767
Đã hoàn thành batch 26/1767
Đã hoàn thành batch 27/1767
Đã hoàn thành batch 28/1767
Đã hoàn thành batch 29/1767
Đã hoàn thành batch 30/1767
Đã hoàn thành batch 31/1767
Đã

  return op(a, b)


Processed test file saved to /kaggle/working/2019-10/fold_5/merged_test.csv
Processed train saved to /kaggle/working/2019-10/fold_5/processed_train.csv
Processed val saved to /kaggle/working/2019-10/fold_5/processed_val.csv

Processing month: 2020-04

Processing 2020-04 - fold_1
Processing /kaggle/input/dataset-k-fold/2020-04/fold_1/merged_train.csv and /kaggle/input/dataset-k-fold/2020-04/fold_1/merged_val.csv
Số điểm đã biết: 40484, Số điểm cần nội suy: 23644
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 473 batch...
Đã hoàn thành batch 1/473
Đã hoàn thành batch 2/473
Đã hoàn thành batch 3/473
Đã hoàn thành batch 4/473
Đã hoàn thành batch 5/473
Đã hoàn thành batch 6/473
Đã hoàn thành batch 7/473
Đã hoàn thành batch 8/473
Đã hoàn thành batch 9/473
Đã hoàn thành batch 10/473
Đã hoàn thành batch 11/473
Đã hoàn thành batch 12/473
Đã hoàn thành batch 13/473
Đã hoàn thành batch 14/473
Đã hoàn thành batch 15/473
Đã hoàn thành batch 16/473
Đã hoàn thành batch 17/47

  return op(a, b)


Processed test file saved to /kaggle/working/2020-04/fold_1/merged_test.csv
Processed train saved to /kaggle/working/2020-04/fold_1/processed_train.csv
Processed val saved to /kaggle/working/2020-04/fold_1/processed_val.csv

Processing 2020-04 - fold_2
Processing /kaggle/input/dataset-k-fold/2020-04/fold_2/merged_train.csv and /kaggle/input/dataset-k-fold/2020-04/fold_2/merged_val.csv
Số điểm đã biết: 59024, Số điểm cần nội suy: 37168
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 744 batch...
Đã hoàn thành batch 1/744
Đã hoàn thành batch 2/744
Đã hoàn thành batch 3/744
Đã hoàn thành batch 4/744
Đã hoàn thành batch 5/744
Đã hoàn thành batch 6/744
Đã hoàn thành batch 7/744
Đã hoàn thành batch 8/744
Đã hoàn thành batch 9/744
Đã hoàn thành batch 10/744
Đã hoàn thành batch 11/744
Đã hoàn thành batch 12/744
Đã hoàn thành batch 13/744
Đã hoàn thành batch 14/744
Đã hoàn thành batch 15/744
Đã hoàn thành batch 16/744
Đã hoàn thành batch 17/744
Đã hoàn thành batch 18/74

  return op(a, b)


Processed test file saved to /kaggle/working/2020-04/fold_2/merged_test.csv
Processed train saved to /kaggle/working/2020-04/fold_2/processed_train.csv
Processed val saved to /kaggle/working/2020-04/fold_2/processed_val.csv

Processing 2020-04 - fold_3
Processing /kaggle/input/dataset-k-fold/2020-04/fold_3/merged_train.csv and /kaggle/input/dataset-k-fold/2020-04/fold_3/merged_val.csv
Số điểm đã biết: 77569, Số điểm cần nội suy: 50687
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1014 batch...
Đã hoàn thành batch 1/1014
Đã hoàn thành batch 2/1014
Đã hoàn thành batch 3/1014
Đã hoàn thành batch 4/1014
Đã hoàn thành batch 5/1014
Đã hoàn thành batch 6/1014
Đã hoàn thành batch 7/1014
Đã hoàn thành batch 8/1014
Đã hoàn thành batch 9/1014
Đã hoàn thành batch 10/1014
Đã hoàn thành batch 11/1014
Đã hoàn thành batch 12/1014
Đã hoàn thành batch 13/1014
Đã hoàn thành batch 14/1014
Đã hoàn thành batch 15/1014
Đã hoàn thành batch 16/1014
Đã hoàn thành batch 17/1014
Đã hoàn

  return op(a, b)


Processed test file saved to /kaggle/working/2020-04/fold_3/merged_test.csv
Processed train saved to /kaggle/working/2020-04/fold_3/processed_train.csv
Processed val saved to /kaggle/working/2020-04/fold_3/processed_val.csv

Processing 2020-04 - fold_4
Processing /kaggle/input/dataset-k-fold/2020-04/fold_4/merged_train.csv and /kaggle/input/dataset-k-fold/2020-04/fold_4/merged_val.csv
Số điểm đã biết: 95527, Số điểm cần nội suy: 64793
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1296 batch...
Đã hoàn thành batch 1/1296
Đã hoàn thành batch 2/1296
Đã hoàn thành batch 3/1296
Đã hoàn thành batch 4/1296
Đã hoàn thành batch 5/1296
Đã hoàn thành batch 6/1296
Đã hoàn thành batch 7/1296
Đã hoàn thành batch 8/1296
Đã hoàn thành batch 9/1296
Đã hoàn thành batch 10/1296
Đã hoàn thành batch 11/1296
Đã hoàn thành batch 12/1296
Đã hoàn thành batch 13/1296
Đã hoàn thành batch 14/1296
Đã hoàn thành batch 15/1296
Đã hoàn thành batch 16/1296
Đã hoàn thành batch 17/1296
Đã hoàn

  return op(a, b)


Processed test file saved to /kaggle/working/2020-04/fold_4/merged_test.csv
Processed train saved to /kaggle/working/2020-04/fold_4/processed_train.csv
Processed val saved to /kaggle/working/2020-04/fold_4/processed_val.csv

Processing 2020-04 - fold_5
Processing /kaggle/input/dataset-k-fold/2020-04/fold_5/merged_train.csv and /kaggle/input/dataset-k-fold/2020-04/fold_5/merged_val.csv
Số điểm đã biết: 114171, Số điểm cần nội suy: 78213
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 1565 batch...
Đã hoàn thành batch 1/1565
Đã hoàn thành batch 2/1565
Đã hoàn thành batch 3/1565
Đã hoàn thành batch 4/1565
Đã hoàn thành batch 5/1565
Đã hoàn thành batch 6/1565
Đã hoàn thành batch 7/1565
Đã hoàn thành batch 8/1565
Đã hoàn thành batch 9/1565
Đã hoàn thành batch 10/1565
Đã hoàn thành batch 11/1565
Đã hoàn thành batch 12/1565
Đã hoàn thành batch 13/1565
Đã hoàn thành batch 14/1565
Đã hoàn thành batch 15/1565
Đã hoàn thành batch 16/1565
Đã hoàn thành batch 17/1565
Đã hoà

  return op(a, b)


Processed test file saved to /kaggle/working/2020-04/fold_5/merged_test.csv
Processed train saved to /kaggle/working/2020-04/fold_5/processed_train.csv
Processed val saved to /kaggle/working/2020-04/fold_5/processed_val.csv

Processing month: 2020-10

Processing 2020-10 - fold_1
Processing /kaggle/input/dataset-k-fold/2020-10/fold_1/merged_train.csv and /kaggle/input/dataset-k-fold/2020-10/fold_1/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 57571, Số điểm cần nội suy: 8669
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 174 batch...
Đã hoàn thành batch 1/174
Đã hoàn thành batch 2/174
Đã hoàn thành batch 3/174
Đã hoàn thành batch 4/174
Đã hoàn thành batch 5/174
Đã hoàn thành batch 6/174
Đã hoàn thành batch 7/174
Đã hoàn thành batch 8/174
Đã hoàn thành batch 9/174
Đã hoàn thành batch 10/174
Đã hoàn thành batch 11/174
Đã hoàn thành batch 12/174
Đã hoàn thành batch 13/174
Đã hoàn thành batch 14/174
Đã hoàn thành batch 15/174
Đã hoàn thành batch 16/174
Đã hoàn thành batch 17/174
Đã hoàn thành batch 18/174
Đã hoàn thành batch 19/174
Đã hoàn thành batch 20/174
Đã hoàn thành batch 21/174
Đã hoàn thành batch 22/174
Đã hoàn thành batch 23/174
Đã hoàn thành batch 24/174
Đã hoàn thành batch 25/174
Đã hoàn thành batch 26/174
Đã hoàn thành batch 27/174
Đã hoàn thành batch 28/174
Đã hoàn thành batch 29/174
Đã hoàn thành batch 30/174
Đã hoàn thành batch 31/174
Đã hoàn thành batch 32/174
Đã hoàn t

  return op(a, b)


Processed test file saved to /kaggle/working/2020-10/fold_1/merged_test.csv
Processed train saved to /kaggle/working/2020-10/fold_1/processed_train.csv
Processed val saved to /kaggle/working/2020-10/fold_1/processed_val.csv

Processing 2020-10 - fold_2
Processing /kaggle/input/dataset-k-fold/2020-10/fold_2/merged_train.csv and /kaggle/input/dataset-k-fold/2020-10/fold_2/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 86140, Số điểm cần nội suy: 13220
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 265 batch...
Đã hoàn thành batch 1/265
Đã hoàn thành batch 2/265
Đã hoàn thành batch 3/265
Đã hoàn thành batch 4/265
Đã hoàn thành batch 5/265
Đã hoàn thành batch 6/265
Đã hoàn thành batch 7/265
Đã hoàn thành batch 8/265
Đã hoàn thành batch 9/265
Đã hoàn thành batch 10/265
Đã hoàn thành batch 11/265
Đã hoàn thành batch 12/265
Đã hoàn thành batch 13/265
Đã hoàn thành batch 14/265
Đã hoàn thành batch 15/265
Đã hoàn thành batch 16/265
Đã hoàn thành batch 17/265
Đã hoàn thành batch 18/265
Đã hoàn thành batch 19/265
Đã hoàn thành batch 20/265
Đã hoàn thành batch 21/265
Đã hoàn thành batch 22/265
Đã hoàn thành batch 23/265
Đã hoàn thành batch 24/265
Đã hoàn thành batch 25/265
Đã hoàn thành batch 26/265
Đã hoàn thành batch 27/265
Đã hoàn thành batch 28/265
Đã hoàn thành batch 29/265
Đã hoàn thành batch 30/265
Đã hoàn thành batch 31/265
Đã hoàn thành batch 32/265
Đã hoàn 

  return op(a, b)


Processed test file saved to /kaggle/working/2020-10/fold_2/merged_test.csv
Processed train saved to /kaggle/working/2020-10/fold_2/processed_train.csv
Processed val saved to /kaggle/working/2020-10/fold_2/processed_val.csv

Processing 2020-10 - fold_3
Processing /kaggle/input/dataset-k-fold/2020-10/fold_3/merged_train.csv and /kaggle/input/dataset-k-fold/2020-10/fold_3/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 114434, Số điểm cần nội suy: 18046
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 361 batch...
Đã hoàn thành batch 1/361
Đã hoàn thành batch 2/361
Đã hoàn thành batch 3/361
Đã hoàn thành batch 4/361
Đã hoàn thành batch 5/361
Đã hoàn thành batch 6/361
Đã hoàn thành batch 7/361
Đã hoàn thành batch 8/361
Đã hoàn thành batch 9/361
Đã hoàn thành batch 10/361
Đã hoàn thành batch 11/361
Đã hoàn thành batch 12/361
Đã hoàn thành batch 13/361
Đã hoàn thành batch 14/361
Đã hoàn thành batch 15/361
Đã hoàn thành batch 16/361
Đã hoàn thành batch 17/361
Đã hoàn thành batch 18/361
Đã hoàn thành batch 19/361
Đã hoàn thành batch 20/361
Đã hoàn thành batch 21/361
Đã hoàn thành batch 22/361
Đã hoàn thành batch 23/361
Đã hoàn thành batch 24/361
Đã hoàn thành batch 25/361
Đã hoàn thành batch 26/361
Đã hoàn thành batch 27/361
Đã hoàn thành batch 28/361
Đã hoàn thành batch 29/361
Đã hoàn thành batch 30/361
Đã hoàn thành batch 31/361
Đã hoàn thành batch 32/361
Đã hoàn

  return op(a, b)


Processed test file saved to /kaggle/working/2020-10/fold_3/merged_test.csv
Processed train saved to /kaggle/working/2020-10/fold_3/processed_train.csv
Processed val saved to /kaggle/working/2020-10/fold_3/processed_val.csv

Processing 2020-10 - fold_4
Processing /kaggle/input/dataset-k-fold/2020-10/fold_4/merged_train.csv and /kaggle/input/dataset-k-fold/2020-10/fold_4/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 142895, Số điểm cần nội suy: 22705
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 455 batch...
Đã hoàn thành batch 1/455
Đã hoàn thành batch 2/455
Đã hoàn thành batch 3/455
Đã hoàn thành batch 4/455
Đã hoàn thành batch 5/455
Đã hoàn thành batch 6/455
Đã hoàn thành batch 7/455
Đã hoàn thành batch 8/455
Đã hoàn thành batch 9/455
Đã hoàn thành batch 10/455
Đã hoàn thành batch 11/455
Đã hoàn thành batch 12/455
Đã hoàn thành batch 13/455
Đã hoàn thành batch 14/455
Đã hoàn thành batch 15/455
Đã hoàn thành batch 16/455
Đã hoàn thành batch 17/455
Đã hoàn thành batch 18/455
Đã hoàn thành batch 19/455
Đã hoàn thành batch 20/455
Đã hoàn thành batch 21/455
Đã hoàn thành batch 22/455
Đã hoàn thành batch 23/455
Đã hoàn thành batch 24/455
Đã hoàn thành batch 25/455
Đã hoàn thành batch 26/455
Đã hoàn thành batch 27/455
Đã hoàn thành batch 28/455
Đã hoàn thành batch 29/455
Đã hoàn thành batch 30/455
Đã hoàn thành batch 31/455
Đã hoàn thành batch 32/455
Đã hoàn

  return op(a, b)


Processed test file saved to /kaggle/working/2020-10/fold_4/merged_test.csv
Processed train saved to /kaggle/working/2020-10/fold_4/processed_train.csv
Processed val saved to /kaggle/working/2020-10/fold_4/processed_val.csv

Processing 2020-10 - fold_5
Processing /kaggle/input/dataset-k-fold/2020-10/fold_5/merged_train.csv and /kaggle/input/dataset-k-fold/2020-10/fold_5/merged_val.csv


  return op(a, b)
  return op(a, b)


Số điểm đã biết: 171178, Số điểm cần nội suy: 27542
Lấy mẫu 400 điểm đã biết để tăng hiệu suất
Thực hiện nội suy Kriging với 551 batch...
Đã hoàn thành batch 1/551
Đã hoàn thành batch 2/551
Đã hoàn thành batch 3/551
Đã hoàn thành batch 4/551
Đã hoàn thành batch 5/551
Đã hoàn thành batch 6/551
Đã hoàn thành batch 7/551
Đã hoàn thành batch 8/551
Đã hoàn thành batch 9/551
Đã hoàn thành batch 10/551
Đã hoàn thành batch 11/551
Đã hoàn thành batch 12/551
Đã hoàn thành batch 13/551
Đã hoàn thành batch 14/551
Đã hoàn thành batch 15/551
Đã hoàn thành batch 16/551
Đã hoàn thành batch 17/551
Đã hoàn thành batch 18/551
Đã hoàn thành batch 19/551
Đã hoàn thành batch 20/551
Đã hoàn thành batch 21/551
Đã hoàn thành batch 22/551
Đã hoàn thành batch 23/551
Đã hoàn thành batch 24/551
Đã hoàn thành batch 25/551
Đã hoàn thành batch 26/551
Đã hoàn thành batch 27/551
Đã hoàn thành batch 28/551
Đã hoàn thành batch 29/551
Đã hoàn thành batch 30/551
Đã hoàn thành batch 31/551
Đã hoàn thành batch 32/551
Đã hoàn

  return op(a, b)


Processed test file saved to /kaggle/working/2020-10/fold_5/merged_test.csv
Processed train saved to /kaggle/working/2020-10/fold_5/processed_train.csv
Processed val saved to /kaggle/working/2020-10/fold_5/processed_val.csv
