In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from scipy.ndimage import label
from tqdm import tqdm
import matplotlib.pyplot as plt
import os
import json
from collections import defaultdict
from matplotlib.backends.backend_pdf import PdfPages

MAX_STEPS = 10

def generate_percolation_lattice(size, p):
    return np.random.choice([0, 1], (size, size), p=[1-p, p]).astype(np.uint8)

def check_percolation(lattice):
    labeled, _ = label(lattice)
    top = set(labeled[0]) - {0}
    bottom = set(labeled[-1]) - {0}
    left = set(labeled[:,0]) - {0}
    right = set(labeled[:,-1]) - {0}
    return float(bool(top & bottom) or bool(left & right))

def first_coarse_graining(binary_lattice, dim):
    """Average non-overlapping dim×dim blocks."""
    t = torch.tensor(binary_lattice, dtype=torch.float32).unsqueeze(0).unsqueeze(0)
    patches = F.unfold(t, kernel_size=dim, stride=dim)             # [1, dim*dim, num_patches]
    patches = patches.permute(0, 2, 1)                             # [1, num_patches, dim*dim]
    coarse_vals = patches.mean(dim=2)                             # [1, num_patches]
    H, W = binary_lattice.shape
    new_h, new_w = H // dim, W // dim
    return coarse_vals.view(1, 1, new_h, new_w).squeeze(0)        # [1, new_h, new_w]

class PercolationModel(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.dim = dim
        self.rule = nn.Sequential(
            nn.Linear(dim * dim, 64),
            nn.ReLU(),
            nn.Linear(64, 1),
            nn.Sigmoid()
        )
    
    def forward(self, x, max_steps=MAX_STEPS):
        b, c, H, W = x.shape
        for _ in range(max_steps):
            if H < self.dim or W < self.dim:
                break
            patches = F.unfold(x, kernel_size=self.dim, stride=self.dim)  # [b, dim*dim, np]
            patches = patches.permute(0, 2, 1).contiguous()               # [b, np, dim*dim]
            out = self.rule(patches.view(-1, self.dim*self.dim))          # [b*np, 1]
            new_h, new_w = H // self.dim, W // self.dim
            x = out.view(b, 1, new_h, new_w)
            _, _, H, W = x.shape
        return x.squeeze(1).view(b, -1)  # returns shape [b, new_h*new_w] or [b] if fully reduced


def prepare_dataset(N, sizes):
    data = []
    for _ in tqdm(range(N), desc="Generating data"):
        p = np.random.uniform(0.1, 0.9)
        size = np.random.choice(sizes)
        L = generate_percolation_lattice(size, p)
        data.append((L, check_percolation(L)))
    return data


def train_epoch(model, device, data, batch_size, opt, crit, dim):
    model.train()
    total_loss = 0.0
    # Process in batches, then split into size groups
    for i in tqdm(range(0, len(data), batch_size), desc="Training"):
        batch = data[i:i+batch_size]
        processed = []
        # Apply first_coarse_graining and get sizes
        for x, y in batch:
            cg_lattice = first_coarse_graining(x, dim)  # [1, H', W']
            h, w = cg_lattice.shape[-2], cg_lattice.shape[-1]
            processed.append((cg_lattice, y, (h, w)))
        
        # Group by size
        groups = {}
        for cg, y, size in processed:
            if size not in groups:
                groups[size] = []
            groups[size].append((cg, y))
        
        # Process each group
        group_loss = 0.0
        for size_key, group in groups.items():
            lattices = [item[0] for item in group]
            labels = [item[1] for item in group]
            inputs = torch.stack(lattices).to(device)  # [B, 1, H, W]
            targets = torch.tensor(labels, dtype=torch.float32, device=device)
            
            opt.zero_grad()
            outputs = model(inputs)  # [B, 1]
            loss = crit(outputs.view(-1), targets)
            loss.backward()
            opt.step()
            group_loss += loss.item() * len(group)
        
        total_loss += group_loss
    
    return total_loss / len(data)


def test_systems(model, dim, power, device='cpu',
                              num_tests=50, system_size='standard',
                              p_range=(0,1), verbose=True):
    """
    For each test:
      1) generate a raw DIM^size_power × DIM^size_power lattice
      2) compute true percolation label on that raw lattice
      3) manually coarse-grain once (patch size = dim)
      4) feed the result into model (which will do further recursive steps)
    """
    model.to(device).eval()

    # Determine the exponent for lattice_size
    size_power = {'3^2': power-1, '3^3': power, '3^4': power+1, '3^5': power+2, '3^6': power+3, '3^7': power+4}[system_size]
    L = dim ** size_power

    results = []
    for _ in tqdm(range(num_tests), desc=f"Testing {L}×{L}"):
        # 1) Raw lattice + label
        p   = np.random.uniform(*p_range)
        raw = generate_percolation_lattice(L, p)
        lbl = check_percolation(raw)

        # 2) Manual first coarse-graining
        coarse = first_coarse_graining(raw, dim)   # tensor shape [1, L/dim, L/dim]

        # 3) Prepare input for the model
        inp = coarse.unsqueeze(0).to(device)       # [1, 1, L/dim, L/dim]

        # 4) Get network prediction
        with torch.no_grad():
            # Let the model do its remaining recursion as usual
            # (the `max_steps` is large enough that it will recurse until <dim)
            out = model(inp).view(-1).item()

        results.append((raw, lbl, out))

    # Compute accuracy at 0.5 threshold
    acc = sum((pred > 0.5) == lbl for _, lbl, pred in results) / num_tests
    pos = [pred for _, lbl, pred in results if lbl==1]
    neg = [pred for _, lbl, pred in results if lbl==0]
    
    metrics = {
        'accuracy': acc,
        'avg_pred_perc': np.mean(pos) if pos else 0,
        'avg_pred_non_perc': np.mean(neg) if neg else 0
    }
    
    if verbose:
        print(f"\nAfter manual first coarse-grain -> NN cascade on {L}×{L}:")
        print(f" Accuracy        : {acc:.2%}")
        print(f" Avg pred | Perc     : {metrics['avg_pred_perc']:.3f}")
        print(f" Avg pred | Non-Perc : {metrics['avg_pred_non_perc']:.3f}")

    return metrics


def visualize_rule(model, dim, device='cpu', num_samples=1000):
    """Visualize the learned rule for dim×dim patches with critical points"""
    import matplotlib.pyplot as plt
    from scipy.ndimage import gaussian_filter1d  # For smoothing if needed
    
    p_values = np.linspace(0, 1, 100)
    model.eval()
    mean_outputs = []

    with torch.no_grad():
        for p in p_values:
            inputs = torch.full((num_samples, dim*dim), p, 
                               dtype=torch.float32, device=device)
            outputs = model.rule(inputs).cpu().numpy()
            mean_outputs.append(outputs.mean())
    
    # Calculate derivatives to find concavity change
    first_deriv = np.gradient(mean_outputs)
    second_deriv = np.gradient(first_deriv)
    
    # Find point where second derivative crosses zero (maximum curvature)
    zero_crossings = np.where(np.diff(np.sign(second_deriv)))[0]
    
    if len(zero_crossings) > 0:
        crit_idx = zero_crossings[np.argmax(p_values[zero_crossings])]  
        p_c_model = p_values[crit_idx]
    else:
        p_c_model = p_values[np.argmin(np.abs(second_deriv))]
    
    return p_values, mean_outputs, p_c_model


def run_experiment(dim, power, num_runs=10, device='cpu'):
    """Run multiple experiments for a given dimension"""
    all_rule_curves = []
    all_test_results = defaultdict(list)
    all_pc_values = []
    
    for run_idx in range(num_runs):
        print(f"\n{'='*40}")
        print(f"Run {run_idx+1}/{num_runs} for DIM={dim}")
        print(f"{'='*40}")
        
        # Configuration
        sizes = [dim**2, dim**3, dim**4]
        
        # Generate mixed-size training data
        train_data = prepare_dataset(1_000, sizes)
        
        # Initialize model
        model = PercolationModel(dim).to(device)
        opt = optim.Adam(model.parameters(), lr=1e-3)
        crit = nn.BCELoss()
        
        # Training loop
        for epoch in range(1, 6):
            loss = train_epoch(model, device, train_data, 10, opt, crit, dim)
            print(f"Epoch {epoch} — Loss: {loss:.4f}")
        
        # Test configurations
        test_configs = [
            {'system_size': '3^2', 'num_tests': 100, 'p_range': (0.1, 0.9)},
            {'system_size': '3^3', 'num_tests': 100, 'p_range': (0.1, 0.9)},
            {'system_size': '3^4', 'num_tests': 100, 'p_range': (0.1, 0.9)},
            {'system_size': '3^5', 'num_tests': 100, 'p_range': (0.1, 0.9)},
            {'system_size': '3^6', 'num_tests': 50, 'p_range': (0.1, 0.9)},
            {'system_size': '3^7', 'num_tests': 10, 'p_range': (0.1, 0.9)}
            {'system_size': '3^3', 'num_tests': 200, 'p_range': (0.5, 0.7)}
        ]
        
        # Run tests
        for config in test_configs:
            key = f"{config['system_size']}_{config['p_range'][0]}-{config['p_range'][1]}"
            metrics = test_systems(
                model, dim, power, device,
                num_tests=config['num_tests'],
                system_size=config['system_size'],
                p_range=config['p_range'],
                verbose=False
            )
            all_test_results[key].append(metrics)
        
        # Visualize rule and save curve
        p_vals, outputs, p_c_model = visualize_rule(model, dim, device)
        all_rule_curves.append((p_vals, outputs))
        all_pc_values.append(p_c_model)
        
        # Clean up to save memory
        del model, opt, crit, train_data
        torch.cuda.empty_cache()
    
    return all_rule_curves, all_test_results, all_pc_values


def save_consolidated_results(results_dict):
    """Save consolidated results for both dimensions in a single PDF and text file"""
    # Create single PDF with rule curves for both dimensions
    with PdfPages("consolidated_results.pdf") as pdf:
        for dim, results in results_dict.items():
            all_rule_curves, all_test_results, all_pc_values = results
            plt.figure(figsize=(10, 6))
            # Plot all runs for this dimension
            for i, (p_vals, outputs) in enumerate(all_rule_curves):
                plt.plot(p_vals, outputs, alpha=0.5, color='blue')
                # Compute intersection approximate
                diffs = np.abs(np.array(outputs) - p_vals)
                idx_min = np.argmin(diffs)
                p_intersect = p_vals[idx_min]
                plt.scatter([p_intersect], [p_intersect], color='black')

            # Plot diagonal y = x
            plt.plot([0, 1], [0, 1], color='black')
            
            # Add legend entry for average critical point
            avg_pc = np.mean(all_pc_values)
            plt.plot([], [], ' ', label=f'Avg Model $p_c$ ({avg_pc:.3f})')

            plt.xlabel('Input Patch Mean ($p$)')
            plt.ylabel('Model Output')
            plt.title(f'Learned Coarse-Graining Rules (DIM={dim}, {len(all_rule_curves)} runs)')
            plt.legend()
            plt.grid(True, alpha=0.3)
            pdf.savefig(bbox_inches='tight')
            plt.close()
    
    # Create single UTF-8 text file with all results
    with open("consolidated_results.txt", "w", encoding="utf-8") as f:
        for dim, results in results_dict.items():
            all_rule_curves, all_test_results, all_pc_values = results
            # Write p_c values
            f.write(f"{'='*40}\n")
            f.write(f"Critical Point Analysis (DIM={dim})\n")
            f.write(f"{'='*40}\n\n")
            f.write("p_c values from each run:\n")
            for i, pc in enumerate(all_pc_values):
                f.write(f"Run {i+1}: {pc:.6f}\n")
            
            f.write(f"\nAverage p_c: {np.mean(all_pc_values):.6f}\n")
            f.write(f"Standard deviation: {np.std(all_pc_values):.6f}\n\n")
            
            # Write test results
            f.write(f"{'='*40}\n")
            f.write(f"Test Performance Metrics (DIM={dim})\n")
            f.write(f"{'='*40}\n\n")
            
            for config, results_list in all_test_results.items():
                # Parse configuration details
                parts = config.split('_')
                system_size = parts[0]
                p_range = parts[1]
                
                # Extract metrics
                accuracies = [r['accuracy'] for r in results_list]
                avg_perc = [r['avg_pred_perc'] for r in results_list]
                avg_non_perc = [r['avg_pred_non_perc'] for r in results_list]
                
                # Write header
                f.write(f"System: {system_size}, p-range: {p_range}\n")
                f.write("-"*50 + "\n")
                
                # Write detailed run data
                f.write("Run | Accuracy | Avg Perc | Avg Non-Perc\n")
                f.write("----|----------|----------|------------\n")
                for i in range(len(results_list)):
                    f.write(f"{i+1:3d} | {accuracies[i]:.4f} | {avg_perc[i]:.4f} | {avg_non_perc[i]:.4f}\n")
                
                # Write summary statistics
                f.write("\nSummary Statistics:\n")
                f.write(f"Accuracy: {np.mean(accuracies):.4f} ± {np.std(accuracies):.4f}\n")
                f.write(f"Avg Perc: {np.mean(avg_perc):.4f} ± {np.std(avg_perc):.4f}\n")
                f.write(f"Avg Non-Perc: {np.mean(avg_non_perc):.4f} ± {np.std(avg_non_perc):.4f}\n")
                f.write("="*50 + "\n\n")
            f.write("\n\n")  # Space between dimensions


def main():
    DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    POWER = 3
    
    # Collect all results in a dictionary
    results_dict = {}
    
    print("\n\n" + "="*50)
    print("STARTING EXPERIMENTS FOR DIM=3")
    print("="*50)
    all_rule_curves_3, all_test_results_3, all_pc_values_3 = run_experiment(
        dim=3, power=POWER, num_runs=10, device=DEVICE
    )
    results_dict[3] = (all_rule_curves_3, all_test_results_3, all_pc_values_3)
    
    print("\n\n" + "="*50)
    print("STARTING EXPERIMENTS FOR DIM=4")
    print("="*50)
    all_rule_curves_4, all_test_results_4, all_pc_values_4 = run_experiment(
        dim=4, power=POWER, num_runs=10, device=DEVICE
    )
    results_dict[4] = (all_rule_curves_4, all_test_results_4, all_pc_values_4)
    
    # Save all results in consolidated files
    save_consolidated_results(results_dict)

if __name__ == "__main__":
    main()




STARTING EXPERIMENTS FOR DIM=3

Run 1/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 2063.11it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 120.66it/s]


Epoch 1 — Loss: 0.6634


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 154.20it/s]


Epoch 2 — Loss: 0.4675


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 152.64it/s]


Epoch 3 — Loss: 0.2064


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 154.06it/s]


Epoch 4 — Loss: 0.1468


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 148.42it/s]


Epoch 5 — Loss: 0.1302


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1705.49it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1328.17it/s]
Testing 81×81: 100%|████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 800.89it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 239.88it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1312.63it/s]



Run 2/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 3794.95it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 191.03it/s]


Epoch 1 — Loss: 0.6666


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 202.24it/s]


Epoch 2 — Loss: 0.4435


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 213.74it/s]


Epoch 3 — Loss: 0.1829


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 207.90it/s]


Epoch 4 — Loss: 0.1362


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 215.15it/s]


Epoch 5 — Loss: 0.1218


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2469.26it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1385.76it/s]
Testing 81×81: 100%|████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 865.81it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 313.83it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1772.87it/s]



Run 3/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 4762.49it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 192.55it/s]


Epoch 1 — Loss: 0.6437


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 222.74it/s]


Epoch 2 — Loss: 0.3766


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 210.02it/s]


Epoch 3 — Loss: 0.1858


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 211.05it/s]


Epoch 4 — Loss: 0.1526


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 220.56it/s]


Epoch 5 — Loss: 0.1414


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 3263.85it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1588.56it/s]
Testing 81×81: 100%|████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 961.56it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 335.52it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 2132.47it/s]



Run 4/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 4760.43it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 198.74it/s]


Epoch 1 — Loss: 0.6480


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 200.61it/s]


Epoch 2 — Loss: 0.4088


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 207.34it/s]


Epoch 3 — Loss: 0.1997


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 206.79it/s]


Epoch 4 — Loss: 0.1555


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 215.10it/s]


Epoch 5 — Loss: 0.1382


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 3179.84it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2133.41it/s]
Testing 81×81: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1066.66it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 326.43it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1826.74it/s]



Run 5/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 5003.22it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 215.92it/s]


Epoch 1 — Loss: 0.6366


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 216.56it/s]


Epoch 2 — Loss: 0.3552


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 214.41it/s]


Epoch 3 — Loss: 0.2142


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 214.12it/s]


Epoch 4 — Loss: 0.1821


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 208.58it/s]


Epoch 5 — Loss: 0.1666


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2000.72it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1637.80it/s]
Testing 81×81: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1123.06it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 333.17it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1625.37it/s]



Run 6/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 5142.15it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 214.02it/s]


Epoch 1 — Loss: 0.6636


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 223.05it/s]


Epoch 2 — Loss: 0.5242


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 208.48it/s]


Epoch 3 — Loss: 0.2603


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 215.42it/s]


Epoch 4 — Loss: 0.1825


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 215.02it/s]


Epoch 5 — Loss: 0.1595


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2083.63it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1557.80it/s]
Testing 81×81: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1041.66it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 312.17it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1775.72it/s]



Run 7/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 4831.22it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 192.90it/s]


Epoch 1 — Loss: 0.6676


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 201.90it/s]


Epoch 2 — Loss: 0.4836


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 203.06it/s]


Epoch 3 — Loss: 0.2287


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 200.94it/s]


Epoch 4 — Loss: 0.1660


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 210.89it/s]


Epoch 5 — Loss: 0.1457


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2119.01it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2020.72it/s]
Testing 81×81: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1097.14it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 340.90it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1824.21it/s]



Run 8/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 4524.29it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 209.19it/s]


Epoch 1 — Loss: 0.6904


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 206.50it/s]


Epoch 2 — Loss: 0.6273


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 185.51it/s]


Epoch 3 — Loss: 0.3447


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 208.90it/s]


Epoch 4 — Loss: 0.2031


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 210.47it/s]


Epoch 5 — Loss: 0.1750


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 3404.52it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1473.92it/s]
Testing 81×81: 100%|████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 972.16it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 316.93it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1496.19it/s]



Run 9/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 4315.93it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 181.17it/s]


Epoch 1 — Loss: 0.6783


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 177.12it/s]


Epoch 2 — Loss: 0.5524


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 204.49it/s]


Epoch 3 — Loss: 0.2507


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 196.76it/s]


Epoch 4 — Loss: 0.1600


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 211.01it/s]


Epoch 5 — Loss: 0.1371


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1521.54it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1531.65it/s]
Testing 81×81: 100%|████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 956.39it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 336.25it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1761.15it/s]



Run 10/10 for DIM=3


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 5093.31it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 207.26it/s]


Epoch 1 — Loss: 0.6543


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 206.37it/s]


Epoch 2 — Loss: 0.4021


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 199.41it/s]


Epoch 3 — Loss: 0.2026


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 198.88it/s]


Epoch 4 — Loss: 0.1622


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 203.90it/s]


Epoch 5 — Loss: 0.1502


Testing 9×9: 100%|█████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2444.76it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2338.17it/s]
Testing 81×81: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1066.66it/s]
Testing 243×243: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 326.81it/s]
Testing 27×27: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1799.43it/s]




STARTING EXPERIMENTS FOR DIM=4

Run 1/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1200.73it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 179.39it/s]


Epoch 1 — Loss: 0.6873


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 179.29it/s]


Epoch 2 — Loss: 0.6285


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 188.52it/s]


Epoch 3 — Loss: 0.3662


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 173.08it/s]


Epoch 4 — Loss: 0.1927


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 182.79it/s]


Epoch 5 — Loss: 0.1540


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2001.18it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1244.22it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 319.53it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 22.39it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1188.59it/s]



Run 2/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1139.59it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 176.13it/s]


Epoch 1 — Loss: 0.6802


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 174.02it/s]


Epoch 2 — Loss: 0.5889


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 176.43it/s]


Epoch 3 — Loss: 0.2991


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 176.63it/s]


Epoch 4 — Loss: 0.1997


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 168.74it/s]


Epoch 5 — Loss: 0.1771


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2546.71it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1670.71it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 323.05it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 23.80it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1390.10it/s]



Run 3/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1293.11it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 153.09it/s]


Epoch 1 — Loss: 0.6793


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 177.93it/s]


Epoch 2 — Loss: 0.5896


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 168.94it/s]


Epoch 3 — Loss: 0.2918


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 172.58it/s]


Epoch 4 — Loss: 0.1865


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 165.93it/s]


Epoch 5 — Loss: 0.1621


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 3163.39it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1600.02it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 317.25it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 24.61it/s]
Testing 64×64: 100%|████████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 799.61it/s]



Run 4/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1186.53it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 169.38it/s]


Epoch 1 — Loss: 0.6634


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 178.42it/s]


Epoch 2 — Loss: 0.3853


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 180.42it/s]


Epoch 3 — Loss: 0.1747


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 180.98it/s]


Epoch 4 — Loss: 0.1349


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 182.26it/s]


Epoch 5 — Loss: 0.1192


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2050.36it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1800.79it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 335.05it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 23.38it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1376.19it/s]



Run 5/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1204.13it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 169.22it/s]


Epoch 1 — Loss: 0.6849


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 178.85it/s]


Epoch 2 — Loss: 0.6303


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 168.53it/s]


Epoch 3 — Loss: 0.3820


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 170.91it/s]


Epoch 4 — Loss: 0.2044


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 181.19it/s]


Epoch 5 — Loss: 0.1665


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2500.29it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1388.93it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 341.93it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 24.08it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1283.08it/s]



Run 6/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1233.57it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 187.38it/s]


Epoch 1 — Loss: 0.6703


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 179.37it/s]


Epoch 2 — Loss: 0.5542


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 170.40it/s]


Epoch 3 — Loss: 0.2520


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 166.36it/s]


Epoch 4 — Loss: 0.1567


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 184.20it/s]


Epoch 5 — Loss: 0.1413


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2462.73it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1417.21it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 352.93it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 23.62it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1283.49it/s]



Run 7/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1312.87it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 177.88it/s]


Epoch 1 — Loss: 0.6712


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 193.89it/s]


Epoch 2 — Loss: 0.5205


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 184.74it/s]


Epoch 3 — Loss: 0.2437


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 176.77it/s]


Epoch 4 — Loss: 0.1657


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 182.43it/s]


Epoch 5 — Loss: 0.1454


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2355.61it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1514.97it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 340.68it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 24.31it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1023.46it/s]



Run 8/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1361.56it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 178.13it/s]


Epoch 1 — Loss: 0.6681


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 165.39it/s]


Epoch 2 — Loss: 0.4902


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 181.91it/s]


Epoch 3 — Loss: 0.2244


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 196.32it/s]


Epoch 4 — Loss: 0.1691


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 186.98it/s]


Epoch 5 — Loss: 0.1755


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2638.72it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1399.93it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 327.16it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:03<00:00, 25.02it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1385.52it/s]



Run 9/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1352.27it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 185.89it/s]


Epoch 1 — Loss: 0.6702


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 196.15it/s]


Epoch 2 — Loss: 0.4669


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 198.50it/s]


Epoch 3 — Loss: 0.2140


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 194.84it/s]


Epoch 4 — Loss: 0.1657


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 187.36it/s]


Epoch 5 — Loss: 0.1478


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2635.56it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1590.85it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 354.88it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:04<00:00, 24.94it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1322.20it/s]



Run 10/10 for DIM=4


Generating data: 100%|███████████████████████████████████████████████████████████| 1000/1000 [00:00<00:00, 1218.62it/s]
Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 167.38it/s]


Epoch 1 — Loss: 0.6620


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 184.64it/s]


Epoch 2 — Loss: 0.4720


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 183.93it/s]


Epoch 3 — Loss: 0.2218


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 187.80it/s]


Epoch 4 — Loss: 0.2011


Training: 100%|█████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 191.24it/s]


Epoch 5 — Loss: 0.1986


Testing 16×16: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 2133.41it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 1599.98it/s]
Testing 256×256: 100%|██████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 341.75it/s]
Testing 1024×1024: 100%|█████████████████████████████████████████████████████████████| 100/100 [00:03<00:00, 25.07it/s]
Testing 64×64: 100%|███████████████████████████████████████████████████████████████| 200/200 [00:00<00:00, 1408.24it/s]
