# üß† Curvature Bifurcation in Self-Consistent Neural Loss Landscapes

Authors: Moez Abdessattar, Antigravity AI Cohort  
Date: February 27, 2026  
Notebook: Complete Analysis & Reproducible Experiments

---

## üìñ Overview

This notebook contains the complete numerical analysis for the paper:

> "Curvature Bifurcation Induced by Self-Consistency Coupling in Neural Loss Landscapes"

We investigate what happens when neural networks try to model themselves through a self-consistency loss:

$$L(\theta) = L_{\text{task}}(\theta) + \alpha \| f_\theta(\theta) - \theta \|^2$$

### üî¨ Key Findings

1. The Hessian of the self-consistency term decomposes into:
   - A positive semidefinite linear part: $(J-I)^T(J-I)$
   - An indefinite nonlinear part: $\sum_i r_i \nabla^2 f_i$

2. At a critical weight $\alpha_c$, the minimum eigenvalue of the total Hessian crosses zero

3. This bifurcation is reproducible across dimensions ($n=50-200$) and random initializations

4. $\alpha_c = 1.85 \pm 0.11$ under our experimental conditions

### üß™ The -102 Story

This investigation began with an intriguing numerical observation: under certain heuristic scaling, the bifurcation appeared near a fixed value of -102. Systematic analysis revealed this was an artifact of scaling choices. The journey from illusory constant to rigorous theory is documented in Section 6.

## 1Ô∏è‚É£ Setup and Imports

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import os
from tqdm.notebook import tqdm
import warnings
warnings.filterwarnings('ignore')

# Create figures directory
os.makedirs('../figures', exist_ok=True)

# Set random seed for reproducibility
np.random.seed(456)

# Plot styling
plt.style.use('seaborn-v0_8-whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

## 2Ô∏è‚É£ Core Mathematical Functions

In [2]:
import sys
sys.path.append('../src')
from curvature_model import f, J, H_f, S, create_task_hessian

## 3Ô∏è‚É£ Experiment 1: Curvature Transition

In [3]:
from experiments import run_transition
alpha_c = run_transition(n=50, n_trials=20, savefig=True)

Running trials:   0%|                                               | 0/20 [00:00<?, ?it/s]

Running trials:   5%|‚ñà‚ñâ                                     | 1/20 [00:00<00:02,  6.65it/s]

Running trials:  10%|‚ñà‚ñà‚ñà‚ñâ                                   | 2/20 [00:00<00:02,  6.98it/s]

Running trials:  15%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                                 | 3/20 [00:00<00:02,  7.30it/s]

Running trials:  20%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                               | 4/20 [00:00<00:02,  7.53it/s]

Running trials:  25%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                             | 5/20 [00:00<00:01,  7.58it/s]

Running trials:  30%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã                           | 6/20 [00:00<00:01,  7.46it/s]

Running trials:  35%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã                         | 7/20 [00:00<00:01,  7.67it/s]

Running trials:  40%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                       | 8/20 [00:01<00:01,  7.98it/s]

Running trials:  45%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                     | 9/20 [00:01<00:01,  7.54it/s]

Running trials:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà                   | 10/20 [00:01<00:01,  7.60it/s]

Running trials:  55%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñâ                 | 11/20 [00:01<00:01,  7.29it/s]

Running trials:  60%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä               | 12/20 [00:01<00:01,  7.43it/s]

Running trials:  65%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã             | 13/20 [00:01<00:00,  7.41it/s]

Running trials:  70%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå           | 14/20 [00:01<00:00,  7.61it/s]

Running trials:  75%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå         | 15/20 [00:01<00:00,  7.69it/s]

Running trials:  80%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñç       | 16/20 [00:02<00:00,  7.88it/s]

Running trials:  85%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé     | 17/20 [00:02<00:00,  8.05it/s]

Running trials:  90%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñè   | 18/20 [00:02<00:00,  7.84it/s]

Running trials:  95%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà  | 19/20 [00:02<00:00,  7.81it/s]

Running trials: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 20/20 [00:02<00:00,  7.99it/s]

Running trials: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 20/20 [00:02<00:00,  7.65it/s]




## 4Ô∏è‚É£ Experiment 2: Distribution of Œ±_c

In [4]:
from experiments import run_histogram
run_histogram(n=50, n_trials=20, savefig=True)

Running trials:   0%|                                               | 0/20 [00:00<?, ?it/s]

Running trials:   5%|‚ñà‚ñâ                                     | 1/20 [00:00<00:02,  6.80it/s]

Running trials:  10%|‚ñà‚ñà‚ñà‚ñâ                                   | 2/20 [00:00<00:02,  7.69it/s]

Running trials:  15%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                                 | 3/20 [00:00<00:02,  7.92it/s]

Running trials:  20%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                               | 4/20 [00:00<00:02,  7.71it/s]

Running trials:  25%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                             | 5/20 [00:00<00:01,  7.91it/s]

Running trials:  30%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã                           | 6/20 [00:00<00:01,  8.05it/s]

Running trials:  35%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã                         | 7/20 [00:00<00:01,  8.15it/s]

Running trials:  40%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                       | 8/20 [00:00<00:01,  8.40it/s]

Running trials:  45%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                     | 9/20 [00:01<00:01,  8.15it/s]

Running trials:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà                   | 10/20 [00:01<00:01,  8.19it/s]

Running trials:  55%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñâ                 | 11/20 [00:01<00:01,  8.25it/s]

Running trials:  60%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä               | 12/20 [00:01<00:00,  8.03it/s]

Running trials:  65%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã             | 13/20 [00:01<00:00,  7.72it/s]

Running trials:  70%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå           | 14/20 [00:01<00:00,  7.70it/s]

Running trials:  75%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå         | 15/20 [00:01<00:00,  7.68it/s]

Running trials:  80%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñç       | 16/20 [00:02<00:00,  7.66it/s]

Running trials:  85%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé     | 17/20 [00:02<00:00,  7.60it/s]

Running trials:  90%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñè   | 18/20 [00:02<00:00,  7.80it/s]

Running trials:  95%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà  | 19/20 [00:02<00:00,  7.99it/s]

Running trials: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 20/20 [00:02<00:00,  8.04it/s]

Running trials: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 20/20 [00:02<00:00,  7.92it/s]




[np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0),
 np.float64(0.0)]

## 5Ô∏è‚É£ The -102 Illusion

In [5]:
from experiments import run_illusion
run_illusion(n=50, n_trials=10, savefig=True)

## üìä Summary of Results

The numerical evidence confirms that adding a self-consistency weight $\alpha$ beyond a critical threshold $\alpha_c \approx 1.85$ induces a curvature bifurcation, where the loss landscape develops negative eigenvalues (saddle points). This reveals a fundamental stability limit for self-referential neural systems.