# Setup & Import

In [1]:
# %% 📊 Esperimento: effetto della lunghezza max sulle dimensioni della PTA e del DFA ridotto

import sys
from pathlib import Path
sys.path.append(str(Path("../src").resolve()))

from dfa_generator import dfa_parity, dfa_contains, compose, simulate_samples
from pta_builder import PTA
from reduction import reduce  # <-- fix qui




# Elaborate

In [None]:
# Costruzione DFA target noto
symbol = "a"
dfa1 = dfa_parity(symbol, 2)
dfa2 = dfa_contains("bb", {"a", "b"})
product = compose([dfa1, dfa2], "intersection")
print(product)

# Parametri dell'esperimento
lengths = [3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000]
n_pos = 100
n_neg = 100

print("\nEsperimento: effetto di max_len sulla riduzione DFA")
print("---------------------------------------------------------------")
print(f"{'max_len':>8} | {'|PTA|':>6} | {'|DFA ridotto|':>13} | {'Riduzione (%)':>14}")
print("-" * 63)

for L in lengths:
    S_pos, S_neg = simulate_samples(
        product,
        max_len=L,
        n_positive=n_pos,
        n_negative=n_neg,
        seed=42,
    )
    pta = PTA.build(S_pos, S_neg)
    reduced = reduce(pta)
    ratio = len(reduced.states) / len(pta.states) * 100  # in percentuale

    print(f"{L:8d} | {len(pta.states):6d} | {len(reduced.states):13d} | {ratio:13.2f}%")

# Nota:
# - Aumentare max_len esplora porzioni più profonde del linguaggio target.
# - Il numero di stati della PTA può crescere velocemente.
# - La riduzione può o meno essere efficace a seconda della coerenza e ridondanza nei campioni.
# - Il rateo (%) indica quanto è "compressa" la PTA nel DFA finale.

In [None]:
# 2 test


In [10]:
# %% 📊 Esperimento: effetto della lunghezza max sulle dimensioni della PTA e del DFA ridotto

# Costruzione DFA target noto
symbol = "a"
dfa1 = dfa_parity(symbol, 2)
dfa2 = dfa_contains("bb", {"a", "b"})
product = compose([dfa1, dfa2], "intersection")
print(product)

# %% 📊 Esperimento: effetto del numero di campioni su PTA e DFA

n_lengths = 20
sizes = [10, 50, 100, 200, 500, 1000]
max_len = n_lengths

print("Esperimento: effetto di n_positive/n_negative sulla riduzione DFA")
print("---------------------------------------------------------------------")
print(f"{'campioni':>10} | {'|PTA|':>6} | {'|DFA ridotto|':>13} | {'Compressione (%)':>17}")
print("-" * 65)

for n in sizes:
    S_pos, S_neg = simulate_samples(
        product,
        max_len=max_len,
        n_positive=n,
        n_negative=n,
        seed=42,
    )
    pta = PTA.build(S_pos, S_neg)
    reduced = reduce(pta)
    compression = (1 - len(reduced.states) / len(pta.states)) * 100
    print(f"{n:10d} | {len(pta.states):6d} | {len(reduced.states):13d} | {compression:17.2f}%")

# Nota:
# - Questo esperimento fissa max_len e varia la quantità di dati.
# - Aumentare il numero di campioni dovrebbe aumentare la copertura del linguaggio
#   e favorire una riduzione più efficace (maggiore compressione).


<ProductDFA: |Q|=6, |Σ|=2>
Esperimento: effetto di n_positive/n_negative sulla riduzione DFA
---------------------------------------------------------------------
  campioni |  |PTA| | |DFA ridotto| |  Compressione (%)
-----------------------------------------------------------------
        10 |    154 |            66 |             57.14%
        50 |    613 |           167 |             72.76%
       100 |   1174 |           288 |             75.47%
       200 |   2215 |           497 |             77.56%
       500 |   5001 |           950 |             81.00%
[WARN] solo 683 positivi e 1000 negativi trovati in 10000 tentativi (max_len=20).
      1000 |   7833 |          1215 |             84.49%
