Skip to content

Rafforzare il bridge RAW -> CLEAN#15

Merged
Gabrymi93 merged 3 commits intomainfrom
feat/raw-clean-bridge
Mar 4, 2026
Merged

Rafforzare il bridge RAW -> CLEAN#15
Gabrymi93 merged 3 commits intomainfrom
feat/raw-clean-bridge

Conversation

@Gabrymi93
Copy link
Copy Markdown
Member

Sintesi

Questa PR rafforza il bridge RAW -> CLEAN nel toolkit senza cambiare il workflow canonico run all.

In particolare:

  • run raw scrive automaticamente un _profile/suggested_read.yml leggero e conservativo quando il file primario e profilabile
  • inspect paths espone i principali raw_hints
  • status espone una vista sintetica degli stessi raw_hints

L'obiettivo e rendere piu leggibile e riusabile il passaggio tra acquisizione RAW e definizione del clean.

Contesto collegato

Closes #13

Cosa cambia

  • sposta la scrittura di suggested_read.yml nel percorso canonico gia durante run raw
  • rende riusabile la logica di scrittura del file suggerito tra run raw e profile raw
  • aggiunge a inspect paths un blocco raw_hints con primary_output_file, path/presenza di suggested_read.yml e hints principali del profiling RAW
  • aggiunge a status una vista sintetica degli stessi raw_hints
  • aggiorna documentazione e test sul nuovo bridge raw -> clean

Impatto

Segna solo quello che si applica.

  • Documentazione o testi
  • Policy GitHub o template
  • Codice o automazioni
  • Pipeline dati o trasformazioni
  • Contenuti o metadati di dataset
  • Nessun impatto visibile per chi usa il repository

Verifica

Eseguito:

py -m pytest tests/test_cli_status.py tests/test_cli_inspect_paths.py tests/test_project_example_e2e.py tests/test_artifacts_policy.py tests/test_clean_duckdb_read.py -q

Esito:

  • 22 passed

Validato anche su casi reali locali durante il lavoro su dataset multi-anno e comunali.

Controlli

  • Questa PR e' nel repository giusto
  • Ho collegato issue o discussion quando serve
  • Ho verificato l'impatto su documentazione, codice o dati
  • Ho aggiornato solo quello che era davvero necessario

Note per chi revisiona

Punti da controllare con attenzione:

  • suggested_read.yml auto-generato da run raw deve restare conservativo e non cambiare in modo inatteso il comportamento del clean
  • il cambiamento non introduce un nuovo comando CLI e non allarga troppo il surface area
  • status e inspect leggono gli hints gia presenti negli artefatti RAW, senza aggiungere nuova logica di profiling

Commit locali sul branch:

  • 0f51999 Improve RAW to CLEAN bridge visibility
  • 94f62fa Show RAW hints in status output

@Gabrymi93 Gabrymi93 linked an issue Mar 4, 2026 that may be closed by this pull request
3 tasks
@Gabrymi93 Gabrymi93 merged commit f1e448d into main Mar 4, 2026
5 checks passed
@Gabrymi93 Gabrymi93 deleted the feat/raw-clean-bridge branch March 4, 2026 14:18
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

[Task] Rafforzare il bridge RAW -> CLEAN

1 participant