SM-SIP: Semantic & Multilingual Salient Information Prompting

Extension of the SigExt framework for controllable abstractive summarization with semantic supervision and multilingual support (Italian & English).

Project Structure

DNLPProj/
├── extension-italian-wits-semantic/     # Italian Wikipedia (WITS)
│   ├── training/
│   │   └── training-standard.ipynb      # SigExt model training
│   └── inference/
│       ├── inference-standard.ipynb     # Standard inference (16 configs)
│       ├── inference-prompt-enhanced.ipynb # Enhanced + LLM-as-Judge
│       ├── inference-wits-summarization.ipynb # Abstractive summarization pipeline
│       └── inference-evaluation.ipynb   # Bulk evaluation and metrics
├── extension-english-arxiv-semantic/    # English ArXiv
│   ├── training/
│   │   └── training-standard.ipynb      # SigExt model training (English)
│   └── inference/
│       ├── inference-standard.ipynb     # Standard ArXiv inference
│       ├── inference-prompt-enhanced.ipynb # Enhanced ArXiv prompts
│       └── inference-judge.ipynb        # Qwen-based G-Eval judge pipeline
├── results/                             # Consolidated results
│   ├── italian/                         # Metrics, plots, decoding
│   └── english/                         # metrics and JSON outputs
└── overleaf/                            # Research artifacts
    └── paper-draft.tex                  # Paper manuscript

Key Results

Italian WITS (100 samples)

Metric	Value
BERT Score	0.66
ROUGE-1	0.21
KIR	46%
Faithfulness	4.80 / 5.00
Abstraction	4.65 / 5.00

English ArXiv (100 samples)

Metric	Value
BERT Score	0.82
ROUGE-1	0.30
KIR	54%
Faithfulness	5.00 / 5.00
Abstraction	4.98 / 5.00

Key Findings

Universal Robustness: Unlike keyword-based methods (e.g., standard SIP) that struggle with morphologically rich languages like Italian, SM-SIP maintains high performance across languages.
Zero Hallucinations: Semantic supervision combined with grounded prompting achieves near-perfect faithfulness (5.0/5 on ArXiv, 4.8/5 on WITS).
Abstraction Quality: The LLM judge rates abstraction highly (4.6-5.0), confirming the model produces fluent, non-extractive summaries.

Models (HuggingFace)

Italian (WITS):

LookUpMark/sigext-wits-it-10k-060t ← Best performing
LookUpMark/sigext-wits-it-25k-060t
LookUpMark/sigext-wits-it-25k-065t
LookUpMark/sigext-wits-it-25k-070t

English (ArXiv):

LookUpMark/sigext-arxiv-en-1k-060t

Quick Start

# Italian WITS inference
jupyter notebook extension-italian-wits-semantic/inference/inference-prompt-enhanced.ipynb

# English ArXiv inference
jupyter notebook extension-english-arxiv-semantic/inference/inference-prompt-enhanced.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 116 Commits
docs		docs
extension-english-arxiv-semantic		extension-english-arxiv-semantic
extension-italian-wits-semantic		extension-italian-wits-semantic
overleaf		overleaf
results		results
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SM-SIP: Semantic & Multilingual Salient Information Prompting

Project Structure

Key Results

Italian WITS (100 samples)

English ArXiv (100 samples)

Key Findings

Models (HuggingFace)

Quick Start

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SM-SIP: Semantic & Multilingual Salient Information Prompting

Project Structure

Key Results

Italian WITS (100 samples)

English ArXiv (100 samples)

Key Findings

Models (HuggingFace)

Quick Start

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages