## Exemplo Sumarização extrativa

In [8]:
import spacy
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

# Carregar o modelo de spaCy em português
nlp = spacy.load("pt_core_news_sm")

# Exemplo de texto para sumarização
texto = """
Inteligência Artificial (IA) é um ramo da ciência da computação que se propõe a desenvolver dispositivos que simulem a capacidade humana de raciocinar, resolver problemas, tomar decisões, entre outras tarefas. 
A IA está presente em diversas áreas e permite que as máquinas aprendam com a experiência e realizem tarefas que requerem inteligência, como reconhecimento de voz, visão computacional e processamento de linguagem natural.
"""

# Pré-processamento do texto: dividir em frases
doc = nlp(texto)
frases = [sent.text for sent in doc.sents]

# Vetorização TF-IDF
vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(frases)

# Cálculo de similaridade média de cada frase com o restante
sim_scores = np.mean(cosine_similarity(tfidf_matrix, tfidf_matrix), axis=1)

# Selecionar frases mais importantes
num_frases = int(len(frases) * 0.5)  # Aqui definimos 50% das frases originais como resumo
indices_frases_importantes = np.argsort(sim_scores)[-num_frases:]

# Ordenar as frases selecionadas na ordem original
indices_frases_importantes.sort()
resumo_extrativo = " ".join([frases[i] for i in indices_frases_importantes])

print("Resumo Extrativo:")
print(resumo_extrativo)


Resumo Extrativo:
Inteligência Artificial (IA) é um ramo da ciência da computação que se propõe a desenvolver dispositivos que simulem a capacidade humana de raciocinar, resolver problemas, tomar decisões, entre outras tarefas. 



In [9]:
from rouge_score import rouge_scorer

# Inicializar o calculador ROUGE
scorer = rouge_scorer.RougeScorer(['rouge1', 'rouge2', 'rougeL'], use_stemmer=True)

# Calcular as pontuações ROUGE
scores = scorer.score(texto, resumo_extrativo)

# Exibir as pontuações ROUGE
print("Pontuações ROUGE:")
print(f"ROUGE-1: {scores['rouge1'].fmeasure:.2f}")
print(f"ROUGE-2: {scores['rouge2'].fmeasure:.2f}")
print(f"ROUGE-L: {scores['rougeL'].fmeasure:.2f}")


Pontuações ROUGE:
ROUGE-1: 0.65
ROUGE-2: 0.64
ROUGE-L: 0.65
