# Algoritmo baseado para Sumariza√ß√£o de Textos

- Teoria e C√°lculos passo a passo
- Implementa√ß√£o do algoritmo
- Gera√ß√£o de resumos
- Exerc√≠cio

### Sumariza√ß√£o de textos

- 1 - Pr√©-processamento do texto
- 2 - Frequ√™ncia das palavras
- 3 - Frequ√™ncia proporcional das palavras(pesos)
- 4 - Tokeniza√ß√£o das senten√ßas
- 5 - Nota para as senten√ßas
- 6 - Ordena√ß√£o das melhores senten√ßas
- 7 - Gerando o resumo

#### 1 - Pr√©-processamento do texto

Faremos 3 tipos de pr√©-processamento:

- Converter todo o texto para min√∫sculo
- Remo√ß√£o das stopwords
- Remo√ß√£o da pontua√ß√£o

#### 2 - Frequ√™ncia das palavras

Vamos verificar quantas vezes cada palavra aparece.

#### 3 - Frequ√™ncia proporcional das palavras(pesos)

Vamos dividir as ocorr√™ncias da palavras com o valor da palavra que mais apareceu em nosso texto. No exemplo, vamos usar a palavra intelig√™ncia como maior ocorr√™ncia, 6 e dividir todas as demais por ela.  

![image](https://user-images.githubusercontent.com/6373438/233171538-c84e39e9-463a-4ba6-8f13-b8e685c7e918.png)

#### 4 - Tokeniza√ß√£o das senten√ßas

![image](https://user-images.githubusercontent.com/6373438/233172214-3d7c9eab-82f1-4607-a0ea-96ca5a2e8265.png)

#### 5 - Nota para as senten√ßas

![image](https://user-images.githubusercontent.com/6373438/233172389-8f983227-eb8a-411a-b250-9ec0622a0fc8.png)


#### 6 - Ordena√ß√£o das melhores senten√ßas

![image](https://user-images.githubusercontent.com/6373438/233172389-8f983227-eb8a-411a-b250-9ec0622a0fc8.png)

#### 7 - Gerando o resumo

![image](https://user-images.githubusercontent.com/6373438/233172752-03642386-a286-4d70-b474-62a3b2a7f712.png)

## Pr√©-processamento do texto

In [1]:
# Importando as libs
import re
import nltk
import string

In [4]:
texto_original = """A intelig√™ncia artificial √© a intelig√™ncia similar a humana. 
                    Definem como o estudo de agente artificial com intelig√™ncia.
                    Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia.
                    Resolver problemas e possuir intelig√™ncia.
                    Relacionada ao comportamento inteligente.
                    Constru√ß√£o de m√°quinas para raciocinar.
                    Aprender com os erros e acertos. Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano."""

In [5]:
texto_original

'A intelig√™ncia artificial √© a intelig√™ncia similar a humana. \n                    Definem como o estudo de agente artificial com intelig√™ncia.\n                    Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia.\n                    Resolver problemas e possuir intelig√™ncia.\n                    Relacionada ao comportamento inteligente.\n                    Constru√ß√£o de m√°quinas para raciocinar.\n                    Aprender com os erros e acertos. Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.'

In [6]:
texto_original = re.sub(r'\s+', ' ', texto_original)

In [7]:
texto_original

'A intelig√™ncia artificial √© a intelig√™ncia similar a humana. Definem como o estudo de agente artificial com intelig√™ncia. Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia. Resolver problemas e possuir intelig√™ncia. Relacionada ao comportamento inteligente. Constru√ß√£o de m√°quinas para raciocinar. Aprender com os erros e acertos. Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.'

In [10]:
nltk.download('punkt')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\adria\AppData\Roaming\nltk_data...
[nltk_data]   Unzipping tokenizers\punkt.zip.


True

In [16]:
nltk.download('stopwords')

[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\adria\AppData\Roaming\nltk_data...
[nltk_data]   Unzipping corpora\stopwords.zip.


True

In [17]:
stopwords = nltk.corpus.stopwords.words("portuguese")
print(stopwords)

['a', '√†', 'ao', 'aos', 'aquela', 'aquelas', 'aquele', 'aqueles', 'aquilo', 'as', '√†s', 'at√©', 'com', 'como', 'da', 'das', 'de', 'dela', 'delas', 'dele', 'deles', 'depois', 'do', 'dos', 'e', '√©', 'ela', 'elas', 'ele', 'eles', 'em', 'entre', 'era', 'eram', '√©ramos', 'essa', 'essas', 'esse', 'esses', 'esta', 'est√°', 'estamos', 'est√£o', 'estar', 'estas', 'estava', 'estavam', 'est√°vamos', 'este', 'esteja', 'estejam', 'estejamos', 'estes', 'esteve', 'estive', 'estivemos', 'estiver', 'estivera', 'estiveram', 'estiv√©ramos', 'estiverem', 'estivermos', 'estivesse', 'estivessem', 'estiv√©ssemos', 'estou', 'eu', 'foi', 'fomos', 'for', 'fora', 'foram', 'f√¥ramos', 'forem', 'formos', 'fosse', 'fossem', 'f√¥ssemos', 'fui', 'h√°', 'haja', 'hajam', 'hajamos', 'h√£o', 'havemos', 'haver', 'hei', 'houve', 'houvemos', 'houver', 'houvera', 'houver√°', 'houveram', 'houv√©ramos', 'houver√£o', 'houverei', 'houverem', 'houveremos', 'houveria', 'houveriam', 'houver√≠amos', 'houvermos', 'houvesse', 'hou

In [18]:
len(stopwords)

207

In [22]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [25]:
def preprocessamento(texto):
    # Convertendo tudo para minus
    texto_formatado = texto.lower()
    
    # Gerando os Tokens
    tokens = []
    for token in nltk.word_tokenize(texto_formatado):
        tokens.append(token)
        
    # Removendo as stopwords
    tokens = [palavra for palavra in tokens if palavra not in stopwords and palavra not in string.punctuation]
    
    # Gerando o texto em formato correto
    texto_formatado = " ".join([str(elemento) for elemento in tokens])
    
    return texto_formatado
    # return tokens

In [26]:
texto_formatado = preprocessamento(texto_original)
texto_formatado

'intelig√™ncia artificial intelig√™ncia similar humana definem estudo agente artificial intelig√™ncia ci√™ncia engenharia produzir m√°quinas intelig√™ncia resolver problemas possuir intelig√™ncia relacionada comportamento inteligente constru√ß√£o m√°quinas raciocinar aprender erros acertos intelig√™ncia artificial raciocinar situa√ß√µes cotidiano'

## Frequ√™ncia das Palavras

In [30]:
# Exibe quantas vezes cada letra foi exibida no c√≥digo
frequencia_palavras = nltk.FreqDist(texto_formatado)

# Na verdade queremos as palavras, ai usaremos o word_tokenize
frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
frequencia_palavras

FreqDist({'intelig√™ncia': 6, 'artificial': 3, 'm√°quinas': 2, 'raciocinar': 2, 'similar': 1, 'humana': 1, 'definem': 1, 'estudo': 1, 'agente': 1, 'ci√™ncia': 1, ...})

In [36]:
frequencia_palavras['intelig√™ncia']

6

In [37]:
frequencia_palavras.keys()

dict_keys(['intelig√™ncia', 'artificial', 'similar', 'humana', 'definem', 'estudo', 'agente', 'ci√™ncia', 'engenharia', 'produzir', 'm√°quinas', 'resolver', 'problemas', 'possuir', 'relacionada', 'comportamento', 'inteligente', 'constru√ß√£o', 'raciocinar', 'aprender', 'erros', 'acertos', 'situa√ß√µes', 'cotidiano'])

## Frequ√™ncia Proporcional

In [35]:
frequencia_maxima = max(frequencia_palavras.values())
frequencia_maxima

6

In [38]:
for palavra in frequencia_palavras.keys():
    frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)

In [39]:
frequencia_palavras

FreqDist({'intelig√™ncia': 1.0, 'artificial': 0.5, 'm√°quinas': 0.3333333333333333, 'raciocinar': 0.3333333333333333, 'similar': 0.16666666666666666, 'humana': 0.16666666666666666, 'definem': 0.16666666666666666, 'estudo': 0.16666666666666666, 'agente': 0.16666666666666666, 'ci√™ncia': 0.16666666666666666, ...})

## Tokeniza√ß√£o das Senten√ßas

In [41]:
'o dr. jo√£o foi pra casa. Ele chegou cedo.'.split('.')

['o dr', ' jo√£o foi pra casa', ' Ele chegou cedo', '']

In [42]:
nltk.word_tokenize('o dr. jo√£o foi pra casa. Ele chegou cedo.')

['o', 'dr.', 'jo√£o', 'foi', 'pra', 'casa', '.', 'Ele', 'chegou', 'cedo', '.']

In [43]:
nltk.sent_tokenize('o dr. jo√£o foi pra casa. Ele chegou cedo.')

['o dr. jo√£o foi pra casa.', 'Ele chegou cedo.']

Agora vamos trabalhar com a gera√ß√£o das senten√ßas. Mas antes vou mostrar a forma incorreta de se fazer isso.

In [44]:
lista_sentencas = nltk.sent_tokenize(texto_formatado)
lista_sentencas

['intelig√™ncia artificial intelig√™ncia similar humana definem estudo agente artificial intelig√™ncia ci√™ncia engenharia produzir m√°quinas intelig√™ncia resolver problemas possuir intelig√™ncia relacionada comportamento inteligente constru√ß√£o m√°quinas raciocinar aprender erros acertos intelig√™ncia artificial raciocinar situa√ß√µes cotidiano']

Agora a forma correta

In [52]:
lista_sentencas = nltk.sent_tokenize(texto_original)
lista_sentencas

['A intelig√™ncia artificial √© a intelig√™ncia similar a humana.',
 'Definem como o estudo de agente artificial com intelig√™ncia.',
 'Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia.',
 'Resolver problemas e possuir intelig√™ncia.',
 'Relacionada ao comportamento inteligente.',
 'Constru√ß√£o de m√°quinas para raciocinar.',
 'Aprender com os erros e acertos.',
 'Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.']

## Gerando o Resumo - Nota para as Senten√ßas

In [54]:
notas_sentencas = {}

for sentenca in lista_sentencas:
    #print(sentenca)
    for palavra in nltk.word_tokenize(sentenca.lower()):
        #print(palavra)
        if palavra in frequencia_palavras.keys():
            if sentenca not in notas_sentencas.keys():
                notas_sentencas[sentenca] = frequencia_palavras[palavra]
            else:
                notas_sentencas[sentenca] += frequencia_palavras[palavra]

In [56]:
notas_sentencas

{'A intelig√™ncia artificial √© a intelig√™ncia similar a humana.': 2.833333333333333,
 'Definem como o estudo de agente artificial com intelig√™ncia.': 2.0,
 'Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia.': 1.8333333333333333,
 'Resolver problemas e possuir intelig√™ncia.': 1.5,
 'Relacionada ao comportamento inteligente.': 0.5,
 'Constru√ß√£o de m√°quinas para raciocinar.': 0.8333333333333333,
 'Aprender com os erros e acertos.': 0.5,
 'Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.': 2.1666666666666665}

Ordenando as senten√ßas pelas notas maiores

In [57]:
import heapq

In [59]:
melhores_sentencas = heapq.nlargest(3, notas_sentencas, key = notas_sentencas.get)

In [60]:
melhores_sentencas

['A intelig√™ncia artificial √© a intelig√™ncia similar a humana.',
 'Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.',
 'Definem como o estudo de agente artificial com intelig√™ncia.']

## Visualiza√ß√£o do Resumo

In [62]:
resumo = " ".join(melhores_sentencas)
print("Texto original: ", texto_original)
print()
print("Texto resumido:", resumo)

Texto original:  A intelig√™ncia artificial √© a intelig√™ncia similar a humana. Definem como o estudo de agente artificial com intelig√™ncia. Ci√™ncia e engenharia de produzir m√°quinas com intelig√™ncia. Resolver problemas e possuir intelig√™ncia. Relacionada ao comportamento inteligente. Constru√ß√£o de m√°quinas para raciocinar. Aprender com os erros e acertos. Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano.

Texto resumido: A intelig√™ncia artificial √© a intelig√™ncia similar a humana. Intelig√™ncia artificial √© raciocinar nas situa√ß√µes do cotidiano. Definem como o estudo de agente artificial com intelig√™ncia.


## Visualizando o resumo com HTML

In [64]:
from IPython.core.display import HTML

In [65]:
texto = ''

In [67]:
display(HTML(f'<h2>Resumo</h2>'))

for sentenca in lista_sentencas:
    #texto += sentenca
    if sentenca in melhores_sentencas:
        texto += str(sentenca).replace(sentenca, f"<mark>{sentenca}</mark>")
    else: 
        texto += sentenca
display(HTML(f"""{texto}"""))

# Resumindo textos da Internet

In [68]:
!pip install goose3

Defaulting to user installation because normal site-packages is not writeable
Collecting goose3
  Downloading goose3-3.1.13-py3-none-any.whl (88 kB)
     ---------------------------------------- 88.2/88.2 kB 4.9 MB/s eta 0:00:00
Collecting pyahocorasick
  Downloading pyahocorasick-2.0.0-cp39-cp39-win_amd64.whl (39 kB)
Collecting langdetect
  Downloading langdetect-1.0.9.tar.gz (981 kB)
     ------------------------------------- 981.5/981.5 kB 12.3 MB/s eta 0:00:00
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: langdetect
  Building wheel for langdetect (setup.py): started
  Building wheel for langdetect (setup.py): finished with status 'done'
  Created wheel for langdetect: filename=langdetect-1.0.9-py3-none-any.whl size=993225 sha256=a9b34aa8ae4e7aec6f3698909a8aef0548e1c82df5c5161ad9a35b0f0dd063d0
  Stored in directory: c:\users\adria\appdata\local\pip\cache\wheels\d1\c1\d9\7e068de779d863bc8

In [69]:
from goose3 import Goose

In [70]:
g = Goose()
url = "https://tecnoblog.net/noticias/2023/04/19/spotify-fica-fora-do-ar-e-nao-toca-musicas-ou-podcasts-na-quarta-feira-19/"
artigo = g.extract(url)

Publish date 19/04/2023 √†s 09:30 could not be resolved to UTC


In [72]:
artigo.infos

{'meta': {'description': 'Plataforma caiu repentinamente na manh√£ da quarta-feira; usu√°rios ficaram impossibilitados de escutar m√∫sicas ou podcasts',
  'lang': 'pt',
  'keywords': '',
  'favicon': 'https://tecnoblog.net/wp-content/themes/tb/img/apple-icon-57x57.png',
  'canonical': 'https://tecnoblog.net/noticias/2023/04/19/spotify-fica-fora-do-ar-e-nao-toca-musicas-ou-podcasts-na-quarta-feira-19/',
  'encoding': 'utf-8'},
 'image': None,
 'domain': 'tecnoblog.net',
 'title': 'Spotify fica fora do ar e n√£o toca m√∫sicas ou podcasts na quarta-feira (19) ‚Äì',
 'cleaned_text': 'Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo. Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù. A dor de cabe√ßa j√° afetou milhares de indiv√≠duos ao redor do mundo.\n\nOs problemas come√ßaram a partir 

In [73]:
artigo.title

'Spotify fica fora do ar e n√£o toca m√∫sicas ou podcasts na quarta-feira (19) ‚Äì'

In [74]:
artigo.tags

['EUA', 'Discord', 'Twitter', 'DownDetector', 'Brasil', 'Spotify']

In [75]:
artigo.cleaned_text

'Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo. Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù. A dor de cabe√ßa j√° afetou milhares de indiv√≠duos ao redor do mundo.\n\nOs problemas come√ßaram a partir das 09h, com √°lbuns desaparecendo da playlist dos usu√°rios, por exemplo. Depois, nada mais carregava, impossibilitando a audi√ß√£o de todo tipo de conte√∫do.\n\nNo DownDetector, os relatos subiram rapidamente, alcan√ßando em menos de 10 minutos mais de 500 notifica√ß√µes. No Twitter, as reclama√ß√µes vieram de pa√≠ses diferentes, como os Estados Unidos e o Brasil. Pessoas apontaram que n√£o era poss√≠vel realizar buscas e que as mesmas faixas apareciam de forma seguida, mas que n√£o era poss√≠vel toc√°-las.\n\nO perfil oficial de status do Spotify confirmou os problemas √†s 09h

In [76]:
len(artigo.cleaned_text)

1987

In [77]:
artigo_original = artigo.cleaned_text
artigo_original

'Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo. Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù. A dor de cabe√ßa j√° afetou milhares de indiv√≠duos ao redor do mundo.\n\nOs problemas come√ßaram a partir das 09h, com √°lbuns desaparecendo da playlist dos usu√°rios, por exemplo. Depois, nada mais carregava, impossibilitando a audi√ß√£o de todo tipo de conte√∫do.\n\nNo DownDetector, os relatos subiram rapidamente, alcan√ßando em menos de 10 minutos mais de 500 notifica√ß√µes. No Twitter, as reclama√ß√µes vieram de pa√≠ses diferentes, como os Estados Unidos e o Brasil. Pessoas apontaram que n√£o era poss√≠vel realizar buscas e que as mesmas faixas apareciam de forma seguida, mas que n√£o era poss√≠vel toc√°-las.\n\nO perfil oficial de status do Spotify confirmou os problemas √†s 09h

In [79]:
artigo_formatado = preprocessamento(artigo_original)
artigo_formatado

'usu√°rios spotify apontaram lentid√£o problemas plataforma quarta-feira 19 tanto vers√£o web quanto aplicativo tentamos abrir √°lbum algum epis√≥dio vemos apenas movimenta√ß√£o carregamento seguida mensagem ‚Äú algo deu errado carregar artista ‚Äù dor cabe√ßa afetou milhares indiv√≠duos redor mundo problemas come√ßaram partir 09h √°lbuns desaparecendo playlist usu√°rios exemplo nada carregava impossibilitando audi√ß√£o todo tipo conte√∫do downdetector relatos subiram rapidamente alcan√ßando menos 10 minutos 500 notifica√ß√µes twitter reclama√ß√µes vieram pa√≠ses diferentes estados unidos brasil pessoas apontaram poss√≠vel realizar buscas mesmas faixas apareciam forma seguida poss√≠vel toc√°-las perfil oficial status spotify confirmou problemas 09h18 afirmou trabalhando nessa quest√£o demorou nada grande quantidade respostas tu√≠te surgirem muitos brincando enquanto outros mostravam descontentamento recente poss√≠vel informar quanto tempo levar√° tudo normalize √∫ltimas vezes plataform

In [80]:
len(artigo_formatado)

1477

### Fun√ß√£o sumarizar

In [81]:
def sumarizar(texto, quantidade_sentencas):
    texto_original = texto
    texto_formatado = preprocessamento(texto_original)

    frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
    frequencia_maxima = max(frequencia_palavras.values())
    
    for palavra in frequencia_palavras.keys():
        frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)
        lista_sentencas = nltk.sent_tokenize(texto_original)
  
    nota_sentencas = {}
    for sentenca in lista_sentencas:
        for palavra in nltk.word_tokenize(sentenca):
            if palavra in frequencia_palavras.keys():
                if sentenca not in nota_sentencas.keys():
                    nota_sentencas[sentenca] = frequencia_palavras[palavra]
                else:
                    nota_sentencas[sentenca] += frequencia_palavras[palavra]

    import heapq
    melhores_sentencas = heapq.nlargest(quantidade_sentencas, nota_sentencas, key=nota_sentencas.get)

    return lista_sentencas, melhores_sentencas, frequencia_palavras, nota_sentencas

In [82]:
lista_sentencas, melhores_sentencas, frequencia_palavras, nota_sentencas = sumarizar(artigo_original, 5)

In [83]:
lista_sentencas, len(lista_sentencas)

(['Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo.',
  'Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù.',
  'A dor de cabe√ßa j√° afetou milhares de indiv√≠duos ao redor do mundo.',
  'Os problemas come√ßaram a partir das 09h, com √°lbuns desaparecendo da playlist dos usu√°rios, por exemplo.',
  'Depois, nada mais carregava, impossibilitando a audi√ß√£o de todo tipo de conte√∫do.',
  'No DownDetector, os relatos subiram rapidamente, alcan√ßando em menos de 10 minutos mais de 500 notifica√ß√µes.',
  'No Twitter, as reclama√ß√µes vieram de pa√≠ses diferentes, como os Estados Unidos e o Brasil.',
  'Pessoas apontaram que n√£o era poss√≠vel realizar buscas e que as mesmas faixas apareciam de forma seguida, mas que n√£o era poss√≠vel toc√°-las.',
  'O perfil oficial de status do Spoti

In [84]:
melhores_sentencas

['Segundo o perfil do Twitter de status da plataforma, tudo foi normalizado, mas se algu√©m se deparasse com novas lentid√µes, √© poss√≠vel avisar atrav√©s do SpotifyCares na rede social do passarinho.',
 'Pessoas apontaram que n√£o era poss√≠vel realizar buscas e que as mesmas faixas apareciam de forma seguida, mas que n√£o era poss√≠vel toc√°-las.',
 'Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo.',
 'Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù.',
 'A plataforma de streaming de √°udio agradeceu os relatos das pessoas nas redes sociais, destacando o suporte dos usu√°rios.']

In [85]:
frequencia_palavras

FreqDist({'spotify': 1.0, 'poss√≠vel': 1.0, 'plataforma': 0.8, 'usu√°rios': 0.6, 'problemas': 0.6, 'apontaram': 0.4, 'lentid√£o': 0.4, 'quarta-feira': 0.4, '19': 0.4, 'quanto': 0.4, ...})

In [86]:
nota_sentencas

{'Usu√°rios do Spotify apontaram lentid√£o e problemas na plataforma na quarta-feira (19), tanto para a vers√£o web quanto no aplicativo.': 4.200000000000001,
 'Quando tentamos abrir um √°lbum ou algum epis√≥dio, vemos apenas a movimenta√ß√£o de carregamento e, em seguida, a mensagem: ‚ÄúAlgo deu errado ao carregar o artista‚Äù.': 3.600000000000001,
 'A dor de cabe√ßa j√° afetou milhares de indiv√≠duos ao redor do mundo.': 1.7999999999999998,
 'Os problemas come√ßaram a partir das 09h, com √°lbuns desaparecendo da playlist dos usu√°rios, por exemplo.': 2.6,
 'Depois, nada mais carregava, impossibilitando a audi√ß√£o de todo tipo de conte√∫do.': 2.0,
 'No DownDetector, os relatos subiram rapidamente, alcan√ßando em menos de 10 minutos mais de 500 notifica√ß√µes.': 1.9999999999999998,
 'No Twitter, as reclama√ß√µes vieram de pa√≠ses diferentes, como os Estados Unidos e o Brasil.': 0.8,
 'Pessoas apontaram que n√£o era poss√≠vel realizar buscas e que as mesmas faixas apareciam de forma se

In [87]:
def visualiza_resumo(titulo, lista_sentencas, melhores_sentencas):
    from IPython.core.display import HTML
    texto = ''

    display(HTML(f'<h1>Resumo do texto - {titulo}</h1>'))
    for i in lista_sentencas:
        if i in melhores_sentencas:
            texto += str(i).replace(i, f"<mark>{i}</mark>")
        else:
            texto += i
            
    display(HTML(f""" {texto} """))

In [88]:
visualiza_resumo('Spotify', lista_sentencas, melhores_sentencas)