In [3]:
from goose3 import Goose
g = Goose()
url = 'https://www.inovacaotecnologica.com.br/noticias/noticia.php?artigo=inteligencia-artificial-descobre-leis-fisica-ocultas-dados&id=010150211230'
artigo_portugues = g.extract(url)

In [4]:
artigo_portugues.cleaned_text

'Pesquisadores das universidades de Kobe e Osaka, no Japão, desenvolveram um sistema de inteligência artificial capaz de extrair equações de movimento de bases de dados observacionais comuns, e criar um modelo que é fiel às leis da física.\n\nEssa tecnologia poderá permitir descobrir outras equações e "leis" da física ainda desconhecidas, mas que estão intrinsecamente incorporadas nos fenômenos e nos dados que os descrevem, para os quais ainda usamos termos como "inexplicáveis" ou "caóticos".\n\nPor exemplo, pode ser possível usar o conhecimento baseado na física para criar simulações capazes de examinar a sustentabilidade de um ecossistema, ou melhorar as previsões do tempo.\n\nSer capaz de modelar - criar "gêmeos digitais", para usar um termo da moda - fenômenos físicos usando inteligência artificial poderá resultar em simulações extremamente precisas e de alta velocidade.\n\nHoje, o trabalho de fazer previsões de fenômenos físicos, como os do clima, é realizado por meio de modelos c

In [15]:
from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.luhn import LuhnSummarizer
from sumy.summarizers.lsa import LsaSummarizer
from sumy.summarizers.text_rank import TextRankSummarizer

In [16]:
parser = PlaintextParser.from_string(artigo_portugues.cleaned_text, Tokenizer('portuguese'))

## Algoritmo de Luhn

In [17]:
sumarizador_luhn = LuhnSummarizer()
resumo_luhn = sumarizador_luhn(parser.document, 5)
resumo_luhn

(<Sentence: Pesquisadores das universidades de Kobe e Osaka, no Japão, desenvolveram um sistema de inteligência artificial capaz de extrair equações de movimento de bases de dados observacionais comuns, e criar um modelo que é fiel às leis da física.>,
 <Sentence: Hoje, o trabalho de fazer previsões de fenômenos físicos, como os do clima, é realizado por meio de modelos científicos, que são programados para criar simulações usando supercomputadores.>,
 <Sentence: Além disso, nos últimos anos a gama de aplicações da física se expandiu muito, e hoje já se sabe que é possível aplicar as Leis de Newton a outros aspectos, como partes de um modelo para mostrar as mudanças de um ecossistema.>,
 <Sentence: Para superar essa deficiência, os pesquisadores consideraram que a transformação apropriada dos dados observacionais é semelhante à transformação de coordenadas em geometria, bastando assim aplicar aos dados a ideia geométrica de invariância de transformação de coordenadas encontrada na físi

## Algoritmo LSA

In [18]:
sumarizador_lsa = LsaSummarizer()
resumo_lsa = sumarizador_lsa(parser.document, 5)
resumo_lsa

(<Sentence: Essa tecnologia poderá permitir descobrir outras equações e "leis" da física ainda desconhecidas, mas que estão intrinsecamente incorporadas nos fenômenos e nos dados que os descrevem, para os quais ainda usamos termos como "inexplicáveis" ou "caóticos".>,
 <Sentence: Essas simulações usam modelos matemáticos baseados nas leis da física que são conhecidas.>,
 <Sentence: No entanto, se o modelo não for altamente confiável, os resultados também serão desprovidos de confiabilidade.>,
 <Sentence: No entanto, ainda não conseguimos desvendar uma equação de movimento concreta para muitos casos.>,
 <Sentence: É nisto - encontrar essas propriedades geométricas nos dados - que consiste o trabalho do sistema de inteligência artificial desenvolvido pela equipe.>)

## Algoritmo TextRank

In [19]:
sumarizador_textrank = TextRankSummarizer()
resumo_textrank = sumarizador_textrank(parser.document, 5)
resumo_textrank

(<Sentence: Pesquisadores das universidades de Kobe e Osaka, no Japão, desenvolveram um sistema de inteligência artificial capaz de extrair equações de movimento de bases de dados observacionais comuns, e criar um modelo que é fiel às leis da física.>,
 <Sentence: Além disso, nos últimos anos a gama de aplicações da física se expandiu muito, e hoje já se sabe que é possível aplicar as Leis de Newton a outros aspectos, como partes de um modelo para mostrar as mudanças de um ecossistema.>,
 <Sentence: Já foram feitos progressos na descoberta de equações de movimento a partir de dados, mas os trabalhos anteriores exigiam que os dados estivessem no formato apropriado para se ajustar à sua forma especial assumida de equação de movimento.>,
 <Sentence: Para superar essa deficiência, os pesquisadores consideraram que a transformação apropriada dos dados observacionais é semelhante à transformação de coordenadas em geometria, bastando assim aplicar aos dados a ideia geométrica de invariância d

## Sumarização Extrativa usando arquitetura de aprendizagem profunda BERT

In [7]:
from transformers import *

# Load model, model config and tokenizer via Transformers
custom_config = AutoConfig.from_pretrained('neuralmind/bert-large-portuguese-cased')
custom_config.output_hidden_states=True
custom_tokenizer = AutoTokenizer.from_pretrained('neuralmind/bert-large-portuguese-cased')
custom_model = AutoModel.from_pretrained('neuralmind/bert-large-portuguese-cased', config=custom_config)

from summarizer import Summarizer

model = Summarizer(custom_model=custom_model, custom_tokenizer=custom_tokenizer)

model(artigo_portugues.cleaned_text)


Downloading: 100%|██████████| 648/648 [00:00<00:00, 325kB/s]
Downloading: 100%|██████████| 210k/210k [00:00<00:00, 408kB/s]  
Downloading: 100%|██████████| 2.00/2.00 [00:00<00:00, 2.01kB/s]
Downloading: 100%|██████████| 112/112 [00:00<00:00, 116kB/s]
Downloading: 100%|██████████| 155/155 [00:00<00:00, 153kB/s]
Downloading: 100%|██████████| 1.34G/1.34G [02:05<00:00, 10.7MB/s] 
Some weights of the model checkpoint at neuralmind/bert-large-portuguese-cased were not used when initializing BertModel: ['cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.dense.bias', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.transform.dense.weight', 'cls.seq_relationship.weight', 'cls.predictions.bias', 'cls.predictions.decoder.weight']
- This IS expected if you are initializing BertModel from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertFor

'Pesquisadores das universidades de Kobe e Osaka, no Japão, desenvolveram um sistema de inteligência artificial capaz de extrair equações de movimento de bases de dados observacionais comuns, e criar um modelo que é fiel às leis da física. Hoje, o trabalho de fazer previsões de fenômenos físicos, como os do clima, é realizado por meio de modelos científicos, que são programados para criar simulações usando supercomputadores. E estamos muito longe de conseguir derivar todas as regras que ditam o comportamento dos fenômenos que observamos para criar modelos que realmente espelhem a natureza. Além disso, nos últimos anos a gama de aplicações da física se expandiu muito, e hoje já se sabe que é possível aplicar as Leis de Newton a outros aspectos, como partes de um modelo para mostrar as mudanças de um ecossistema. Sendo possível extrair dos dados as equações de movimento, então torna-se possível usar essas equações para criar modelos e simulações que sejam fiéis às leis da física. Por exe