In [1]:
import os
import time
import random
import hashlib
import feedparser

random.seed(int(time.time()))

feeds = {
    'Brazil': 'http://g1.globo.com/dynamo/brasil/rss2.xml',
    'Cars': 'http://g1.globo.com/dynamo/carros/rss2.xml',
    'Science_and_Health': 'http://g1.globo.com/dynamo/ciencia-e-saude/rss2.xml',
    'Employment': 'http://g1.globo.com/dynamo/concursos-e-emprego/rss2.xml',
    'Economy': 'http://g1.globo.com/dynamo/economia/rss2.xml',
    'Education': 'http://g1.globo.com/dynamo/educacao/rss2.xml',
    'Lottery' : 'http://g1.globo.com/dynamo/loterias/rss2.xml',
    'World': 'http://g1.globo.com/dynamo/mundo/rss2.xml',
    'Music': 'http://g1.globo.com/dynamo/musica/rss2.xml',
    'Nature': 'http://g1.globo.com/dynamo/natureza/rss2.xml',
    'Bizarre': 'http://g1.globo.com/dynamo/planeta-bizarro/rss2.xml',
    'Politics': 'http://g1.globo.com/dynamo/politica/mensalao/rss2.xml',
    'Pop_and_Art': 'http://g1.globo.com/dynamo/pop-arte/rss2.xml',
    'Technology_and_Games': 'http://g1.globo.com/dynamo/tecnologia/rss2.xml',
    'Turism_and_Travel': 'http://g1.globo.com/dynamo/turismo-e-viagem/rss2.xml',
}

folder_path = './data/feeds'
summary_path = './data/index.txt'

try:
    file = open(summary_path, 'r')
    readed = file.readlines()
    file.close()
    summary = [s.strip() for s in readed]
except:
    summary = []
    
print(len(summary))

for category, link in feeds.items():
    feed = feedparser.parse(link)
    
    cat_folder = os.path.join(folder_path, category)
    if not os.path.exists(cat_folder):
        os.makedirs(cat_folder)
        
    for entry in feed.entries:
        pubdate = entry['published']
        title = entry['title']
        link = entry['link']
        text = entry['summary']
        
        encoded = title.encode('ascii', 'ignore')
        hasher = hashlib.md5()
        hasher.update(encoded)
        md5title = hasher.hexdigest()
        print("Parsing %s" %md5title)
        if md5title in summary: 
            print('\t DROPPED.')
            continue
            
        print("\t FINISHED.")    
        summary.append(md5title)

        filename = '%s.txt' %md5title

        filepath = os.path.join(cat_folder, filename)
        file = open(filepath, 'w')
        file.write(title + "\n")
        file.write(link + "\n")
        file.write(text + "\n")
        
        file.close()

try:
    os.remove(summary_path)
except:
    pass
file = open(summary_path, 'w')
file.writelines("\n".join(summary))
file.close() 



0
Parsing 608517fc777d15da71a545720dc4fe28
	 FINISHED.
Parsing cac068fa17df97ece856dc57548f521d
	 FINISHED.
Parsing 3ea55897c7e7e1d699dd237a51606985
	 FINISHED.
Parsing bebd564ec190283593dcd6276e925adf
	 FINISHED.
Parsing c91d6a7055a6cf01fc92c1944aeaebe8
	 FINISHED.
Parsing ebd1c98e8e8fb9bf2fcaefd294c79e48
	 FINISHED.
Parsing 2e5c85b9f0e03ddc9a435fc8e075333b
	 FINISHED.
Parsing 24573f25c4f540ae85be0a5e7f5548be
	 FINISHED.
Parsing e75107a0f29185b6610873c68f04ca05
	 FINISHED.
Parsing 57bf5994031e029949ee456628eae929
	 FINISHED.
Parsing 31d9f99a6892626ec8d7c70af9fb7bdf
	 FINISHED.
Parsing 64227c0bb7dac32168f22059d70c2ad7
	 FINISHED.
Parsing c54f7734a74113b742075984763e8426
	 FINISHED.
Parsing 14192d5d6c54bf4bb01caa9de650ec1d
	 FINISHED.
Parsing 700f1bf8df8d3bab0cf0961315b79068
	 FINISHED.
Parsing ce83e1ebbc85c98f144039fbd7b4b691
	 FINISHED.
Parsing cd54d807fecda6b5db3331a414d4d192
	 FINISHED.
Parsing 660a28b676af546fef21ee34d258e6fe
	 FINISHED.
Parsing 45f09a13d85d4d07c7d82f6c39340844
	 F

Parsing f93b57021b1c868953b38c133971d86f
	 FINISHED.
Parsing 255d209daf2ae2a56a62200eec5b7269
	 FINISHED.
Parsing 4df02663c6cb4c81be613720c4f8ba22
	 FINISHED.
Parsing 63df06571cc7c72093df8c0b356c945c
	 FINISHED.
Parsing 0cdcb52457bde53336c54e2b0b8252f8
	 FINISHED.
Parsing 1a06b3e4443501077c79840e125c5cb4
	 FINISHED.
Parsing b8f7301b3274e8dc89145b8ae06ac465
	 FINISHED.
Parsing 787223cd2340ce3e5725b6deb4824c4f
	 FINISHED.
Parsing 336052bc171f7ee477a1e94845e2e5d4
	 FINISHED.
Parsing 9238d9a8c3eb179e7f39fa6f3d07752f
	 FINISHED.
Parsing d40a30177f5d64076f135bfcb02a7811
	 FINISHED.
Parsing 60bffcb0d68a7624388c82adb752cddb
	 FINISHED.
Parsing 84bf0130bfc6b67b0b14e4a49001c93d
	 FINISHED.
Parsing f7f44cc1aa274e43c95b167d54a4197f
	 FINISHED.
Parsing 6241e138057390ac2bd4c35174604950
	 FINISHED.
Parsing 70cf811e9ac57bcc242fdd2b2d63a50d
	 FINISHED.
Parsing d1b6e365efbf8a6f2186d16de1ae13d8
	 FINISHED.
Parsing eddf7fa28005383717f41803f00aa551
	 FINISHED.
Parsing 0905eba2963fe105ea285eb8819364a8
	 FIN

Parsing 890c51e9471712a519c678519e74ded7
	 FINISHED.
Parsing 0425751ed44895fc2668549f52ddc054
	 FINISHED.
Parsing e29776968c85f7cf641c5e1794323039
	 FINISHED.
Parsing 6816af03e7971e74cc8cea610a99afdf
	 FINISHED.
Parsing 4963198b2843a80b471577f9e8aacc42
	 FINISHED.
Parsing 83180ce6979b6e5ed0c8faa55049f951
	 FINISHED.
Parsing 8700006101da75c30a8cd62c5a1d31b5
	 FINISHED.
Parsing e9f386a0168a537d94026648d0c3795c
	 FINISHED.
Parsing fe8102bb00c545d3451b70af3921ca33
	 FINISHED.
Parsing 4e838540209a3a9b0353a7880a77c353
	 FINISHED.
Parsing 1214a672c57dfd4a1c1c18012d5e637f
	 FINISHED.
Parsing 24a0582679137ea5f72ea7dda8bdd121
	 FINISHED.
Parsing ed10da214cd428cfc6a326c4c70fb742
	 FINISHED.
Parsing 5d32b86f2052325b8f4aa28b31e93324
	 FINISHED.
Parsing 54e62ae02fa31e436d282dca69ba8fbe
	 FINISHED.
Parsing ba0fe7da15da016bb585aed09c8e0654
	 FINISHED.
Parsing b1f3e2de527b8b449d55aac81289f7d5
	 FINISHED.
Parsing 0e1d269331302eaf064719c324be6327
	 FINISHED.
Parsing 2a1cf2241f945e57556f3e84391b1031
	 FIN

Parsing 62c0451870e57686d99027165b611816
	 FINISHED.
Parsing aeb701bd33c5d085ea9c27a5fc1fe4ef
	 FINISHED.
Parsing 8a6c9787c4c729f58f07de6940c44b77
	 FINISHED.
Parsing 6abbb6999e26d0e6cb4a6070fa7dba06
	 FINISHED.
Parsing 60305a5457601c652ba47d2ab65d7a42
	 FINISHED.
Parsing 173a3c5459b966e61ac7a4ec87afeec1
	 FINISHED.
Parsing fee8edb35ec49c2090e61ec0be29e7bd
	 FINISHED.
Parsing 7561236b3a2454714d29b700c6690f10
	 FINISHED.
Parsing cd83bb09eded27c0fd959fbd107bc5d7
	 FINISHED.
Parsing 4100ca2e751131bd722522a2218d092b
	 FINISHED.
Parsing 0a0d04250fbcf19a172e726eeee675b6
	 FINISHED.
Parsing 2ab2f66cec1fc5bcab0c90c83b5bdbc5
	 FINISHED.
Parsing 52eca6f7a923393a862076aea00a3af7
	 FINISHED.
Parsing f18b4552d3c1ff9e2105f6923aec4dac
	 FINISHED.
Parsing 004b213e80133be8b2545a9587d7563d
	 FINISHED.
Parsing 1a3ec84345c671a486fa9a345bf4e05c
	 FINISHED.
Parsing f84e56ba152edef0066e49d495ceafa8
	 FINISHED.
Parsing 13098802442a9d66f647e31a23b1dc13
	 FINISHED.
Parsing fe4419f63bfeb5bc95f34cd81e28a0af
	 FIN

In [2]:
#Loading files and categories
categories = list(feeds.keys())
data = {}
cat_dict = {}
label_dict = {}


for cat in categories:
    data[cat] = []
    cat_dict[cat] = len(data.keys())
    label_dict[len(data.keys())] = cat
    path = os.path.join(folder_path, cat)
    files = os.listdir(path)
    
    for f in files:
        filepath = os.path.join(path, f)
        data[cat].append(filepath)

In [3]:
#Feature Extract from Text
from itertools import chain
from sklearn.feature_extraction.text import CountVectorizer

count_vect = CountVectorizer(input='filename')
filenames = list(chain.from_iterable(data.values()))

x_train_counts = count_vect.fit_transform(filenames)

In [4]:
x_train_counts.shape

(579, 24812)

In [5]:
from sklearn.feature_extraction.text import TfidfTransformer
tfidf_transformer = TfidfTransformer()
x_train_tfidf = tfidf_transformer.fit_transform(x_train_counts)
x_train_tfidf.shape

(579, 24812)

In [6]:
#Classifing using Naive Bayes
from sklearn.naive_bayes import MultinomialNB

cat_labels = []
for key, item in data.items():
    n = len(item)
    label = cat_dict[key]
    
    for i in range(n):
        cat_labels.append(label)
        

clf = MultinomialNB().fit(x_train_tfidf, cat_labels)

In [7]:
#Getting data to Fit
feeds = {
    'Acre':'http://g1.globo.com/dynamo/ac/acre/rss2.xml',
    'Alagoas':'http://g1.globo.com/dynamo/al/alagoas/rss2.xml',
    'Amapa':'http://g1.globo.com/dynamo/ap/amapa/rss2.xml',
    'Amazonas':'http://g1.globo.com/dynamo/am/amazonas/rss2.xml',
    'Bahia':'http://g1.globo.com/dynamo/bahia/rss2.xml',
    'Ceara':'http://g1.globo.com/dynamo/ceara/rss2.xml',
    'Distrito Federal':'http://g1.globo.com/dynamo/distrito-federal/rss2.xml',
    'Espirito Santo':'http://g1.globo.com/dynamo/espirito-santo/rss2.xml',
    'Goias':'http://g1.globo.com/dynamo/goias/rss2.xml',
    'Maranhao':'http://g1.globo.com/dynamo/ma/maranhao/rss2.xml',
    'Mato Grosso':'http://g1.globo.com/dynamo/mato-grosso/rss2.xml',
    'Mato Grosso do Sul':'http://g1.globo.com/dynamo/mato-grosso-do-sul/rss2.xml',
    'Minas Gerais':'http://g1.globo.com/dynamo/minas-gerais/rss2.xml',
    'MG Centro-Oeste':'http://g1.globo.com/dynamo/mg/centro-oeste/rss2.xml',
    'MG Grande Minas':'http://g1.globo.com/dynamo/mg/grande-minas/rss2.xml',
    'MG Sul de Minas':'http://g1.globo.com/dynamo/mg/sul-de-minas/rss2.xml',
    'MG Triangulo Mineiro':'http://g1.globo.com/dynamo/minas-gerais/triangulo-mineiro/rss2.xml',
    'MG Vales de Minas Gerais':'http://g1.globo.com/dynamo/mg/vales-mg/rss2.xml',
    'MG Zonas da Mata':'http://g1.globo.com/dynamo/mg/zona-da-mata/rss2.xml',
    'Para':'http://g1.globo.com/dynamo/pa/para/rss2.xml',
    'Paraiba':'http://g1.globo.com/dynamo/pb/paraiba/rss2.xml',
    'Parana':'http://g1.globo.com/dynamo/pr/parana/rss2.xml',
    'PR Campos Gerais e Sul':'http://g1.globo.com/dynamo/pr/campos-gerais-sul/rss2.xml',
    'PR Oeste e Sudoeste':'http://g1.globo.com/dynamo/pr/oeste-sudoeste/rss2.xml',
    'PR Norte e Nordeste':'http://g1.globo.com/dynamo/pr/norte-noroeste/rss2.xml',
    'Pernambuco':'http://g1.globo.com/dynamo/pernambuco/rss2.xml',
    'PE Caruaru e Regiao':'http://g1.globo.com/dynamo/pe/caruaru-regiao/rss2.xml',
    'PE Petrolina e Regiao':'http://g1.globo.com/dynamo/pe/petrolina-regiao/rss2.xml',
    'Rio de Janeiro':'http://g1.globo.com/dynamo/rio-de-janeiro/rss2.xml',
    'RJ Regiao Serrana':'http://g1.globo.com/dynamo/rj/regiao-serrana/rss2.xml',
    'RJ Regiao dos Lagos':'http://g1.globo.com/dynamo/rj/regiao-dos-lagos/rss2.xml',
    'Norte Fluminense':'http://g1.globo.com/dynamo/rj/norte-fluminense/rss2.xml',
    'Sul e Costa Verde':'http://g1.globo.com/dynamo/rj/sul-do-rio-costa-verde/rss2.xml',
    'Rio Grande do Norte':'http://g1.globo.com/dynamo/rn/rio-grande-do-norte/rss2.xml',
    'Rio Grande do Sul':'http://g1.globo.com/dynamo/rs/rio-grande-do-sul/rss2.xml',
    'Rondonia':'http://g1.globo.com/dynamo/ro/rondonia/rss2.xml',
    'Roraima':'http://g1.globo.com/dynamo/rr/roraima/rss2.xml',
    'Santa Catarina':'http://g1.globo.com/dynamo/sc/santa-catarina/rss2.xml',
    'Sao Paulo':'http://g1.globo.com/dynamo/sao-paulo/rss2.xml',
    'SP Bauru e Marilia':'http://g1.globo.com/dynamo/sp/bauru-marilia/rss2.xml',
    'SP Campinas e Regiao':'http://g1.globo.com/dynamo/sp/campinas-regiao/rss2.xml',
    'SP Itapetininga e Regiao':'http://g1.globo.com/dynamo/sao-paulo/itapetininga-regiao/rss2.xml',
    'SP Mogi das Cruzes e Suzano':'http://g1.globo.com/dynamo/sp/mogi-das-cruzes-suzano/rss2.xml',
    'SP Piracicaba e Regiao':'http://g1.globo.com/dynamo/sp/piracicaba-regiao/rss2.xml',
    'SP Prudente e Regiao':'http://g1.globo.com/dynamo/sp/presidente-prudente-regiao/rss2.xml',
    'SP Ribeirao Preto e Franca':'http://g1.globo.com/dynamo/sp/ribeirao-preto-franca/rss2.xml',
    'SP Rio Preto e Aracatuba':'http://g1.globo.com/dynamo/sao-paulo/sao-jose-do-rio-preto-aracatuba/rss2.xml',
    'SP Santos e Regiao':'http://g1.globo.com/dynamo/sp/santos-regiao/rss2.xml',
    'SP Sao Carlos e Araraquara':'http://g1.globo.com/dynamo/sp/sao-carlos-regiao/rss2.xml',
    'SP Sorocaba e Jundiai':'http://g1.globo.com/dynamo/sao-paulo/sorocaba-jundiai/rss2.xml',
    'SP Vale do Paraiba e Regiao':'http://g1.globo.com/dynamo/sp/vale-do-paraiba-regiao/rss2.xml',
    'Sergipe':'http://g1.globo.com/dynamo/se/sergipe/rss2.xml',
    'Tocantins':'http://g1.globo.com/dynamo/to/tocantins/rss2.xml',

}


folder_path = './data/regional'
summary_path = './data/index_regional.txt'

hasher = hashlib.md5()

try:
    with open(summary_path) as f:
        summary = f.read.splitlines()
except:
    summary = []

for category, link in feeds.items():
    feed = feedparser.parse(link)
    
    cat_folder = os.path.join(folder_path, category)
    if not os.path.exists(cat_folder):
        os.makedirs(cat_folder)
        
    for entry in feed.entries:
        title = entry['title']
        link = entry['link']
        text = entry['summary']
        
        encoded = title.encode('ascii', 'ignore')
        hasher.update(encoded)
        md5title = hasher.hexdigest()
        if md5title in summary: 
            continue
        
        print("Parsing: %s - %s - %s" %(category, md5title[:10], title[:50]))
        summary.append(md5title)

        filename = '%s.txt' %md5title

        filepath = os.path.join(cat_folder, filename)
        file = open(filepath, 'w')
        file.write(title + "\n")
        file.write(link + "\n")
        file.write(text + "\n")
        
        file.close()
    
try:
    os.remove(summary_path)
except:
    pass
file = open(summary_path, 'w')
file.writelines("\n".join(summary))
file.close() 

Parsing: Acre - 8105624848 - VÍDEOS: Jornal do Acre 1ª edição - AC de sábado, 5
Parsing: Acre - 5996f1632c - Empresa aérea faz acordo com MP e vai retomar voos
Parsing: Acre - f5c403963f - Homem mata cunhado, atira na esposa e deixa menor 
Parsing: Acre - 558175340f - Em isolamento social, escola faz show de talentos 
Parsing: Acre - 7c61d2a865 - Após prisão de iranianos, dois são presos por faci
Parsing: Acre - d9084a6215 - MP abre investigação para apurar denúncia de que f
Parsing: Acre - b9e997b941 - Polícia apreende armas de fogo e 3 são presos por 
Parsing: Acre - 5920987ddb - Sipam prevê sábado (5) com sol e possibilidade de 
Parsing: Acre - a05f36bd20 - Caixa abre quatro agências neste sábado (5) no Acr
Parsing: Acre - 9bce905841 - Motorista bêbado bate em retroescavadeira ao tenta
Parsing: Acre - 79bf12238c - Ex-escrivão da Polícia Civil condenado por peculat
Parsing: Acre - 9d036aa553 - Jovem de 17 anos desaparece após sair para dormir 
Parsing: Acre - f0d7353575 - Acre tem 25

Parsing: Amazonas - 3494f052f3 - Laudo do IML aponta que militar morto em batalhão 
Parsing: Amazonas - 0f4993145e - Criança de 12 anos é apreendida por lesão corporal
Parsing: Amazonas - 8b27a061d0 - MP Eleitoral consulta TRE sobre realização de atos
Parsing: Amazonas - 2a70546ab3 - VÍDEOS: Porto da Ceasa tem movimento intenso duran
Parsing: Amazonas - f148870591 - VÍDEOS: Amazonas registra aumento histórico de foc
Parsing: Amazonas - 3073839970 - Porto em Manaus registra fila de carros na saída p
Parsing: Amazonas - 158796a43f - Homem é morto a tiros por dupla em moto enquanto b
Parsing: Amazonas - cdb6bfbcc4 - Dia da Amazônia: Conheça algumas personalidades qu
Parsing: Amazonas - 1af8ddc309 - Apenas 8,5% dos adultos de 20 a 49 anos se vacinar
Parsing: Amazonas - ffb0860c19 - VÍDEOS: Senado aprova mudanças na legislação de tr
Parsing: Amazonas - c915932eca - Incêndio atinge supermercado em Rio Preto da Eva, 
Parsing: Amazonas - 9a92cdf029 - AM registra mais 667 casos de Covid-19 e to

Parsing: Distrito Federal - cfaeec2643 - Fiscalização nas redes sociais será desafio para e
Parsing: Distrito Federal - cbb361746f - Conheça a banda Belga, finalista do Brasília Indep
Parsing: Distrito Federal - c06232a7e2 - Evento 'Meu Eixão' leva oficinas, música e gastron
Parsing: Distrito Federal - 1bbd42fe39 - Polícia prende em Jataí caseiro suspeito de matar 
Parsing: Distrito Federal - e3859907e5 - 'Médico fez a cabeça dela', diz filho de gerente d
Parsing: Distrito Federal - cf8ef7e68e - Corpo de gerente de banco que morreu após procedim
Parsing: Distrito Federal - f70570b046 - Professor é encontrado morto e tem picape roubada 
Parsing: Distrito Federal - 982e65e5d8 - Juiz do DF determina bloqueio de bens de Marcelo C
Parsing: Distrito Federal - bbb44b5fc5 - Conheça a dupla Marcello e Fabiano, finalista do B
Parsing: Distrito Federal - 3f34b69a13 - Juiz do Distrito Federal rejeita pedido de liberda
Parsing: Distrito Federal - e2085faf22 - Professor de escola pública do DF é sel

Parsing: Maranhao - f317c74137 - Mais uma sexta-feira com registro de aglomeração n
Parsing: Maranhao - d027ceee64 - Aumento no número de passageiros causa aglomeração
Parsing: Maranhao - b4df1468a9 - Criança de oito anos morre após ser atingida por b
Parsing: Maranhao - 1dd85a6588 - Salva-vidas alertam banhistas sobre cuidados com á
Parsing: Maranhao - b41d837120 - PRF registra duas mortes em acidentes nas BRs que 
Parsing: Maranhao - 1fdaef2897 - Praias da Grande Ilha estão impróprias para banho,
Parsing: Maranhao - 11948cc33d - Veja o que funciona nos feriados de 7 e 8 de setem
Parsing: Maranhao - 2a7c438fd7 - Maranhão chega a 145 mil pacientes curados da Covi
Parsing: Maranhao - 01574a02da - Maranhão chega a 157 mil casos e 3488 óbitos pela 
Parsing: Maranhao - 7fc63048a3 - Governo Flávio Dino autorizou gastos de R$ 671 mil
Parsing: Maranhao - 112ee62343 - Idoso de 68 anos passa dois meses internado e é re
Parsing: Maranhao - d5f728d4af - Após nova consulta, aulas presenciais na re

Parsing: Minas Gerais - 65eab4fb9b - Governo de MG recorre contra decisão que determina
Parsing: Minas Gerais - 73fc51565e - Trinta e seis ônibus são incendiados em BH e Regiã
Parsing: Minas Gerais - ae8f2e7779 - Travesti é julgada por matar rival asfixiada com a
Parsing: Minas Gerais - aed4045489 - Acidente deixa mortos e feridos na BR-262 próximo 
Parsing: Minas Gerais - dfebc297dc - BHP é alvo de ação coletiva na Austrália por desas
Parsing: Minas Gerais - 2751f6fe2b - BR-381 é liberada 10 horas após acidente entre car
Parsing: Minas Gerais - d38d295a64 - Cantor sertanejo Amaraí morre aos 77 anos em Alfen
Parsing: Minas Gerais - 6f2a71b96d - Perícia feita no Inep indica fragilidades no proce
Parsing: Minas Gerais - ae20b71666 - Artistas pintam tapumes e fazem mural no entorno d
Parsing: Minas Gerais - 022bbd8074 - Flanelinhas são detidos no entorno da Feira Hippie
Parsing: Minas Gerais - a6393db7ed - Acidente entre carreta e ônibus deixa um morto e d
Parsing: Minas Gerais - acc1eb83

Parsing: MG Sul de Minas - 30a354b197 - TJMG acolhe recurso e derruba liminar que impedia 
Parsing: MG Sul de Minas - 0167ae30ad - Solidariedade oficializa João Alexandre como candi
Parsing: MG Sul de Minas - 58167a8ca9 - Batida entre carros mata uma pessoa e deixa três f
Parsing: MG Sul de Minas - 70d39a503e - Motorista fica ferido após perder controle e carro
Parsing: MG Sul de Minas - af2c013f44 - Prefeitura de Pouso Alegre alerta sobre procura ta
Parsing: MG Sul de Minas - 304e028626 - Incêndios são combatidos pelo Corpo de Bombeiros e
Parsing: MG Sul de Minas - 1174a55288 - VÍDEOS: EPTV 1 Sul de Minas de sábado, 5 de setemb
Parsing: MG Sul de Minas - dbbd005f47 - Homem morre após carro capotar na MG-344 entre Pra
Parsing: MG Sul de Minas - d4b63ad276 - Um ano depois da queda do bondinho, teleférico con
Parsing: MG Sul de Minas - 806576f7b6 - Grão Sagrado: veja onde buscar conhecimento e capa
Parsing: MG Sul de Minas - 409432ae5d - PM prende suspeitos de furtar 15 mil metros de lon

Parsing: MG Zonas da Mata - 7ca65604e0 - Prefeitura e Instituto de Arquitetos do Brasil lan
Parsing: MG Zonas da Mata - a0883921ec - Incêndio é registrado em garagem de ônibus em Juiz
Parsing: MG Zonas da Mata - e3b9c74836 - Defesa Civil e Guarda Municipal compartilham atend
Parsing: MG Zonas da Mata - 97440a9e78 - Grupo de apoio Enlutar da UFJF abre inscrições par
Parsing: MG Zonas da Mata - 0c2219fa8b - Eleições 2020: PT e PV realizam convenções em Juiz
Parsing: MG Zonas da Mata - 665deb494d - Trabalhadores manifestam contra a suspensão da fei
Parsing: MG Zonas da Mata - 6d3fb65210 - Eleições 2020: Cidadania lança candidatos ao Legis
Parsing: MG Zonas da Mata - 0bbdf1486d - Casal é detido por abandono de incapaz após deixar
Parsing: MG Zonas da Mata - ec74d3da35 - Suspeito de arremessar drogas e celulares para den
Parsing: MG Zonas da Mata - 49a11970e4 - Balanço mostra que Juiz de Fora registrou seis mor
Parsing: MG Zonas da Mata - a8e87a15db - Comerciante é morto a facadas ao cobrar

Parsing: Parana - 29a4884f72 - PSOL define Professor Edmilson como candidato à Pr
Parsing: Parana - fc203faed6 - Coronavírus no Paraná: veja as principais notícias
Parsing: Parana - 727a671d8f - Coronavírus: Paraná passa de 140 mil casos confirm
Parsing: Parana - 6290c3a186 - Segurança é morto a tiros durante assalto a mercad
Parsing: Parana - 6d03cc86d6 - Homem é preso suspeito de abusar sexualmente das f
Parsing: Parana - 4a5103a231 - PDT lança candidatura de Barbosa Neto à Prefeitura
Parsing: Parana - 55fd488065 - VÍDEOS: Meio-Dia Paraná de sábado, 5 de setembro
Parsing: Parana - 9af8465ef3 - Coronavírus: Praias de Guaratuba estarão fechadas 
Parsing: Parana - c602f74152 - 'É uma sinalização para a sociedade de que ainda e
Parsing: Parana - c856629b85 - Batida entre dois carros mata duas pessoas na PR-1
Parsing: Parana - c128467900 - Rapaz é preso suspeito de atirar e matar o avô em 
Parsing: Parana - e9cd0c69a9 - VÍDEOS: Bom Dia Sábado de 5 de setembro
Parsing: Parana - c489ee4248 

Parsing: PR Norte e Nordeste - cc21645378 - PSOL define Professor Edmilson como candidato à Pr
Parsing: PR Norte e Nordeste - bc1423919d - Coronavírus no Paraná: veja as principais notícias
Parsing: PR Norte e Nordeste - 0cc5c86fb7 - Coronavírus: Paraná passa de 140 mil casos confirm
Parsing: PR Norte e Nordeste - dda20661c6 - Segurança é morto a tiros durante assalto a mercad
Parsing: PR Norte e Nordeste - 9705ec8da2 - Homem é preso suspeito de abusar sexualmente das f
Parsing: PR Norte e Nordeste - 421a6bb4f3 - PDT lança candidatura de Barbosa Neto à Prefeitura
Parsing: PR Norte e Nordeste - d1ac7480b1 - VÍDEOS: Meio-Dia Paraná de sábado, 5 de setembro
Parsing: PR Norte e Nordeste - 8db9399a81 - Coronavírus: Praias de Guaratuba estarão fechadas 
Parsing: PR Norte e Nordeste - 3ed1e937c4 - 'É uma sinalização para a sociedade de que ainda e
Parsing: PR Norte e Nordeste - acd4c069b5 - Batida entre dois carros mata duas pessoas na PR-1
Parsing: PR Norte e Nordeste - 7775679103 - Rapaz é 

Parsing: PE Petrolina e Regiao - f954285abd - Univasf abre edital de apoio à inclusão digital de
Parsing: PE Petrolina e Regiao - dc9c4eb406 - VÍDEOS: GR1 de sábado, 5 de setembro
Parsing: PE Petrolina e Regiao - 9ccbcd06ed - PE registra mais 25 mortes e 731 casos da Covid-19
Parsing: PE Petrolina e Regiao - a77ab38c62 - Justiça determina ampliação de leitos de UTI pediá
Parsing: PE Petrolina e Regiao - 17637254b7 - Homem é preso em flagrante por incendiar delegacia
Parsing: PE Petrolina e Regiao - 3f92d5e6cf - Covid-19 em Petrolina e região: veja o total de ca
Parsing: PE Petrolina e Regiao - 8e0405af90 - Araripina registra 35 novos casos de Covid-19 e ma
Parsing: PE Petrolina e Regiao - f68c2f5073 - Salgueiro confirma 15 novos casos de Covid-19 e to
Parsing: PE Petrolina e Regiao - 5a618a0624 - VÍDEOS: GR2 de sexta-feira, 4 de setembro
Parsing: PE Petrolina e Regiao - ea6dc17fd7 - Petrolina registra mais 54 casos de Covid-19 e tot
Parsing: PE Petrolina e Regiao - 78e86461de - Dois ir

Parsing: RJ Regiao dos Lagos - 5e4bfb2c2d - Feriado prolongado tem barreira sanitária para imp
Parsing: RJ Regiao dos Lagos - 266a9081db - RJ1 NO AR: assista ao vivo pelo G1
Parsing: RJ Regiao dos Lagos - 27bb238198 - Covid-19 em 4 de setembro: casos e óbitos confirma
Parsing: RJ Regiao dos Lagos - 0b3984dff9 - 'Qual é a boa?': Confira a programação especial em
Parsing: RJ Regiao dos Lagos - a8b0cc587f - Dois suspeitos de envolvimento em homicídio são pr
Parsing: RJ Regiao dos Lagos - f349a53be0 - Detran RJ dispensa agendamento de veículos em atra
Parsing: RJ Regiao dos Lagos - 3de1679ff8 - Inscrições para estágio em empresa offshore termin
Parsing: RJ Regiao dos Lagos - 38f3d9778d - Festival Sabores de Cabo Frio, RJ, começa nesta se
Parsing: RJ Regiao dos Lagos - 1cd6ec9c72 - Covid-19 em 3 de setembro: casos e óbitos confirma
Parsing: RJ Regiao dos Lagos - 7f2a2dff37 - Cabo Frio, RJ, inicia processo de inscrições para 
Parsing: RJ Regiao dos Lagos - 5e706399f9 - Cinco PMs de Macaé são

Parsing: Rio Grande do Norte - 6deac88a9f - Polícia Militar intensifica fiscalização para coib
Parsing: Rio Grande do Norte - 45be1c738d - Conjunto de lojas em Natal sofre quatro arrombamen
Parsing: Rio Grande do Norte - 30987d63e5 - Novo decreto renova situação de emergência pela se
Parsing: Rio Grande do Norte - 0879f078a8 - Governo do RN estabelece protocolos para a realiza
Parsing: Rio Grande do Norte - 1e5cd4dacb - Veja o que funciona no comércio de Natal no feriad
Parsing: Rio Grande do Norte - 5bc9a5de21 - PSL oficializa candidatura de Sérgio Leocádio à Pr
Parsing: Rio Grande do Norte - 96447b50b0 - Leilão da Receita Federal tem iPhones, tablets e m
Parsing: Rio Grande do Norte - 2831aebdaf - RN soma 63.289 casos confirmados de Covid-19 e 2.2
Parsing: Rio Grande do Norte - 40c2140094 - RN tem a maior proporção do Nordeste de pessoas qu
Parsing: Rio Grande do Norte - d38c2daf71 - Festival Mada confirma adiamento para 2021 e anunc
Parsing: Rio Grande do Norte - 2c1e2b1f31 - Conven

Parsing: Roraima - 241dcfa87b - PSOL oficializa candidatura de Fábio Almeida à Pre
Parsing: Roraima - 22bdfbf872 - Autônoma morre após acidente de moto em Caracaraí,
Parsing: Roraima - 12c75626ea - Bombeiros registram 191 infectados pelo coronavíru
Parsing: Roraima - 856748b47a - Professoras de RR participam da primeira edição vi
Parsing: Roraima - 57928cbf50 - Roraima registra 44.975 casos de infectados pelo c
Parsing: Roraima - 70c6d45352 - Saúde faz testagem em massa para coronavírus no pá
Parsing: Roraima - c8d58eddb1 - Governo realiza segunda testagem  em massa para de
Parsing: Roraima - 94fe562082 - Homem é preso após roubar pela segunda vez engrada
Parsing: Roraima - 794f86a4c0 - Caixa abre três agências neste sábado (5) para saq
Parsing: Roraima - 89e28958e9 - Exército apreende quatro aviões usados em garimpo 
Parsing: Roraima - 4c2e3484e1 - MPRR pede que prefeitura de Pacaraima cumpra acord
Parsing: Roraima - 38deb76428 - Explosão em tubulação de gás em condomínio de serv
Pars

Parsing: SP Bauru e Marilia - ad2756817f - PMs rendem motorista que bateu em poste após perse
Parsing: SP Bauru e Marilia - 7e32ee5802 - Homem morre após ter motocicleta atingida por carr
Parsing: SP Bauru e Marilia - 730fc9fe9d - Mortes confirmadas por Covid-19 no centro-oeste pa
Parsing: SP Bauru e Marilia - 850c05c3c0 - VÍDEOS: TEM Notícias 1ª edição de Bauru e Marília 
Parsing: SP Bauru e Marilia - 229e33fa80 - Jovem é preso suspeito de matar comerciante de 73 
Parsing: SP Bauru e Marilia - ab9c3dd848 - Motociclista morre após bater na traseira de ônibu
Parsing: SP Bauru e Marilia - 2d5151ef68 - Jovem com síndrome rara nos ossos faz sucesso na w
Parsing: SP Bauru e Marilia - d4495a9379 - Mortes confirmadas por Covid-19 no centro-oeste pa
Parsing: SP Bauru e Marilia - 05698ce2af - Com mais dois casos, Bauru chega a 146 mortes por 
Parsing: SP Bauru e Marilia - 2238cb2576 - Coligação DEM-PP oficializa candidatura de Raul Go
Parsing: SP Bauru e Marilia - 8b54d5cc7e - Sem iluminação, p

Parsing: SP Mogi das Cruzes e Suzano - 95321ab28c - Industria de papel e celulose do Alto Tietê abre i
Parsing: SP Mogi das Cruzes e Suzano - 556eeafe22 - Justiça nega habeas corpus para vereadores e empre
Parsing: SP Mogi das Cruzes e Suzano - c78a5360d6 - Comerciantes de gás do Alto Tietê tentam manter pr
Parsing: SP Mogi das Cruzes e Suzano - 31319b8319 - Home office e ensino à distância aumentam vendas d
Parsing: SP Mogi das Cruzes e Suzano - 43a4027cf7 - VÍDEOS: Diário TV 1ª Edição de sábado, 5 de setemb
Parsing: SP Mogi das Cruzes e Suzano - c81fbb4e86 - PSDB oficializa candidatura de Marcus Melo à Prefe
Parsing: SP Mogi das Cruzes e Suzano - 1c2745d8d8 - Posto da Jucesp, na Associação Comercial de Mogi, 
Parsing: SP Mogi das Cruzes e Suzano - 4aeb91c29c - Mogi-Bertioga tem trânsito intenso na saída para o
Parsing: SP Mogi das Cruzes e Suzano - 58f071b873 - Sem estrutura tecnológica e espaço para estudar à 
Parsing: SP Mogi das Cruzes e Suzano - 3ffec545a6 - Ocupação dos leitos d

Parsing: SP Ribeirao Preto e Franca - 6896b3952b - Ribeirão Preto, SP, confirma 275 novos casos de Co
Parsing: SP Ribeirao Preto e Franca - c0ed7a655b - Pela 2ª semana seguida, Ciclofaixa de Ribeirão Pre
Parsing: SP Ribeirao Preto e Franca - b8602209e6 - VÍDEOS: EPTV1 Ribeirão Preto de sábado, 5 de setem
Parsing: SP Ribeirao Preto e Franca - 38ad557d4c - Fiscais da Prefeitura são ofendidos durante vistor
Parsing: SP Ribeirao Preto e Franca - 68226a7b99 - Franca, SP, registra 64 novos casos de Covid-19 e 
Parsing: SP Ribeirao Preto e Franca - 679fd97d36 - EPTV 1 Ribeirão e Franca ao vivo
Parsing: SP Ribeirao Preto e Franca - fed52a6cee - Prefeitura de Ribeirão Preto, SP, lacra 28 estabel
Parsing: SP Ribeirao Preto e Franca - 74aef66c56 - Oito agências da Caixa abrem neste sábado (5) na r
Parsing: SP Ribeirao Preto e Franca - c6800ac45f - Rede Sustentabilidade oficializa candidatura de Em
Parsing: SP Ribeirao Preto e Franca - 6b63e3422b - VÍDEOS: EPTV2 Ribeirão Preto de sexta-feira, 4 de

Parsing: SP Sao Carlos e Araraquara - 4f8d75192b - Rio Claro confirma mais uma morte e soma 116 óbito
Parsing: SP Sao Carlos e Araraquara - b6a3402733 - Patriota oficializa candidatura de Leandro Guerrei
Parsing: SP Sao Carlos e Araraquara - 08a5d0779d - Carro invade farmácia na Avenida Vaz Filho em Arar
Parsing: SP Sao Carlos e Araraquara - ddaba5f529 - Mesmo com plano de saúde, dentista de Araraquara t
Parsing: SP Sao Carlos e Araraquara - 4886f60c09 - Fiscalização em Araraquara visita 17 estabelecimen
Parsing: SP Sao Carlos e Araraquara - 2525cfe8df - VÍDEOS: EPTV1 São Carlos e Araraquara, de 5 de set
Parsing: SP Sao Carlos e Araraquara - 400cc07e58 - Bombeiros de Araraquara resgatam veado em região d
Parsing: SP Sao Carlos e Araraquara - 7f00995a3e - Idosos e funcionários de asilos e casas de repouso
Parsing: SP Sao Carlos e Araraquara - 6c2a588cab - Força-tarefa realiza operação para coibir 'rachas'
Parsing: SP Sao Carlos e Araraquara - 7cf0a982a3 - Prefeitura de Araras decide não

Parsing: Sergipe - d00e54ac39 - Sergipe tem mais de 73,6 mil registros da Covid-19
Parsing: Sergipe - 5da9a82ea5 - PSTU oficializa candidatura de Gilvaní Santos à Pr
Parsing: Sergipe - c562586ecc - VÍDEOS: SE1 deste sábado, 5 de setembro
Parsing: Sergipe - 6c142c7c34 - Duas pessoas são autuadas durante fiscalização em 
Parsing: Sergipe - 56ae9da4e6 - Secretaria de Saúde de Estância realiza processo s
Parsing: Sergipe - 4a3059fd25 - Suspeitos de roubar celulares no terminal rodoviár
Parsing: Sergipe - a3d35ef94c - VÍDEOS: Bom Dia Sábado deste dia 5 de setembro
Parsing: Sergipe - 31309b4b75 - Suspeito de assaltar loja em Aracaju é baleado por
Parsing: Sergipe - 384a3412ba - VÍDEOS: SE2 desta sexta-feira, 4 de setembro
Parsing: Sergipe - 1a0b24ddc1 - Museu da Gente Sergipana Gov. Marcelo Déda recebe 
Parsing: Sergipe - 51348df287 - Homem é preso suspeito de desviar 70% dos provento
Parsing: Sergipe - 4224dc9d62 - Sebrae vai disponibilizar recursos para projetos d
Parsing: Sergipe - f4cfac

In [10]:
#Loading predictable files
fit_categories = list(feeds.keys())
fit_data = {}
fit_cat_dict = {}

for cat in fit_categories:
    fit_data[cat] = []
    fit_cat_dict[cat] = len(fit_data.keys())
    path = os.path.join(folder_path, cat)
    files = os.listdir(path)
    
    for f in files:
        filepath = os.path.join(path, f)
        fit_data[cat].append(filepath)

In [11]:
#Feature Extract from Text
filenames = list(chain.from_iterable(fit_data.values()))
x_counts = count_vect.transform(filenames)
x_tfidf = tfidf_transformer.transform(x_counts)

In [12]:
predicted = clf.predict(x_tfidf)  


In [13]:
for doc, cat in zip(filenames, predicted):
    file = open(doc, 'r')
    line = file.readline().strip()
    file.close()
    print('%s - %s' %(label_dict[cat], line[:80]))

Brazil - Homem de 32 anos é achado morto por populares em matagal de Rio Branco
Education - Em isolamento social, escola faz show de talentos on-line para estimular alunos 
Brazil - Homem é preso suspeito de atear fogo na casa da irmã em Cruzeiro do Sul (AC)
Nature - Com seca do Rio Acre, Zeladoria faz limpeza às margens do manancial na capital
Politics - Ex-escrivão da Polícia Civil condenado por peculato é preso na zona rural do Acr
Brazil - Jovem de 17 anos desaparece após sair para dormir na casa da vizinha em Rio Bran
Lottery - Sipam prevê sábado (5) com sol e possibilidade de chuvas em algumas regiões acre
Economy - Caixa abre quatro agências neste sábado (5) no Acre para pagamento do auxílio em
Nature - No AC, MPF recomenda alteração em grupo de trabalho do governo para monitorar im
Brazil - Em Rio Branco, 17 bairros ficam sem água após vazamento em Estação de Tratamento
Education - VÍDEOS: Bom Dia Acre de quinta-feira, 3 de setembro
Science_and_Health - Com 25.135 infectados pe

Music - Expocrato terá show 'piromusical' com queima de fogos sem barulho
Music - Palco com capacidade para 100 toneladas é montado para a Expocrato 2018
Brazil - Réveillon de Fortaleza 2018
Brazil - Educador infantil suspeito de estuprar filha no DF é preso em Fortaleza
Brazil - Três pessoas morrem e uma é hospitalizada ao inalar gás tóxico em tanque no Cear
Employment - Senac/CE está com inscrições abertas para curso de chocolates e ovos para a pásc
Turism_and_Travel - Radialista morto em acidente no Beach Park é velado em Sorocaba
Brazil - Homem é retirado à força de casa e é assassinado no meio de rua em Fortaleza
Brazil - Mulher grávida perde filho e tem útero retirado após sofrer assalto no Ceará
Cars - Goiânia tem 605,3 mil carros e possui a 6ª maior frota do país, aponta estudo
Brazil - Grupo suspeito de planejar chacina é preso em Fortaleza
Turism_and_Travel - Radialista morto em acidente no Beach Park é enterrado sob silêncio em Sorocaba
Science_and_Health - Jovem do Ceará co

Brazil - Mulher corre risco de perder bebê após ser agredida a socos e chutes
Brazil - Caminhões batem de frente em MS e uma pessoa fica presa às ferragens
Brazil - Peão pisoteado por touro em rodeio morreu após parada cardiorrespiratória, diz b
Brazil - Polícia investiga morte de mulher encontrada em estrada rural de MS com facada n
Cars - Com investimentos de R$ 675 milhões fábrica de MDF, em Água Clara, chega para 'b
Brazil - Homem morre ao cair de árvore quando tentava pegar pipa em MS
Brazil - 'Tribunal do crime' de facção condenou mecânico morto em MS, aponta investigação
Brazil - Armas, drogas e munições são apreendidas em operação da Polícia Civil em MS
Brazil - Usuário de drogas é morto durante briga perto de casa em MS
Brazil - Tempo muda em Ponta Porã e umidade do ar melhora em 50%
Brazil - Polícia prende 'estuprador em série' que atacou oito crianças em Cuiabá
Science_and_Health - Casal capixaba que morreu na BR-060 passava férias no Mato Grosso do Sul
Science_and_Health - 

Employment - Empresas assinam protocolo com a Prefeitura para crescimento e investimentos em 
Brazil - Vem aí o 5° Mutirão de Castração Solidária; saiba como ajudar
Employment - Processo seletivo para médico psiquiatra e biblioteconomista é aberto em Uberaba
Science_and_Health - Motorista pediu para atuar em resgate de usuário de drogas que o matou a facadas
Technology_and_Games - Espante o frio com um delicioso caldo de legumes; confira a receita
Technology_and_Games - Sobre memórias, experiências e despedidas
Brazil - Homem morre após ser atropelado na BR-116, em Governador Valadares
Brazil - Suspeito de homicídio em Ipaba é preso na casa de familiares em Governador Valad
Brazil - Polícia Militar apreende espingardas utilizadas para caça em Tumiritinga
Brazil - Homem é morto com golpes de enxada e menor de 16 anos é apreendido em Santa Bárb
Brazil - Homem mata ex-cunhado na zona rural de Caraí; suspeito está internado sob escolt
Science_and_Health - Caratinga registra 13 novas mortes

Brazil - Segurança é morto a tiros durante assalto a mercado em Fazenda Rio Grande, diz p
Nature - Veja a transformação da paisagem provocada pela pior seca registrada no Paraná; 
Brazil - Mulher é morta após ser atingida por um tiro em Apucarana; companheiro foi preso
Employment - PDT lança candidatura de Barbosa Neto à Prefeitura de Londrina
Education - Veja o que abre e o que fecha em Curitiba no feriado de Sete de Setembro
Education - No feriado de 7 de setembro, veja o que abre e o que fecha em Londrina e Maringá
Brazil - Veja o que abre e o que fecha durante o feriado de Sete de Setembro, em Guarapua
Nature - 'A Gota d'Água': Voluntários se dedicam em ações para manter a preservação de ri
Education - Coronavírus no Paraná: veja as principais notícias sobre a pandemia
Employment - PSOL define Professor Edmilson como candidato à Prefeitura de Maringá
Brazil - Homem é preso suspeito de abusar sexualmente das filhas em Nova Aurora, diz polí
Economy - Preço da cesta básica cai 3,92% e

Music - Bloco Me Enterra na Quarta homenageia Hermeto e Dominguinhos em festa julina
Technology_and_Games - Tigres escaparam do RioZoo? Não é verdade!
Turism_and_Travel - Bandas que tocaram no carnaval esperam cachê da Prefeitura do Rio há cinco meses
Nature - Parque Nacional do Itatiaia, no Sul do Rio, registra temperatura negativa nesta 
Brazil - Acidente deixa trânsito lento na Via Dutra em Piraí, RJ
Education - Juiz do DF determina bloqueio de bens de Marcelo Crivella e de mais 8 investigad
Education - Câmara aprova MP que liberou R$ 1,2 bilhão para intervenção no Rio de Janeiro
Music - Caminhão com transformador de 480 toneladas passa pela Via Dutra, no Sul do Rio
Brazil - Polícia Federal faz operação contra roubos de carga em AL e mais cinco estados
Science_and_Health - 'Dr. Bumbum' tinha diploma, mas não podia trabalhar como cirurgião plástico: sai
Music - The Voice Brasil: Ivete, Teló, Lulu e Brown contam curiosidades musicais em VÍDE
Music - Nego do Borel chega à DP para depor

Education - Projeto instala pias de uso público para higienização das mãos em comunidades de
Education - Granizo e ventania atingem Vale do Itajaí e causam prejuízos em plantações
Science_and_Health - Joinville revoga decreto de isolamento compulsório para idosos; medida entra em 
Education - #TBT Bonja: ex-alunos relembram momentos especiais no tradicional colégio de Joi
Turism_and_Travel - Cidades do Sul de SC decidem ampliar horário de funcionamento de bares, restaura
Lottery - Sábado deve ter sol na maior parte de Santa Catarina
Education - VÍDEOS: Jornal do Almoço de sábado, 5 de setembro
Brazil - Feriado de Independência começa com mortes em acidentes nas rodovias federais de
Turism_and_Travel - Setor turístico de SC deve aproveitar o feriado de 7 de setembro para testar med
Science_and_Health - SC chega a 2,4 mil mortes causadas pela Covid-19 e registra 1.765 novos casos em
Brazil - Justiça aceita denúncia contra casal suspeito de morte de grávida em SC
Science_and_Health - Acor

Education - VÍDEOS: Jornal da Tribuna 2ª Edição de sexta-feira, 4 de setembro
Turism_and_Travel - Banhistas voltam a lotar praias em SP e cometem irregularidades
Education - VÍDEOS: Bom Dia Região de sexta-feira, 4 de setembro
Science_and_Health - Chef ensina a fazer batata frita, assada e gratinada sem erros; aprenda
Science_and_Health - Mãe de criança com paralisia reclama de elevador de ônibus quebrado em Cubatão, 
Turism_and_Travel - Após fila de carros chegar à cidade vizinha, município do litoral de SP cancela 
Brazil - Carreta pega fogo após pane no freio e interdita rodovia em SP
Science_and_Health - Baixada Santista ultrapassa a marca de 50 mil casos de Covid-19
Cars - Acidente envolvendo dois carros deixa duas pessoas feridas em Mongaguá, SP
Brazil - Policial morto em troca de tiros com a PM respondia a processo demissório
Education - VÍDEOS: Jornal da Tribuna 1ª Edição de sexta-feira, 4 de setembro
Turism_and_Travel - Mais de 100 mil veículos descem sentido litoral paulista 