Classificação dos Diários da AMUPE

Projeto da disciplina de Inteligência Artificial - Universidade de Pernambuco - POLI

Feito em grupo, com a participação de:

Este projeto foi desenvolvido com o intuito de auxiliar o Tribunal de Contas do Estado de Pernambuco a classificar publicações do Diário Oficial da AMUPE com base na modalidade, tipo de publicação e presença de festividade através do uso de técnicas de Inteligência Artificial.

O Dataset.ipynb mostra o processo de extração das publicações a partir dos PDFs dos Diários. Aqui conseguimos construir a base de dados com todas as informações relevantes para o futuro agrupamento e classificação.

No Word2Vec com TF-IDF.ipynb fizemos o agrupamento dos dados, separados por frases, com o intuito de gerar vetores para cada palavra e atibuí-las pesos de acordo com o seu valor TF-IDF médio ao longo das publicações.

Em Tensorflow.ipynb realizou-se o treinamento das redes neurais necessárias para a realização da classificação. Ela detalha da criação dos datasets, com divisões de treino e teste, até a arquitetura e treinamento das redes. Os resultados das melhores épocas foram salvos na pasta Modelos.

Por fim, Resultado.ipynb traz o produto final para o cliente. Nele, são unidas todas as tecnologias dos outros três arquivos para construir uma ferramenta poderosa que consegue a partir do texto de uma publicação extrair os tipos de publicação, modalidade e festividade em probabilidades conjuntas para cada uma das frases do texto, considerando os topn resultados mais relevantes.

Da perspectiva do cliente, ele precisará interagir apenas com uma função, avaliar(publicacao, topn), que tem as entradas e saídas destrinchadas anteriormente. Note que como o projeto foi desenvolvido no Google Drive e Colab, caso se deseje rodar localmente algumas mudanças deverão ser realizadas para acomodar o caminho dos arquivos e baixar as bibliotecas necessárias à execução do projeto.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Modelos

Modelos

Dataset.ipynb

Dataset.ipynb

README.md

README.md

Resultado.ipynb

Resultado.ipynb

Tensorflow.ipynb

Tensorflow.ipynb

Word2Vec com TF-IDF.ipynb

Word2Vec com TF-IDF.ipynb

Repository files navigation

Classificação dos Diários da AMUPE

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Modelos		Modelos
Dataset.ipynb		Dataset.ipynb
README.md		README.md
Resultado.ipynb		Resultado.ipynb
Tensorflow.ipynb		Tensorflow.ipynb
Word2Vec com TF-IDF.ipynb		Word2Vec com TF-IDF.ipynb

PedrolyraC/classificacao_dos_diarios_da_amupe

Folders and files

Latest commit

History

Repository files navigation

Classificação dos Diários da AMUPE

About

Resources

Stars

Watchers

Forks

Languages