Skip to content

Kiriwill/parser-api

Repository files navigation

Aspectos técnicos e regras utilizadas na construção do Parser Parsero (PNL)

O Parser Sintático para o Português Brasileiro Parsero foi uma pesquisa realizada no Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas da FATEC – Faculdade de Tecnologia do Estado de São Paulo, no âmbito da CEPE - Câmara De Ensino, Pesquisa e Extensão – Fatec Ipiranga. Para tanto, foram utilizados os conceitos da Gramática Gerativa de Chomsky (2014; 2015), com adaptações propostas por Othero (2009) para atender às especificidades do Português Brasileiro e, além disso, com adaptações que foram necessárias para atender às especificidades deste projeto. A pesquisa utilizou como corpus para a construção de um banco de dados do léxico o recurso DELAF_PB - Dicionário de Palavras Simples Flexionadas para o Português Brasileiro, arquivo com aproximadamente 880.000 palavras.

O processador sintático Parsero foi desenvolvido em linguagem GO sob o padrão MVC (Modelo-Visão-Controlador), que é uma base comum para muitos modelos baseados em Web. O programa é uma API (Application Programming Interface) criada com a biblioteca Gorilla Mux. Esse padrão de projetos MVC tem três partes, assim utilizadas em nosso Parser: no Modelo, primeira parte, ficam as funções para consulta e inserção dos dados na base léxica, a qual foi descrita na seção anterior. A Visão, segunda parte, abriga um único endereço que, ao ser chamado, aciona o Controlador, terceira parte, em que estão abrigadas as instruções do algoritmo. O Controlador, então, executa as seguintes tarefas: recebe a sentença, consulta a base de dados e retorna as possibilidades de classificação para cada palavra. Depois disso, recebe esse resultado e percorre as regras de produção, as quais detalharemos nesta seção (Quadro 1) até encontrar uma válida para a sequência. No final, retorna um arquivo de texto com as unidades lexicais rotuladas de acordo com suas categorias, agrupadas em sintagmas e encapsuladas em formato (JSON) JavaScript Object Notation.

A pesquisa completa pode ser encontrada em: Parser Sintático para o Português Brasileiro: desafios e soluções

About

API para o Lexico e Processador do Parser

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published