Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

diminutivos mal formados #72

Open
leoalenc opened this issue Feb 18, 2020 · 3 comments
Open

diminutivos mal formados #72

leoalenc opened this issue Feb 18, 2020 · 3 comments
Assignees
Labels
bug Something isn't working

Comments

@leoalenc
Copy link
Contributor

leoalenc commented Feb 18, 2020

Cerca de 6500 erros foram encontrados nos diminutivos gerados a
partir dos substantivos e adjetivos provenientes dos recursos
incorporados. Esses erros decorrem (i) de falhas na filtragem de bases
e na modelação dos processos morfológicos e (ii) erros dos recursos
utilizados, tais como relatados em #64, #65, #66, #67, #68, #70 e #71.
Os erros do primeiro tipo distribuem-se nas seguintes classes
principais:

  1. Abreviaturas, letras, símbolos químicos etc. como BCG, b, Ba, Br e
    Bq não podem funcionar como bases de processos morfológicos de
    derivação:
BCGzinho        bcg+N+DIM+M+SG
Bazinho ba+N+DIM+M+SG
Bazinhos        ba+N+DIM+M+PL
Binha   ba+N+DIM+M+SG
Binhas  ba+N+DIM+M+PL
Bqzinho bq+N+DIM+M+SG
Brzinho br+N+DIM+M+SG
Bzinho  b+N+DIM+M+SG
  1. Plural de diminutivos derivados de bases em -ão ou de compostos (a base ou o primeiro membro do composto deve estar no plural):
abalroaçãozinhas        abalroação+N+DIM+F+PL
cabeça-chatazinhos      cabeça-chata+N+DIM+M+PL
  1. Diminutivos derivados de compostos (o primeiro membro não deve
    perder o acento):
ze-povinhozinho      zé-povinho+N+DIM+M+SG
@leoalenc leoalenc added the bug Something isn't working label Feb 18, 2020
@leoalenc leoalenc self-assigned this Feb 18, 2020
leoalenc added a commit that referenced this issue Feb 18, 2020
leoalenc added a commit that referenced this issue Feb 18, 2020
arademaker pushed a commit that referenced this issue Jun 2, 2020
* issue #72: updating readme

* issue #72: updating readme

* issue #72 bug fixes in finite-state source code, readme updates

* issue #72 including Python module for the extraction of noun and adjective bases

* issue #72 including Python module for the extraction of noun and adjective bases
@arademaker
Copy link
Contributor

@leoalenc este issue foi fechado com o PR #73 ? No PR vc menciona que o script teria que ser rodado nos dados, avise se for o caso e como exatamente rodar se vc quiser que eu rode.

@leoalenc
Copy link
Contributor Author

leoalenc commented Jun 4, 2020

@arademaker, como expliquei, foram detectados dois tipos de erros nos novos diminutivos: o primeiro tipo são os de modelagem, o segundo tipo são erros dos recursos utilizados como entrada do programa de geração de diminutivos. O primeiro tipo de erro, que inclui o maior número de casos, foi corrigido com o PR. No entanto, vários erros dos recursos que utilizamos ainda não foram corrigidos, assunto das questões #64 a #68, #70 e #71. Proponho, então, que fechemos estas questões antes de rodar o script para gerar as novos diminutivos. Vamos dividir essas questões entre nós? Depois, seria interessante se você ou o @lucasrct rodasse o script pra ver se as minhas instruções de uso estão claras. Então, poderemos fechar esta questão.

@leoalenc
Copy link
Contributor Author

leoalenc commented Jun 4, 2020

@arademaker, para gerar o script com os novos diminutivos, precisamos resolver #64, #65 e #68. As demais questões são de longo prazo, podemos deixar para o futuro.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

3 participants