Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

lemma of feminine words derived from adjectives #78

Open
leoalenc opened this issue Dec 15, 2020 · 5 comments
Open

lemma of feminine words derived from adjectives #78

leoalenc opened this issue Dec 15, 2020 · 5 comments
Assignees
Labels
enhancement New feature or request longrun Will take a long term effort to solve. question Further information is requested

Comments

@leoalenc
Copy link
Contributor

leoalenc commented Dec 15, 2020

O lema do substantivo feminino cheia não deveria ser cheia em vez de cheio, como está atualmente?

nouns/nouns-aa.dict:cheia	cheio+N+F+SG
nouns/nouns-aa.dict:cheias	cheio+N+F+PL

Segundo o dicionário Houaiss, esse substantivo é derivado da forma feminina do adjectivo cheio. O lema de uma palavra derivada, porém, não constitui a base do processo derivacional respectivo, mas a forma de citação da palavra. Por exemplo, os lemas de cafezal, cafezeiro e cafezeiral são cafezal, cafezeiro e cafezeiral, respectivamente, em vez de café:

~/MorphoBr$ grep -E "^cafez[ea]" nouns/*.dict adjectives/*.dict
nouns/nouns-aa.dict:cafezada	cafezada+N+F+SG
nouns/nouns-aa.dict:cafezadas	cafezada+N+F+PL
nouns/nouns-aa.dict:cafezais	cafezal+N+M+PL
nouns/nouns-aa.dict:cafezal	cafezal+N+M+SG
nouns/nouns-aa.dict:cafezeira	cafezeiro+N+F+SG
nouns/nouns-aa.dict:cafezeirais	cafezeiral+N+M+PL
nouns/nouns-aa.dict:cafezeiral	cafezeiral+N+M+SG
nouns/nouns-aa.dict:cafezeiras	cafezeiro+N+F+PL
nouns/nouns-aa.dict:cafezeiro	cafezeiro+N+M+SG
nouns/nouns-aa.dict:cafezeiros	cafezeiro+N+M+PL
adjectives/adjectives-aa.dict:cafezeira	cafezeiro+A+F+SG
adjectives/adjectives-aa.dict:cafezeiras	cafezeiro+A+F+PL
adjectives/adjectives-aa.dict:cafezeiro	cafezeiro+A+M+SG
adjectives/adjectives-aa.dict:cafezeiros	cafezeiro+A+M+PL

Por outro lado, a transformação de um substantivo masculino em feminino (ou o inverso), com alteração de significado não relacionada ao gênero é um processo derivacional, como evidenciam estes exemplos:

~/MorphoBr$ grep -E "[[:space:]]+jarr[oa]\+N\+[FM]" nouns/*.dict
nouns/nouns-ac.dict:jarra	jarra+N+F+SG
nouns/nouns-ac.dict:jarras	jarra+N+F+PL
nouns/nouns-ac.dict:jarro	jarro+N+M+SG
nouns/nouns-ac.dict:jarros	jarro+N+M+PL
~/MorphoBr$ grep -E "[[:space:]]+barc[oa]\+N\+[FM]" nouns/*.dict
nouns/nouns-aa.dict:barca	barca+N+F+SG
nouns/nouns-aa.dict:barcas	barca+N+F+PL
nouns/nouns-aa.dict:barco	barco+N+M+SG
nouns/nouns-aa.dict:barcos	barco+N+M+PL

Como se constata nos exemplos, no caso dos substantivos pluralizáveis, o lema é a forma do singular. No caso dos adjetivos, o lema é a forma de masculino singular. Portanto, o lema do substantivo cheia deveria ser cheia.
Aparentemente, existem 11116 formas análogas com erro análogo de lematização:

~/MorphoBr$ grep -E "^[^[:space:]]+as?[[:space:]]+[^[:space:]]+o\+N\+F" nouns/*.dict | wc -l
11116
grep -E "^[^[:space:]]+as?[[:space:]]+[^[:space:]]+o\+N\+F" nouns/*.dict | tail
nouns/nouns-ae.dict:óptica	óptico+N+F+SG
nouns/nouns-ae.dict:ópticas	óptico+N+F+PL
nouns/nouns-ae.dict:ôntica	ôntico+N+F+SG
nouns/nouns-ae.dict:ônticas	ôntico+N+F+PL
nouns/nouns-ae.dict:última	último+N+F+SG
nouns/nouns-ae.dict:últimas	último+N+F+PL
nouns/nouns-ae.dict:úmbria	úmbrio+N+F+SG
nouns/nouns-ae.dict:úmbrias	úmbrio+N+F+PL
nouns/nouns-ae.dict:única	único+N+F+SG
nouns/nouns-ae.dict:únicas	único+N+F+PL

Curiosamente, a forma ótica, preferida no PB, é lematizada corretamente, diferentemente de óptica, típica do PE:

nouns/nouns-ae.dict:ótica	ótica+N+F+SG
nouns/nouns-ae.dict:óticas	ótica+N+F+PL

Essas incongruências teriam de ser eliminadas. O que acham @vcvpaiva e @arademaker ?

@leoalenc leoalenc added enhancement New feature or request question Further information is requested longrun Will take a long term effort to solve. labels Dec 15, 2020
@leoalenc leoalenc self-assigned this Dec 15, 2020
@arademaker
Copy link
Contributor

Este issue trata de forma mais genérica o caso que acabei de fechar #57 . Lá o ultimo comentário do @leoalenc já chama atenção para a necessidade deste issue aqui mais genérico:

É uma questão de coerência. É preciso ter em conta que substantivos diferem de adjetivos quanto à questão do gênero gramatical: os primeiros têm gênero inerente, os segundos, gênero variável. Essa distinção até foi levada em conta pelo Ranta no GF, onde adjetivos do italiano, que apresentam comportamento semelhante aos do português, são representados como tabelas Gender=>Number=>Str. Desse modo, se, seguindo esses três dicionários, admitimos um substantivo última feminino, o lema precisa ser última e não último, pois não existe, por definição, variação (flexão) de gênero em substantivos. A variação que encontramos em casos como último/última é um epifenômeno. Eu acho que já tivemos uma discussão sobre essa questão mais atrás. Interessante verificar como nosso recurso está tratando palavras como aluna e menina. No dicionário Houaiss, a primeira palavra não consta, apenas o masculino, enquanto a segunda tem verbete próprio, dada a semântica especial, inexistente na primeira (além do sexo do referente).

Sobre menina e aluna eu não entendi qual a proposta de @leoalenc, temos atualmente:

nouns/nouns-ac.dict
24186menina	menino+N+F+SG
24192meninas	menino+N+F+PL

adjectives/adjectives-ad.dict
4206 menina	menino+A+F+SG
4207 meninas	menino+A+F+PL

nouns/nouns-aa.dict
8790 aluna	aluno+N+F+SG
8795 alunas	aluno+N+F+PL

@arademaker arademaker added this to the pre-release 1.0.0 milestone May 31, 2021
@arademaker
Copy link
Contributor

Se entendi corretamente, as entradas para as formas chei[ao]s? agora são:

nouns/nouns-aa.dict
42470cheia	cheia+N+F+SG
42471cheias	cheia+N+F+PL
42478cheio	cheio+N+M+SG
42479cheios	cheio+N+M+PL

adjectives/adjectives-aa.dict
48752cheia	cheio+A+F+SG
48753cheias	cheio+A+F+PL
48762cheio	cheio+A+M+SG
48763cheios	cheio+A+M+PL

E o suporte vem de:

  1. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheio (adj e noun masc)
  2. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheia (noun fem)

arademaker added a commit that referenced this issue May 31, 2021
@arademaker
Copy link
Contributor

commit 6a0c91d não fecha este issue, apenas estou tentando validar meu entendimento para futuras ações.

@leoalenc
Copy link
Contributor Author

leoalenc commented Jun 1, 2021

Se entendi corretamente, as entradas para as formas chei[ao]s? agora são:

nouns/nouns-aa.dict
42470cheia	cheia+N+F+SG
42471cheias	cheia+N+F+PL
42478cheio	cheio+N+M+SG
42479cheios	cheio+N+M+PL

adjectives/adjectives-aa.dict
48752cheia	cheio+A+F+SG
48753cheias	cheio+A+F+PL
48762cheio	cheio+A+M+SG
48763cheios	cheio+A+M+PL

E o suporte vem de:

  1. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheio (adj e noun masc)
  2. https://www.infopedia.pt/dicionarios/lingua-portuguesa/cheia (noun fem)

@arademaker , correto, ver também:

https://www.aulete.com.br/cheio
https://www.aulete.com.br/cheia

@leoalenc
Copy link
Contributor Author

leoalenc commented Jun 1, 2021

Este issue trata de forma mais genérica o caso que acabei de fechar #57 . Lá o ultimo comentário do @leoalenc já chama atenção para a necessidade deste issue aqui mais genérico:

É uma questão de coerência. É preciso ter em conta que substantivos diferem de adjetivos quanto à questão do gênero gramatical: os primeiros têm gênero inerente, os segundos, gênero variável.

Sobre menina e aluna eu não entendi qual a proposta de @leoalenc, temos atualmente:

nouns/nouns-ac.dict
24186menina	menino+N+F+SG
24192meninas	menino+N+F+PL

adjectives/adjectives-ad.dict
4206 menina	menino+A+F+SG
4207 meninas	menino+A+F+PL

nouns/nouns-aa.dict
8790 aluna	aluno+N+F+SG
8795 alunas	aluno+N+F+PL

@arademaker , creio que devamos abrir issue sobre isso, para amadurecer uma solução que atenda o uso principal que se quer dar ao recurso. Na teoria gramatical, normalmente o gênero do substantivo é inerente, inexistindo flexão de gênero, contrariamente ao que preconiza a gramática tradicional. Entendo o lema como chave para a entrada de dicionário. Quando a forma feminina é composicional, ou seja, apenas indica "o feminino de X", onde X é o lema da forma masculina, como no caso de_aluno_ e aluna (não tem verbete próprio no Aulete), então teríamos:

aluna aluno+N+F+SG
alunas aluno+N+F+PL

Esse não é o caso de menina, com verbete próprio no Aulete, no Porto, Houaiss etc., pois não é mero feminino de menino. Sugiro comparar os dois verbetes nos dicionários mencionados. Mas como vamos saber isso automaticamente?

@analununes analununes removed this from the pre-release 1.0.0 milestone Sep 21, 2021
@arademaker arademaker added this to the pre-release 1.0.0 milestone Sep 30, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request longrun Will take a long term effort to solve. question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants