Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Palabras faltantes en el diccionario #6

Closed
RickieES opened this issue Jul 22, 2014 · 8 comments
Closed

Palabras faltantes en el diccionario #6

RickieES opened this issue Jul 22, 2014 · 8 comments
Assignees
Labels
Milestone

Comments

@RickieES
Copy link
Collaborator

Corresponde al registro 758 de de RLA-ES en Forja.rediris.es
Creado por Roberto Isaac González Gracia (riggr) con fecha y hora 2013-10-08 04:43

Hola:

las siguientes palabras no están en el diccionario:

victimizar, victimizada, 170,000 resultados en google.

ganoso, no está en el diccionario pero si está en los sinónimos, por lo que habria que agregarla.82,000 resultados en google.

la palabra lonja si está en el diccionario, al consultar sinónimos presenta un registro en blanco con el numero 3.

@sbosio sbosio added this to the Después milestone Aug 17, 2014
@RickieES RickieES modified the milestones: Versión 2.1, Después Dec 5, 2015
@edittler
Copy link
Collaborator

Éste es un issue pequeño, lo podría revisar y, de paso, aprender un poco sobre cómo armar el diccionario.

Victimizar, aparece en RAE y tiene 87.000 resultados en Google. Iría en RAE/VerbosTransitivos.txt.
Victimizada tiene 110.000 resultados en Google. Como conjugación del anterior, tengo que verificar si ya existe una regla para ese sufijo.
Ganoso/a aparece en RAE y tiene 122.000/203.000 resultados en Google respectivamente.

El error de sinónimos de la palabra lonja no lo pude reproducir. Estoy usando el diccionario 2.0 en LibreOffice 4.2.8 (el que se encuentra en los repositorios de Ubuntu 14.04)

@RickieES
Copy link
Collaborator Author

Me parece genial. 👍

A los verbos hay que añadirles normalmente los sufijos "R" y "E" y, para el participo de este, que es regular, "D". Quedaría así:

victimizar/RED

Puede ser que haya que añadirle alguno más, pero lo los sufijos es un mundo y es casi mejor esperar a que detectemos en el uso cotidiano que falta alguna variante válida a añadir sufijos que creen palabras no válidas.

Ganoso es un adjetivo e iría en RAE/Adjetivos.txt. En nombres y adjetivos, los sufijos más habituales son G (de "género") y S (plural):

ganoso/GS

Y yo tampoco puedo reproducir el problema del sinónimo de lonja en LibreOffice 4.4.3.2 (Linux Mint 17.2).

@RickieES
Copy link
Collaborator Author

Estoy encontrando otros sufijos aplicables a victimizar:

  • Ì (victimízala/s, victimízalo/s)
  • Î (victimízale/s)
  • Ù (victimícela/s, victimícelo/s, victimícenla/s, victimícenlo/s)
  • Ú (victimíceme, victimícenme, victimícenos, victimícennos)
  • ô (victimízate)
  • ø (victimícese, victimícense)

Si no me equivoco, al generar el diccionario para una variante regional con voseo, como es_AR, el sufijo R se toma de l10n/es_XX/afijost.txt y esa versión tiene previsto el voseo. Por eso es tan importante que, si modificamos algún afijo, lo repliquemos a mano en el archivo afijos.txt de todas las variantes regionales.

@sbosio
Copy link
Owner

sbosio commented Jan 30, 2016

Solo a los efectos de aclarar mejor el concepto con los verbos.

Las banderas "R" y "D" se usan en todos los verbos regulares y en los que
son irregulares en los presentes de indicativo y subjuntivo. Creería que la
gran mayoría de los casos están contemplados, pero podría suceder que justo
la terminación de un verbo irregular no esté implementada en las reglas. Yo
he implementado todas las de los verbos irregulares que la RAE considera
verbos "modelo" con sus correspondientes alteraciones ortográficas que he
podido detectar, pero no puedo estar seguro de que esté el 100% de los
verbos modelos implementados. No pasa así con los regulares que tienen
pocas terminaciones y alteraciones ortográficas y están todas implementadas.

Adicionalmente, los verbos regulares requieren la bandera "E" y los
irregulares la "I", que son las reglas que implementan precisamente las
derivaciones de las pocas conjugaciones de los presentes de indicativo y
subjuntivo donde estos grupos de verbos difieren (todas las formas comunes
a los dos grupos los implementa la regla "R") y la regla "D" introduce las
formas conjugadas de los participios (es la que generaría el lema
"victimizada", por ejemplo).

Los verbos irregulares de futuros, condicionales, etc. tienen el problema
de que hay que implementar reglas específicamente para ellos. También
incorporé la gran mayoría hasta donde pude detectarlos (son las formas
generadas por la regla "X" y creo que en la mayoría de los casos admiten la
regla "D" ya que para la generación de participios generalmente se
comportan igual que los regulares. Excepto algunos participios irregulares
específicos que tienen su propio fichero donde se van listando. Por último
está el caso de los completamente irregulares cuyas formas se listan
también en un fichero específico (caso del verbo "ir", por ejemplo).

Saludos,

Santiago

https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail
Este
correo electrónico se ha enviado desde un equipo libre de virus y protegido
por Avast.
www.avast.com
https://www.avast.com/sig-email?utm_medium=email&utm_source=link&utm_campaign=sig-email&utm_content=webmail
<#DDB4FAA8-2DD7-40BB-A1B8-4E2AA1F9FDF2>

El 30 de enero de 2016, 8:26, Ricardo Palomares notifications@github.com
escribió:

Me parece genial. [image: 👍]

A los verbos hay que añadirles normalmente los sufijos "R" y "E" y, para
el participo de este, que es regular, "D". Quedaría así:

victimizar/RED

Puede ser que haya que añadirle alguno más, pero lo los sufijos es un
mundo y es casi mejor esperar a que detectemos en el uso cotidiano que
falta alguna variante válida a añadir sufijos que creen palabras no válidas.

Ganoso es un adjetivo e iría en RAE/Adjetivos.txt. En nombres y adjetivos,
los sufijos más habituales son G (de "género") y S (plural):

ganoso/GS

Y yo tampoco puedo reproducir el problema del sinónimo de lonja en
LibreOffice 4.4.3.2 (Linux Mint 17.2).


Reply to this email directly or view it on GitHub
#6 (comment).

@edittler
Copy link
Collaborator

Ya apliqué los cambios correspondientes y están disponibles en el pull request #53.

He generado el diccionario y ya reconoce como válido ganoso (con su genero femenino y plurales) y victimizar con sus respectivas conjugaciones (resultando más de 50 palabras válidas).

EDIT: Me olvidé de comentar que los scripts para generar los diccionarios no me andaban. Se ve que cuando se convirtieron a UTF-8, también se cambió el final de línea por CRLF, el cual a mi SO no le gusta. Si es algo generalizado se podría crear un issue correspondiente para corregir y probar todos los scripts.

RickieES added a commit that referenced this issue Jan 30, 2016
Issue #6 - Añado el verbo transitivo "victimizar" y el adjetivo "ganoso"
@RickieES
Copy link
Collaborator Author

@sbosio, muchas gracias como siempre por tu explicación. Creo que voy a copiarla en una página del wiki como ayuda para quien quiera colaborar (incluyéndome a mí). 😄

@edittler
Copy link
Collaborator

Concuerdo, muy buena la aclaración de @sbosio.
Cuando más se pueda documentar el proyecto, mejor para los que nos iniciamos como colaboradores.

Por lo pronto, este issue ya estaría resuelto, puede ser cerrado.

@RickieES
Copy link
Collaborator Author

Ayer añadí la página al wiki con el contenido de Santiago y alguna otra cosilla.

Cierro el issue.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants