Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Separación de sílabas (round 2) #33

Closed
introlinux opened this issue Sep 14, 2015 · 4 comments
Closed

Separación de sílabas (round 2) #33

introlinux opened this issue Sep 14, 2015 · 4 comments
Labels
Milestone

Comments

@introlinux
Copy link

Hola de nuevo, he encontrado lo que estaba buscando. Se llama LireCouleur (http://lirecouleur.arkaline.fr/presentation/), separa las palabras en sílabas con un arco y cambia las sílabas de color. Es interesante desde un punto de vista didáctico, sobre todo para aprender a tildar. Muchas palabras funcionan bien, pero cuando empiezas a probar con hiatos o triptongos la cosa se lía un poco.
He mirado las tripas y está programado en Python. Entiendo más o menos bien el funcionamiento, pero al estar todo todo TODO en francés (nombres de variables, nombres de funciones, notas, comentarios, salidas, etc...) me resulta muy complicado y me preguntaba si habría alguien en el equipo de rla-es o algún conocido que me pudiera echar un cable.
Gracias de antemano.

@RickieES
Copy link
Collaborator

Pues yo poco te puedo ayudar en las dos cuestiones relacionadas con lenguaje/idioma: no sé francés, y no sé Python (al cual, además, le tengo manía y no me veo a corto plazo aprendiéndolo).

Seguramente la mejor opción, pero muy dependiente del autor, sería convencerle para que el código usara nombres en inglés.

@RickieES
Copy link
Collaborator

RickieES commented Jul 9, 2016

Yo creo que no hay mucho más que aportar en este issue y podríamos cerrarlo, ¿verdad?

@cosmoscalibur
Copy link
Collaborator

Yo veo posiblemente un problema respecto al tema, pero la verdad con el comentario del issue no me es clara la intención realmente. Lo que buscaba @introlinux es la característica visual o una herramienta para automatizar la generación de sílabas para este diccionario.
El problema con LireCouleur es seguir dependiendo de los patrones de los diccionarios de hunspell, y es allí donde se podría ver la dificultad en la separación. Simplemente si el patrón no existe, habrá problemas (probablemente usa un conjunto básico de reglas para esos casos, pero la herramienta esta pensada para el francés). En ese sentido, lo mismo hace pyphen para lograr la separación de palabras (pero en consola).
Para ayudarnos a separar las silabas, necesitamos propiamente una herramienta que contenga no un diccionario sino las reglas. El problema en ello radica que lo principal en el tema, ha sido trabajado para el inglés, al punto que el algoritmo estándar para ello es el trabajo de Franklin Mark Liang, y es el algoritmo usado en LaTeX (buscando un buen diccionario para usar en LaTeX hallé este proyecto) cuando no hay un diccionario asociado (funciona excelente para el inglés y el alemán, pero no mucho en español). Una implementación en python (y legible -es en inglés-) que puede servir de referencia es la publicado por Ned Batchelder, disponible como dominio público. Habría que meterle mano para adaptarlo al español o empezar desde el inicio. En mi tiempo libre puedo trabajar en esta idea (y hay una estudiante a quien le había propuesto hace poco este mismo problema, de manera que si acepta, seríamos dos personas).

@RickieES RickieES added this to the Después milestone Jan 4, 2019
@Almorca
Copy link
Collaborator

Almorca commented Apr 7, 2020

Cierro el issue por inactividad.

@Almorca Almorca closed this as completed Apr 7, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

5 participants