-
Notifications
You must be signed in to change notification settings - Fork 49
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Pasar el diccionario a UTF-8 #17
Comments
Para generar la versión 0.8 incluyendo la última compilación de sinónimos disponible tengo que subir los archivos de sinónimos al repositorio en la carpeta sinonimos/palabras, así como modificar algunos archivos en la carpeta ortograf/docs, lo que podría afectar a tus pruebas de conversión. Preferiría que me des el visto bueno antes de comenzar con ello. |
Por mi parte no hay problema ya que simplemente he hecho el cambio en los fichero de afijos y de palabras. De todas formas, el cambio es sencillo y tengo los comandos que he utilizado por lo que cuando subas los nuevos ficheros y generes la versión 0.8 me la descargaré y pasaré esa versión a UTF-8. |
He añadido el milestone 0.9 porque creo que queremos acometer esto antes de cualquier otra cosa, ¿verdad? |
@Almorca , ¿cómo vas con esto? No he querido tocar nada hasta que nos avises de que has completado la conversión en la codificación. ¿Has encontrado alguna dificultad? |
Acabo de detectar que el script de creación de diccionarios hace referencia a la codificación de archivos, por lo que habrá que corregirlo para que todo siga funcionando bien. No obstante, hay más cosas que revisar en ese script, por lo que soy partidario de crear un issue específico para él, como he comentado en el issue #1. |
El fichero rla-es/ortograf/aspell/es.dat contiene la línea |
Habría que consultarlo con Ismael Olea, que creo que fue quien se encargó Saludos, Santiago El 9 de septiembre de 2015, 18:17, Almorca notifications@github.com
|
Cámbialo, aunque por lo que he leído, no será suficiente: De todas formas, hago ping a @olea por si puede echarle un ojo. Tampoco sé si hoy en día Aspell se sigue usando, porque parece que Hunspell domina la escena de código abierto (pero puedo estar equivocado). |
Acabo de subir los cambios que he realizado para pasar el diccionario a UTF-8. |
Solo para que quede registrado (y porque es buena costumbre), este es el changeset que corresponde a este issue: |
Añado a utf-8 los ficheros de noRAE que se me había pasado añadir.
|
Voy a intentar estos días hacer pruebas para pasar el diccionario a UTF-8 y ver si para cuando se publique la versión 0.8 podemos trabajar con el diccionario en este nuevo formato.
Por ahora no subiré nada al repositorio pero iré informando del resultado de las pruebas.
The text was updated successfully, but these errors were encountered: