Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Palabras faltantes y propuesta #8

Closed
RickieES opened this issue Jul 22, 2014 · 21 comments
Closed

Palabras faltantes y propuesta #8

RickieES opened this issue Jul 22, 2014 · 21 comments
Assignees
Labels
Milestone

Comments

@RickieES
Copy link
Collaborator

Corresponde al registro 770 de de RLA-ES en Forja.rediris.es
Creado por Daniel Gómez Martínez (dagomezma) con fecha y hora 2013-11-18 05:52

Hola a todos, soy nuevo en el proyecto y quería empezar este nuevo hilo en el foro para discutir con todos una propuesta que tengo, dos preguntas, y para informar sobre algunas palabras faltantes.

Empezaré con las preguntas:

  • ¿Para las palabras se pueden definir reglas para que las marque como error si no están escritas con mayúscula al inicio? Esto sería especialmente útil para los apellidos y topónimos.
  • ¿Valdría la pena incluir los nombres propios que sean de compañías, organizaciones, software, etc. ampliamente conocidas?

Propuesta:

  • He notado que dentro del repositorio actual los nombres propios (o por lo menos los que he visto) se encuentran en el archivo ...palabras/noRAE/NombresPropiosSiglas.txt. Pienso que sería más organizado si la sección «toponimos/» que acompaña a RAE/ y noRAE/ pasa a formar parte de noRAE/, aunque me parecería incluso mejor que haya una nueva sección dentro de «palabras/» que se llame NombresPropiosSiglas y que contenga:
  • l10n // en donde irían los archivos aquí abajo para cada localización específica
  • apellidos.txt // en donde irían los apellidos más comunes del español en general
  • nombres.txt // en donde irían los nombres más comunes del español en general
  • siglas.txt
  • toponimos.txt // en donde irían los países del mundo.

Además, en cuanto tenga algo de tiempo agregaré los topónimos más importantes de Colombia dentro de la localización específica.

Palabras faltantes:

Palabras que sí están en el diccionario de la RAE:

  • hadrón
  • hadrones
  • quarks (plural de quark, que ya está en RLA)
  • graficar y todas sus conjugaciones
  • concadenar y todas sus conjugaciones
  • multímetro

Palabras que no están en el diccionario de la RAE:

  • geotérmica (como en planta de energía geotérmica)
  • capacitor (es a capacitancia como resistor a resistencia)
  • mecatrónica (relativo a mecánica y electrónica)
  • óhmetro (mide la resistencia de un resistor/resistencia)
  • transconductancia (es una de las variables físicas que describe el comportamiento de un transistor)

Estas irían para ...noRAE/Adverbios.txt

subsecuentemente (subsecuente sí está en dicc. RAE)
concatenadamente
concadenadamente
concéntricamente

@sbosio sbosio added this to the Después milestone Aug 17, 2014
@RickieES
Copy link
Collaborator Author

No voy a hacer cambios hasta que acabemos de publicar la versión 2.1, pero voy a comenzar respondiendo a las preguntas que hizo el autor del bug original en Forja:

¿Para las palabras se pueden definir reglas para que las marque como error si no están escritas con mayúscula al inicio? Esto sería especialmente útil para los apellidos y topónimos.

Las palabras que se añaden con mayúscula inicial solo se admiten como correctas si se escriben con mayúsculas inicial. Puedes probar con un nombre propio como, por ejemplo, Alejandro.

¿Valdría la pena incluir los nombres propios que sean de compañías, organizaciones, software, etc. ampliamente conocidas?

Este tema se ha tratado varias veces. Hay algunos nombres incluidos en NombresPropiosSiglas.txt de las distintas variantes y para la versión genérica, pero dado que Apache OpenOffice y LibreOffice incluyen su propia lista de nombres propios de compañías y productos de software, entre otros, no hemos querido dedicar mucho tiempo a esa lista por el momento.

@RickieES
Copy link
Collaborator Author

He notado que dentro del repositorio actual los nombres propios (o por lo menos los que he visto) se encuentran en el archivo ...palabras/noRAE/NombresPropiosSiglas.txt. Pienso que sería más organizado si la sección «toponimos/» que acompaña a RAE/ y noRAE/ pasa a formar parte de noRAE/,

En mi opinión, los topónimos no son RAE ni no-RAE. Lo que sí es verdad es que, buscando dentro de noRAE/l10n/es_XX/NombresPropiosSiglas.txt, he encontrado topónimos que habría que extraer. Para esto necesitaremos la ayuda de colaboradores de cada localización, que son los que mejor van a conocer los nombres de ciudades, provincias, estados, accidentes geográficos, etc.

aunque me parecería incluso mejor que haya una nueva sección dentro de «palabras/» que se llame NombresPropiosSiglas y que contenga:

l10n // en donde irían los archivos aquí abajo para cada localización específica
apellidos.txt // en donde irían los apellidos más comunes del español en general
nombres.txt // en donde irían los nombres más comunes del español en general
siglas.txt
toponimos.txt // en donde irían los países del mundo.

Separar las siglas me parece una buena idea. Separar apellidos de nombres lo veo ya más complicado (por ejemplo, Alonso es nombre y apellido a la vez), y los topónimos ya los tenemos estructurados en varios archivos según su naturaleza. Estaría bien que opináramos todos sobre estas sugerencias para encontrar una posición común.

@RickieES
Copy link
Collaborator Author

concadenar ya está reconocida en la versión en desarrollo 2.1 del diccionario. El resto las examinaremos tras la publicación de la versión 2.1 del diccionario.

@Almorca
Copy link
Collaborator

Almorca commented Mar 27, 2016

Sobre la organización del repositorio no tengo ninguna preferencia así que me quedo con la opción que menos trabajo implique.

@RickieES RickieES self-assigned this Apr 5, 2016
@RickieES RickieES modified the milestones: Versión 2.2, Después Apr 5, 2016
@edittler
Copy link
Collaborator

edittler commented Apr 6, 2016

La organización de topónimos creo que ya estaría resuelta. De hecho me encantó como están ordenados los topónimos de España. Quizás haga lo mismo para Argentina (y quizás también para Uruguay que es un país hermano 😉).
Por cierto, estaría bueno contactarse con Daniel Gómez Martínez (dagomezma) para que incluya los topónimos de Colombia.

Con respecto a nombres y apellidos, los mantendría en NombresPropiosSiglas.txt extrayendo las siglas a Siglas.txt y renombrando el anterior a NombresPropios.txt. Si por mí fuera, separaría los nombres y apellidos, pero por ahora me parece irrelevante (y nos evitamos decidir la política de inclusión de nombres propios cuando se usa tanto como nombre y apellido).

El asunto de las palabras faltantes te lo dejo a vos @RickieES 😊

@RickieES
Copy link
Collaborator Author

RickieES commented Jul 2, 2016

Voy con las palabras que se pedían añadir:

  • hadrón, hadrones: añadido en RAE/NombresMasculinos.txt como hadrón/S
  • quarks (plural de quark, que ya está en RLA): pues no tengo tan claro que quark esté admitido por la RAE, ya que redirige a "cuark".

http://dle.rae.es/?w=quark

Creo que hay una diferencia entre que la palabra esté recogida y que esté admitida, pero tampoco sé cómo podemos distinguir unas de otras. Por de pronto, lo que sí voy a añadir es "cuark", en RAE/NombresMasculinos.txt como cuark/S.

  • graficar y todas sus conjugaciones: graficar es propio de Argentina, Chile, Cuba, El Salvador y Uruguay, de modo que lo añado solo en esas localizaciones, en todos los casos en VerbosTransitivos.txt, como graficar/RED.
  • concadenar y todas sus conjugaciones: como dije, esta palabra ya está incluida en nuestro diccionario.
  • multímetro: añadido en NombresMasculinos.txt como multímetro/S

El mensaje con el commit debe de estar encima o debajo de este comentario.

@RickieES
Copy link
Collaborator Author

RickieES commented Jul 2, 2016

Vamos con el segundo lote de palabras:

  • geotérmica (como en planta de energía geotérmica): geotermia sí está admitida por la RAE, así que voy a añadir geotermia en RAE/NombresFemeninos.txt como geotermia (sin sufijos) y getoérmica en noRAE/Adjetivos.txt como geotérmico/GS
  • capacitor (es a capacitancia como resistor a resistencia): efectivamente, no está admitido por la RAE. Buscando en el CORPES da una frecuencia normalizada de apariciones de 0,19 por millón. Por comparar, geotermia ofrece 0,45 y geotérmico 1,69. A priori, no soy partidario de añadirla.
  • mecatrónica (relativo a mecánica y electrónica): ídem, ofrece una frecuencia normalizada de 0,20 por millón.
  • óhmetro (mide la resistencia de un resistor/resistencia): no está admitida, y no se encuentra ningún caso en el CORPES. No la añado de momento.
  • transconductancia (es una de las variables físicas que describe el comportamiento de un transistor): como con óhmetro.

Y de los adverbios:

  • concadenadamente
  • concatenadamente
  • concéntricamente
  • subsecuentemente

todos me parecen razonables y, efectivamente, ninguno está recogido en la RAE (aunque creo que todos estarían admitidos), así que los añado en noRAE/Adverbios.txt, como se sugería.

El commit aparece a continuación.

@RickieES
Copy link
Collaborator Author

RickieES commented Jul 2, 2016

Las palabras que quedan pendientes son:

  • quark (recogido, pero no sé si admitido por la RAE)
  • capacitor
  • mecatrónica
  • óhmetro
  • transconductancia

De las cuestiones sobre organización de archivos, lo que parece que plantea más consenso sería separar las siglas a un archivo propio Siglas.txt y renombrar el archivo actual a NombresPropios.txt. Como comenté, lo de separar nombres de apellidos lo veo un poco subjetivo y no sé si muy importante en relación al trabajo que ocasionaría.

@edittler
Copy link
Collaborator

edittler commented Jul 2, 2016

Yo agregaría la palabra "capacitor". Soy estudiante de ingeniería y es una palabra que se usa mucho. Inclusive así figura la palabra en las traducciones oficiales de los libros más populares del área de Física e Ingeniería.

Puede ir dentro de no RAE.

@Almorca
Copy link
Collaborator

Almorca commented Jul 3, 2016

Pues confirmo que quark no está aceptado ( https://twitter.com/almorca_es/status/749510719620743168 )
Capacitor no la añadiría ya que en español tenemos la palabra condensador.

El resto de palabras son muy específicas y no tengo claro si merece la pena añadirlas.

@edittler
Copy link
Collaborator

edittler commented Jul 3, 2016

En Argentina no conozco a nadie que use la palabra "condensador". Los libros que mencioné son de editoriales mexicanas. ¿Se podría agregar "capacitor" a no RAE en los países latinoamericanos?

Dato de color: una búsqueda de cada término en Google me da la siguiente cantidad de resultados

  • condensador: Cerca de 920,000 resultados
  • capacitor: Cerca de 44,100,000 resultados

@RickieES
Copy link
Collaborator Author

RickieES commented Jul 4, 2016

@ezeperez26, ¿crees que podríamos obtener una referencia de en qué países es habitual el uso de "capacitor" en lugar de "condensador"? O, si no, ¿tú podrías darnos una referencia inicial para añadir la palabra en esas localizaciones y luego extenderla a otros según se vaya requiriendo?

Confieso que, a mí, "capacitor" me suena a calco del inglés más que a construcción derivada del verbo capacitar. El aparato en sí no capacita (habilita) nada, sino que condensa o recoge energía eléctrica (entiendo que lo de recoger es por lo que en inglés se le llama capacitor, por lo que le cabe, por su capacidad).

@edittler
Copy link
Collaborator

edittler commented Jul 5, 2016

Ricardo, en varios lados, por ejemplo en Wikipedia, se dice que el término capacitor es un anglicismo de la palabra capacitor.

Con respecto a los países, en Argentina se usa hasta en instituciones de educación superior (lo puedo decir como alumno universitario).
Como dije anteriormente, la bibliografía traducida en español utilizada también utiliza la palabra "capacitor", al menos el libro de Resnick, Fisica Vol 2. Hay otros libros muy populares como Alonso Finn, Sears Semansky, Tipler que no tengo a mano para comprobar.

No seguiré insistiendo en el tema (veo que hay resistencia a agregarla), pero es un término que se encuentra muy asimilado en el lenguaje argentino, a tal punto que la palabra condensador nos queda extraño al referirnos al dispositivo electrónico, asociándolo más a los condensadores de heladeras.

A las estadísticas de uso por países te las debo. En los corpus de RAE no parece haber textos científicos, o parece que no incluye los textos traducidos (en la ciencia, los mejores libros son en inglés).

@Almorca
Copy link
Collaborator

Almorca commented Jul 5, 2016

Me parece que van a sugir casos dónde haya diferente criterio entre el español de América latina y de España sobre todo en términos tecnológicos. Para mí el caso más sonado es la eterna discusión de la Wikipedia entre mouse/ratón de ordenador. En la mayoría de casos América latina está más influenciada por palabras inglesas que España, sin embargo la RAE es muy reacia a incluir estas palabras.
Si buscamos en Google scholar podemos comparar el uso académico de capacitor [ https://scholar.google.es/scholar?hl=es&q=capacitor&btnG=&lr=lang_es ] y condensador [ https://scholar.google.es/scholar?q=condensador&btnG=&hl=es&lr=lang_es&as_sdt=0%2C5 ] y condensador tiene más resultados.
He planteado una consulta a la académia argentina (se puede hacer en http://www.aal.edu.ar/node/186 ). Con lo que me respondan os digo y tomamos una decisión.

P.D. Perdonad el cierre de la incidencia pero se me ha ido el dedo.

@Almorca Almorca closed this as completed Jul 5, 2016
@Almorca Almorca reopened this Jul 5, 2016
@RickieES
Copy link
Collaborator Author

RickieES commented Jul 5, 2016

Yo iba a mencionar justo el caso de mouse. Como creo que mouse sí está añadido para es-AR, no creo que haya problema en añadirlo para capacitor, pero ya que has hecho la consulta, mejor esperamos. 👍

@sbosio
Copy link
Owner

sbosio commented Jul 5, 2016

Yo coincido en que al menos en Argentina está más extendido el uso del
anglicismo capacitor, en vez de condensador. Además, para referirse a la
persona que capacita se utiliza 'capacitador' (término que tampoco recoge
la RAE).

El martes, 5 de julio de 2016, Ricardo Palomares notifications@github.com
escribió:

Yo iba a mencionar justo el caso de mouse. Como creo que mouse sí está
añadido para es-AR, no creo que haya problema en añadirlo para capacitor,
pero ya que has hecho la consulta, mejor esperamos. 👍


You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
#8 (comment), or mute
the thread
https://github.com/notifications/unsubscribe/ABO0GPsT_nF71Rdh-r9D-q7M9s-ZV0z5ks5qSh7pgaJpZM4CPtZg
.

@edittler
Copy link
Collaborator

edittler commented Jul 5, 2016

Envié una consulta a Fundeu, me respondieron lo siguiente:

Se trata de un nombre ideado con el fin de crear una terna de términos uniformes: resistor, inductor, capacitor. Al no haber salido del ámbito técnico es normal que el DRAE no lo incluya (lo cual no significa que lo rechace), pues esta obra no recoge más que una selección de términos técnicos usuales. No le podemos confirmar la distribución de uso, aunque al menos en España también conviven ambas formas (condensador la más general, capacitor la más técnica).

@Almorca
Copy link
Collaborator

Almorca commented Jul 5, 2016

Me han respondido de la Academia Argentina de Letras

Se trata de un tecnicismo que, si bien no figura en los diccionarios del español general que hemos consultado, tiene mucho uso en textos o en vocabularios de carácter técnico. Su empleo en estos contextos es correcto. Si se está redactando un texto de divulgación, conviene definir brevemente el término.

Por los comentarios que hemos recabado yo añadiría la palabra al no_RAE general y crearía una página en el wiki de palabras controvertidas donde podamos dejar registro de los argumentos para añadir la palabra. ¿Qué os parece?

@RickieES
Copy link
Collaborator Author

RickieES commented Jul 6, 2016

Pues nada, añadida. En lugar de crear la página en el wiki, de momento he sido simple y he añadido un comentario junto a la palabra remitiendo a este issue.

Creo que, en cuanto a palabras, ya habríamos terminado. Solo queda, si todos estáis de acuerdo, extraer las siglas a un archivo independiente y renombrar los archivos NombresPropiosSiglas.txt a NombresPropios.txt. Ahora bien, ahora mismo contaríamos con la increíble cifra de... 2 siglas (CD y DVD). 😄 ¿Merece la pena? ¿Añadimos otras siglas, como ADSL, ONU, UNESCO, FAO, FMI, UE, USA, UK, SEPA, IBAN, BIC, SWIFT? Seguiríamos teniendo solo catorce entradas.

@edittler
Copy link
Collaborator

edittler commented Jul 9, 2016

Me parece bien lo de agregar el comentario en la línea de la palabra en cuestión. Administrar una página de la wiki puede ser tedioso en un futuro.

Con respecto a las siglas, me parece bien la propuesta de separar Siglas.txt siempre cuando no implique un gran esfuerzo, dados los plazos, ya habría que hacer lo mismo en todas las localizaciones.

Por ahora añadiría las siglas que no se refieran a organizaciones, por ejemplo, no añadiría ONU, UNESCO, FAO, FMI. Las siglas de países o regiones tampoco las agregaría a menos que se demuestre su uso frecuente, por ejemplo, como podría ser UE en España (sólo en es_ES).

Hay siglas que están reconocidas por RAE, pero están dentro de noRAE, como también aparecen los plurales de siglas, que no están permitidas por RAE.

De todas maneras, este asunto de las siglas las trataría en un issue a parte para otro release, citando lo que se dijo al respecto en este issue.

@RickieES
Copy link
Collaborator Author

He creado el issue #88 y con ello ya podemos cerrar este.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

4 participants