Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gran colección de palabras #11

Open
ghost opened this issue Jul 23, 2014 · 14 comments
Open

Gran colección de palabras #11

ghost opened this issue Jul 23, 2014 · 14 comments
Assignees
Labels
Milestone

Comments

@ghost
Copy link

ghost commented Jul 23, 2014

Tengo un diccionario de usuario de OpenOffice con más de 2500 palabras. Contiene palabras cotidianas, específicas de mis estudios, nombres de personas, de lugares, de autores, de personajes históricos y mitológicos... un poco de todo.

Lo podéis ver aquí:
https://github.com/algoban/dict

Está todo desordenado, no me he puesto a clasificar cada palabra, pero si os gusta puedo empezar a trabajar con él para mejorarlo. No conozco mucho de git pero todo es ponerse.

Perdón si aún es un poco pronto, supongo que os estaréis aclimatando a la nueva plataforma, pero no he podido resistirme al enterarme del cambio. Un saludo.

@Jzarecta
Copy link
Collaborator

No se si usas Linux o unix pero puedes usar algunas de las herramientas de bash para compararla con la lista actual y ver cuales son las que no estan incluidas y asi filtrarla.

@ghost
Copy link
Author

ghost commented Jul 25, 2014

¿Existe algún tipo de documentación al respecto? He clonado el repositorio git pero no sé qué archivos tengo que mirar. Veo uno llamado "es_ES.dic" pero cada palabra tiene una terminación de tipo "/S", "/G" que no sé qué significan.

¿Alguien podría instruirme un poco? ¿Un canal IRC, una sala Jabber, un email?

@sbosio
Copy link
Owner

sbosio commented Jul 25, 2014

El archivo es_ES.dic es el resultado de "compilar" las listas de palabras
(que están agrupadas debajo del directorio ortograf/palabras), y esas
banderas o etiquetas que ves después de la barra inclinada hacen referencia
a reglas de modificación que se utilizan para modificar la esa palabra raíz
y que están definidas en el fichero de afijos (en
ortograf/palabras/afijos/afijos.txt).

Esta forma de definir el diccionario está basada en el proyecto Hunspell,
http://hunspell.sourceforge.net/, que es el motor de corrección ortográfica
que usa LibreOffice, OpenOffice y Mozilla, además de varias distribuciones
de Linux.
En la página de Hunspell podrás encontrar más información para poder
entender cómo funciona el sistema de palabras raíz y afijos, y cómo se
definen las reglas.

Saludos,

Santiago

El 25 de julio de 2014, 9:06, aperalesf notifications@github.com escribió:

¿Existe algún tipo de documentación al respecto? He clonado el repositorio
git pero no sé qué archivos tengo que mirar. Veo uno llamado "es_ES.dic"
pero cada palabra tiene una terminación de tipo "/S", "/G" que no sé qué
significan.

¿Alguien podría instruirme un poco? ¿Un canal IRC, una sala Jabber, un
email?


Reply to this email directly or view it on GitHub
#11 (comment).

@sbosio
Copy link
Owner

sbosio commented Aug 16, 2014

Realicé el filtrado de los lemas faltantes y agregué un directorio contrib/ con la lista de palabras. Avancé también en la revisión de los 150 primeros lemas. Las modificaciones las estoy realizando en el branch https://github.com/sbosio/rla-es/tree/issue_11, por si alguien quiere revisar el avance.

@sbosio sbosio added this to the Versión 0.8 milestone Aug 17, 2014
sbosio added a commit that referenced this issue Aug 26, 2014
sbosio added a commit that referenced this issue Aug 27, 2014
sbosio added a commit that referenced this issue Aug 27, 2014
sbosio added a commit that referenced this issue Aug 29, 2014
@RickieES RickieES modified the milestones: Después, Versión 0.8 Mar 8, 2015
@RickieES
Copy link
Collaborator

RickieES commented Mar 8, 2015

Cambio el milestone a Después.

Hay una cuestión en este issue: cuando publiquemos la versión 0.8, @Almorca va a recodificar los archivos del proyecto a UTF-8, lo que nos permitirá, entre otras cosas, utilizar la herramienta de Marco A. G. Pinto. Creo que eso puede afectar al desarrollo de este issue.

@edittler
Copy link
Collaborator

El archivo que se había añadido fue eliminado, pero sigue presente en el branch issue_11.

De todas maneras, propongo lo siguiente: primero, filtrar las palabras que siguen sin ser reconocidas (puede que con las ultimas actualizaciones se hayan agregado algunas); y por último, reducir la cantidad de palabras por issue entre 50 y 100 palabras. Se llevaría un mejor avance, notando un progreso en el mismo, que con un solo issue con más de 2000 palabras.
Se podrían abrir issues separados y usar este para gestionar el avance del mismo o cerrarlo.

@eksperimental
Copy link
Contributor

Creo q la mejor forma de aprovechar estas largas listas (y cualquier otro tipo de listas) serial ordenarlas por popularidad. Actualmente contamos con la lista q Cree de Wikipedia. Si existiera UN lematizador para la lengua castellana podria aprovechar aun mas ESA lista. Podria escribir UN script q ordene Las listas por popularidad con su respective porcentaje si Les parece q puede llegar a serles de utilidad

@edittler
Copy link
Collaborator

edittler commented Apr 2, 2016

¡Nos sería de mucha ayuda! ¿Cuál sería fuente para medir la popularidad de las palabras?

@RickieES
Copy link
Collaborator

RickieES commented Jul 2, 2016

Estoy de acuerdo con @ezeperez26 en que trabajar con una lista tan grande no es operativo y que algunas de las palabras pueden estar ya incluidas. Además, una vez empecemos con ella, no todas las palabras se van a añadir y, si no se hace rápido, hasta puede que antes de terminar algunas de ellas se hayan añadido por la RAE. En todo caso, esto no podemos tenerlo antes del 15 de julio, me temo.

@RickieES
Copy link
Collaborator

RickieES commented Sep 3, 2019

¿Sabemos en qué estado está este issue? Lo tenemos asignado para la versión 2.5, pero si no está completo, propongo pasarlo al milestone Después y, tras publicar la versión 2.5, partir el issue en varios pequeños de no más de 50 palabras. Se puede ir haciendo en orden alfabético y crear solo los issues de cada letra, documentándolo aquí y cerrando este issue solo cuando hayamos llegado a la Z. Hay que tener en cuenta que es probable que haya palabras que ya se habrán añadido de otras formas.

@cosmoscalibur
Copy link
Collaborator

Tenemos aún pendientes 1132 lemas :(

@RickieES
Copy link
Collaborator

RickieES commented Sep 7, 2019

Entonces creo que lo mejor es hacer lo que decía en mi comentario anterior. Cambio el milestone a Después.

@RickieES RickieES removed this from the Versión 2.5 milestone Sep 7, 2019
@RickieES RickieES added this to the Después milestone Sep 7, 2019
cosmoscalibur added a commit that referenced this issue Sep 20, 2019
del 90% respecto a las apariciones de los lemas en el corpus de wikipedia
(priorización aportada por @eksperimental en discusión #95) de los reportes #11, #15 y #95.

[+] arreglista/S
arreglista.
1. m. y f. Persona que tiene como ocupación el arreglo de composiciones musicales.
[+] bentónico/GS
bentónico, ca.
Del ingl. benthonic, der. de benthos 'bentos'.
1. adj. Biol. Perteneciente o relativo al bentos.
[+] cigüeñal/S
cigüeñal.
1. m. cigoñal.
2. m. Mec. Eje con codos que, mediante un juego de bielas, transforma en circular un movimiento rectilíneo alternativo o viceversa.
[+] cimborrio/S
cimborrio.
Del lat. ciborĭum, y este del gr. κιβώριον kibṓrion 'fruto del nenúfar', 'copa de forma semejante a la de este fruto'.
1. m. Arq. Cuerpo cilíndrico que sirve de base a la cúpula y descansa inmediatamente sobre los arcos torales.
2. m. Arq. cúpula (‖ bóveda).
[+] ciperáceo/GS; ciperáceas
ciperáceo, a.
Del lat. cient. Cyperaceus, y este del gr. κύπειρος kýpeiros 'juncia' y el lat. -aceus '-áceo'.
1. adj. Bot. Dicho de una planta: Del grupo de las angiospermas monocotiledóneas, herbácea, anual o perenne, con rizoma corto, dividido en fibras, o rastrero, tallo por lo común triangular y sin nudos, hojas envainadoras, a veces sin limbo, flores en espigas solitarias o aglomeradas en cabezuelas, cariópsides por frutos, y semilla con albumen amiláceo o carnoso; p. ej., la juncia, la castañuela o el papiro. U. t. c. s. f., en pl. como taxón.
[+] citocromo/S
citocromo.
Del al. cytochrome, y este de cyto- 'cito-' y el gr. -χρωμος -chrōmos 'coloreado'.
1. m. Biol. Proteína coloreada que contiene hierro y participa en la fotosíntesis y en los procesos de respiración celular.
[+] citoesqueleto/S
citoesqueleto.
De cito- y esqueleto.
1. m. Biol. Sistema estructural del interior de las células, formado por proteínas filamentosas que intervienen en los procesos de locomoción celular.
[+] clasificatorio/GS
clasificatorio, ria.
1. adj. Que clasifica o que sirve para clasificar.
[+] dioico/GS
dioico, ca.
Del lat. cient. Dioecium, y este del gr. δι- di- 'di-2', οἶκος oîkos 'casa' e -ium '-io'.
1. adj. Bot. Dicho de una planta: Que tiene las flores de cada sexo en pie separado.
2. adj. Bot. Dicho de una flor: Que tiene órganos sexuales bien masculinos o bien femeninos.
[+] diploide/S
diploide.
Del gr. διπλόος diplóos 'doble' y -oide.
1. adj. Biol. Dicho de un organismo, de un tejido, de una célula o de un núcleo: Que posee un doble juego de cromosomas. (Símb. 2n).
[+] dirigencia/S
dirigencia.
1. f. Conjunto de dirigentes políticos, gremiales, etc.
[+] foraminífero/GS; foraminíferos
foraminífero, ra.
Del lat. forāmen, -ĭnis 'foramen' y ‒́fero.
1. adj. Zool. Dicho de un protozoo: Del grupo de los rizópodos acuáticos, marino por lo común, con seudópodos que se ramifican y juntan unos con otros para formar extensas redes, y con caparazón de forma y composición química variadas; p. ej., la numulita. U. t. c. s. m., en pl. como taxón.
[+] irrigación/S
irrigación.
Del lat. irrigatio, -ōnis.
1. f. Acción y efecto de irrigar.
[+] linfoma/S
linfoma.
De linfa y -oma.
1. m. Med. Tumor de los tejidos linfoides.
[+] lípido/S
lípido.
Del fr. lipide, de lipo- 'lipo-' e -ide '‒́ido1'.
1. m. Bioquím. Cada uno de los compuestos orgánicos que resultan de la esterificación de alcoholes, como la glicerina y el colesterol, con ácidos grasos.
[+] nocaut/S
nocaut.
Del ingl. knock-out.
1. m. Am. Golpe que deja fuera de combate.
2. m. Am. Derrota por fuera de combate.
3. adv. Am. fuera de combate.
[+] perennifolio/GS
perennifolio, lia.
1. adj. Bot. Que tiene hojas durante todo el año.
[+] perimetral/S
perimetral.
1. adj. Perteneciente o relativo al perímetro (‖ contorno de una superficie). Medida perimetral.
2. adj. Situado en el perímetro (‖ contorno de una superficie). Muro perimetral. Vía perimetral.
[+] peronista/S
peronista.
1. adj. Perteneciente o relativo al peronismo.
2. adj. Partidario del peronismo. Apl. a pers., u. t. c. s.
[+] polideportivo/GS; polideportivo/S
polideportivo, va.
De poli-1 y deportivo.
1. adj. Dicho de un lugar, de una instalación, etc.: Destinados al ejercicio de varios deportes. U. t. c. s. m.
[+] polluelo/S
polluelo.
De pollo y -uelo.
1. m. Cría de ave.
[+] rococó/S
rococó.
Del fr. rococo, forma jocosa de rocaille.
1. adj. Dicho de un estilo artístico: Barroco surgido en Francia en el siglo XVIII y caracterizado por una ornamentación abundante y refinada. U. t. c. s. m.
[+] romanización/S
romanización.
1. f. Acción y efecto de romanizar.
[+] telerrealidad/S
telerrealidad.
De tele-2 y realidad.
1. f. TV. Género televisivo basado en la presentación de casos, vivencias o conflictos personales reales o inducidos.
[+] teleserie/S
teleserie.
1. f. Serial de televisión.
cosmoscalibur added a commit that referenced this issue Oct 6, 2019
wikipedia) y #95.

[+] andalusí/S
andalusí.
1. adj. Natural de al-Ándalus o España musulmana. U. t. c. s.
2. adj. Perteneciente o relativo a al-Ándalus o a los andalusíes.
romance andalusí
[+] andrógeno/S
andrógeno.
De andro- y ‒́geno.
1. m. Fisiol. Hormona que induce la aparición de los caracteres sexuales secundarios masculinos, como la barba en el hombre y la cresta en el gallo.
[+] anecdótico/GS
anecdótico, ca.
1. adj. Perteneciente o relativo a la anécdota.
[+] anticiclón/S
anticiclón.
1. m. Meteor. Perturbación atmosférica que consiste en un área de altas presiones y circulación de viento en sentido de las agujas del reloj en el hemisferio norte, e inversamente en el sur, y que suele originar tiempo despejado.
[+] entreguerras
entreguerras.
de entreguerras.
1. loc. adj. Dicho de una cosa: Que ocupa el período de paz entre dos guerras consecutivas.
2. loc. adj. Dicho de un período de tiempo: Que transcurrió entre la Primera y la Segunda Guerra Mundial, especialmente en Europa.
3. loc. adj. Propio del período de entreguerras.
[+] extrasolar/S
extrasolar.
1. adj. Dicho de un cuerpo celeste, especialmente de un planeta: Que no pertenece al sistema solar.
[+] extremeño/GS
extremeño, ña.
1. adj. Natural de Extremadura, comunidad autónoma de España. U. t. c. s.
2. adj. Perteneciente o relativo a Extremadura o a los extremeños.
3. adj. Perteneciente o relativo al extremeño (‖ variedad). Léxico extremeño.
4. adj. Que habita en los extremos de una región. U. t. c. s.
5. m. Variedad del español que se habla en Extremadura.
[+] ilegalización/S
ilegalización.
1. f. Acción y efecto de ilegalizar.
[+] imaginería/S
imaginería.
De imagen.
1. f. Bordado, por lo regular de seda, cuyo dibujo es de aves, flores y figuras, imitando en lo posible la pintura.
2. f. Arte de bordar de imaginería.
3. f. Talla o pintura de imágenes sagradas.
4. f. Conjunto de imágenes literarias usadas por un autor, escuela o época.
bordado de imaginería
[+] inactivación/S
inactivación.
1. f. Acción y efecto de inactivar.
[+] incautación/S
incautación.
1. f. Acción y efecto de incautarse.
[+] inconstitucionalidad/S
inconstitucionalidad.
1. f. Cualidad de inconstitucional.
[+] monografía/S
monografía.
De mono- y -grafía.
1. f. Descripción y tratado especial de determinada parte de una ciencia, o de algún asunto en particular.
[+] moralizante/S
moralizante.
1. adj. Que moraliza o intenta moralizar.
[+] mozárabe/S
mozárabe.
Del ár. hisp. musta‘rabí, gentilicio del ár. clás. musta‘rab 'arabizado', infl. por árabe.
1. adj. Dicho de una persona: De la población hispánica que, consentida por el derecho islámico como tributaria, vivió en la España musulmana hasta fines del siglo XI conservando su religión cristiana e incluso su organización eclesiástica y judicial. U. t. c. s.
2. adj. Dicho de una persona: De la población hispánica que emigró a los reinos cristianos del norte, llevando consigo elementos culturales musulmanes. U. t. c. s.
3. adj. Dicho de una persona: De la comunidad mozárabe toledana, que pudo por especial privilegio conservar la vieja liturgia visigótica frente a la romana. U. t. c. s.
4. adj. Perteneciente o relativo a los mozárabes. Rito mozárabe.
5. adj. Perteneciente o relativo al mozárabe (‖ lengua). Léxico mozárabe.
6. m. Lengua romance, heredera del latín vulgar visigótico, con elementos del árabe, que hablaban cristianos y musulmanes en la España islámica.
[+] muisca/S
muisca.
1. adj. chibcha. U. t. c. s.
[+] multidisciplinar/S
multidisciplinar.
1. adj. multidisciplinario.
[+] mundialista/S
mundialista.
1. adj. Dep. Perteneciente o relativo a un mundial.
2. adj. Dep. Dicho de un deportista: Que participa en un mundial. U. t. c. s.
[+] presea/S
presea.
Del lat. praesidia, pl. n. de praesidium 'defensa'.
1. f. Alhaja, joya, tela, etc., preciosas.
2. f. Cuba. Medalla que se otorga al ganador de una competición.
3. f. desus. Mueble o utensilio que sirve para el uso y comodidad de las casas.
[+] prevaricación/S
prevaricación.
Del lat. praevaricatio, -ōnis.
1. f. Der. Delito consistente en que una autoridad, un juez o un funcionario dicte a sabiendas una resolución injusta.
[+] prevalencia/S
prevalencia.
Del lat. tardío praevalentia.
1. f. Acción y efecto de prevaler.
2. f. Acción y efecto de prevalecer.
3. f. Med. En epidemiología, proporción de personas que sufren una enfermedad con respecto al total de la población en estudio.
[+] senderismo/S
senderismo.
De sendero e -ismo.
1. m. Actividad deportiva que consiste en caminar por el campo siguiendo un itinerario determinado.
[+] sijismo/S
sijismo.
Del ingl. sikhism, de sikh 'sij' e -ism '-ismo'.
1. m. Religión monoteísta fundada por Nanak en la India en el siglo XVI, que combina elementos del hinduismo y del islamismo.

NoRAE

[+] neogótico/GS
Neogótico es la denominación de un movimiento artístico historicista, principalmente arquitectónico y decorativo.
cosmoscalibur added a commit that referenced this issue Oct 6, 2019
…rpus de

wikipedia) y #95.

[+] cuantificación/S
cuantificación.
1. f. Acción y efecto de cuantificar.
2. f. Fil. En una proposición, lo que determina el ámbito o extensión de un concepto.
3. f. Gram. Expresión de la cantidad, el número o el grado de lo designado por un elemento lingüístico. Hay cuantificación de grado en muy bonito.
[+] democratización/S
democratización.
1. f. Acción y efecto de democratizar.
[+] expresionista/S
expresionista.
1. adj. Perteneciente o relativo al expresionismo.
2. adj. Seguidor del expresionismo. Apl. a pers., u. t. c. s.
[+] helenístico/GS
helenístico, ca.
1. adj. Perteneciente o relativo al helenismo o a los helenistas.
2. adj. Dicho de una lengua griega: Basada en el dialecto ático y extendida por todo el mundo helénico después de Alejandro Magno.
3. adj. Perteneciente o relativo al período histórico que va desde la muerte de Alejandro Magno hasta la conquista romana.
[+] paisajístico/GS
paisajístico, ca.
1. adj. Perteneciente o relativo al paisaje, en su aspecto artístico.
[+] res/S
res.
Del lat. res 'cosa', 'propiedad'.
1. f. Animal cuadrúpedo de ciertas especies domésticas, como del ganado vacuno, lanar, etc., o de los salvajes, como venados, jabalíes, etc.
2. f. Col., Ec., El Salv., Guat. y Méx. Animal vacuno.
res de vientre.
1. f. En los rebaños, vacadas, etc., hembra paridera.
carne de res
[+] socioeconómico/GS
socioeconómico, ca.
1. adj. Perteneciente o relativo a los factores sociales y económicos.
cosmoscalibur added a commit that referenced this issue Oct 6, 2019
…edia) y #95.

[+] deán/S
deán.
Del fr. ant. deien, hoy doyen.
1. m. Canónigo que preside el cabildo de la catedral.
2. m. En la antigua universidad española de Alcalá, graduado más antiguo de cada facultad.
3. m. desus. Jefe de un grupo de diez.
[+] estandarización/S
estandarización.
1. f. Acción y efecto de estandarizar.
[+] estratificación/S
estratificación.
1. f. Acción y efecto de estratificar.
2. f. Geol. Disposición de las capas o estratos de un terreno.
[+] etnografía/S
etnografía.
De etno- y -grafía.
1. f. Estudio descriptivo de las costumbres y tradiciones de los pueblos.
[+] etnográfico/GS
etnográfico, ca.
1. adj. Referente o relativo a la etnografía.
[+] ideólogo/GS
ideólogo, ga.
1. m. y f. Persona creadora de una ideología.
2. m. y f. Persona entregada a una ideología.
3. m. y f. Fil. Persona que profesa la ideología (‖ doctrina filosófica).
[+] manierismo/S
manierismo.
Del it. manierismo.
1. m. Estilo artístico y literario del Renacimiento tardío, caracterizado por su refinamiento y artificiosidad.
2. m. Tendencia al rebuscamiento expresivo. Esta obra incurre en el manierismo.
[+] recurrencia/S
recurrencia.
1. f. Cualidad de recurrente.
2. f. Mat. Propiedad de aquellas secuencias en las que cualquier término se puede calcular conociendo los precedentes.
[+] superestructura/S
superestructura.
1. f. Estructura compleja de grandes dimensiones que engloba otras menores.
2. f. Estructura social, ideológica o cultural fundamentada en otra.
3. f. Fil. En el marxismo ortodoxo, conjunto de ideas e instituciones características que surgen de la estructura económica de una sociedad.
4. f. Mar. En los barcos, parte construida por encima de la cubierta alta.
[+] transliteración/S
transliteración.
1. f. Acción y efecto de transliterar.
@cosmoscalibur cosmoscalibur self-assigned this Oct 6, 2019
cosmoscalibur added a commit that referenced this issue Oct 6, 2019
…ipedia) y #95.

[+] etimológicamente
etimológicamente.
1. adv. Desde el punto de vista etimológico.

[+] redescubrir/P
redescubrimiento.
1. m. Acción de redescubrir. descubrimiento

[+] acérrimo/GS
acérrimo, ma.
Del lat. acerrĭmus.
1. adj. sup. de acre2.
2. adj. Muy fuerte, vigoroso o tenaz.
3. adj. Intransigente, fanático, extremado.
[+] autosuficiente/S
autosuficiente.
1. adj. Que se basta a sí mismo.
2. adj. suficiente (‖ pedante).
[+] avícola/S
avícola.
Del lat. avis 'ave1' y ‒́cola.
1. adj. Perteneciente o relativo a la avicultura.
[+] constitucionalista/S
constitucionalista.
1. adj. Perteneciente o relativo al constitucionalismo.
2. adj. Partidario del constitucionalismo. Apl. a pers., u. t. c. s.
3. adj. Que defiende la Constitución vigente en un Estado.
4. m. y f. Jurista especializado en derecho constitucional.
[+] expansionista/S
expansionista.
1. adj. Perteneciente o relativo al expansionismo.
2. adj. Partidario del expansionismo. Apl. a pers., u. t. c. s.
[+] referencial/S
referencial.
1. adj. Que sirve como referencia (‖ base de una comparación). Marco, precio referencial.
2. adj. Consistente en una referencia (‖ narración o relación). Testimonio referencial.
3. adj. Ling. Perteneciente o relativo a la referencia (‖ relación lingüística).
expresión referencial
[+] finalista/Sq
semifinalista.
1. adj. Que contiende en la semifinal de una competición o concurso. U. t. c. s.
[+] semiótico/GS; semiótica/S
semiótico, ca.
Del gr. σημειωτικός sēmeiōtikós; en acep. 4, del gr. σημειωτική sēmeiōtikḗ.
1. adj. Perteneciente o relativo a la semiótica, y al punto de vista adoptado por esta.
2. f. semiología (‖ estudio de los signos en la vida social).
3. f. Teoría general de los signos.
4. f. Med. Parte de la medicina que trata de los signos de las enfermedades desde el punto de vista del diagnóstico y del pronóstico.
[+] serbocroata/S
serbocroata.
1. adj. Perteneciente o relativo a Serbia y Croacia, común a serbios y croatas.
2. adj. Perteneciente o relativo al serbocroata. Léxico serbocroata.
3. m. Grupo lingüístico que comprende el serbio y el croata.
[+] simbiótico/GS
simbiótico, ca.
De simbiosis.
1. adj. Biol. Perteneciente o relativo a la simbiosis.
[+] sináptico/GS
sináptico, ca.
1. adj. Biol. Perteneciente o relativo a la sinapsis.
[+] soluto/S
soluto.
1. adj. Quím. Dicho de un cuerpo: Que está disuelto. U. m. c. s. m.

[+] dicotomía/S
dicotomía.
Del gr. διχοτομία dichotomía.
1. f. División en dos partes.
2. f. Práctica condenada por la recta deontología, que consiste en el pago de una comisión por el médico consultante, operador o especialista, al médico de cabecera que le ha recomendado un cliente.
3. f. Bot. Bifurcación de un tallo o de una rama.
4. f. Fil. Método de clasificación que consiste en dividir en dos un concepto sucesivamente.
[+] dilución/S
dilución.
Del lat. dilutio, -ōnis.
1. f. Acción y efecto de diluir1.
[+] formalización/S
formalización.
1. f. Acción y efecto de formalizar o formalizarse.
[+] homofobia/S
homofobia.
Del ingl. homophobia.
1. f. Aversión hacia la homosexualidad o las personas homosexuales.
[+] homologación/S
homologación.
1. f. Acción y efecto de homologar.
[+] pervivencia/S
pervivencia.
1. f. Acción y efecto de pervivir.
[+] replicación/S
replicación.
Del lat. replicatio, -ōnis.
1. f. Biol. Proceso de duplicación del ADN para transmitir a la siguiente generación una copia íntegra de la información genética.
2. f. desus. Acción de replicar.
3. f. desus. Repetición, reiteración.
[+] representatividad/S
representatividad.
1. f. Cualidad de representativo.
[+] valorización/Sp
revalorización.
1. f. Acción y efecto de revalorizar.
[+] vitalización/pS
revitalización.
1. f. Acción y efecto de revitalizar.
[+] secularización/S
secularización.
1. f. Acción y efecto de secularizar.
[+] sedimentación/S
sedimentación.
1. f. Acción y efecto de sedimentar o sedimentarse.
[+] sintomatología/S
sintomatología.
1. f. Med. Conjunto de los síntomas de una enfermedad.
2. f. Conjunto de indicios de algo.
[+] sistematización/S
sistematización.
1. f. Acción y efecto de sistematizar.
[+] sobreexplotación/S; sobrexplotación/S
sobreexplotación.
Tb. sobrexplotación.
1. f. Acción y efecto de sobreexplotar.

NoRAE

[+] sustituyente/S
sustituyente.
Wiki -  m. En química orgánica, un sustituyente es un heteroátomo, grupo funcional o grupo alquilo, que ocupa el lugar de un átomo de hidrógeno de un hidrocarburo o de un grupo saliente de un compuesto orgánico en general.
[+] sistema/Ss
subsistema.
Wiki - m. Un subsistema es un sistema que es parte de otro sistema mayor que lo contiene.
[+] importantísimo/GS
Wiki - adj. Superlativo de importante.
cosmoscalibur added a commit that referenced this issue Oct 8, 2019
…e wikipedia) y #95.

[+] autarquía/S
autarquía1.
Del gr. αὐταρχία autarchía 'poder absoluto'.
1. f. Dominio de sí mismo.
[+] organización/Sh
desorganización.
1. f. Acción y efecto de desorganizar.
[+] etnología/S
etnología.
De etno- y -logía.
1. f. Ciencia que estudia las causas y razones de las costumbres y tradiciones de los pueblos.
[+] jerarquizar/A
jerarquización.
1. f. Acción y efecto de jerarquizar.
[+] masificar/A
masificación.
1. f. Acción y efecto de masificar.
[+] musicología/S
musicología.
De música y -logía.
1. f. Estudio científico de la teoría y de la historia de la música.
[+] neutralizar/A
neutralización.
1. f. Acción y efecto de neutralizar o neutralizarse.
2. f. Fon. En algunos análisis fonológicos, pérdida de una oposición distintiva en un contexto fónico determinado.
3. f. Ling. Pérdida de una oposición distintiva morfosintáctica o semántica.
[+] pedofilia/S
pedofilia.
Del gr. παῖς, παιδός paîs, paidós 'niño' y -filia.
1. f. Atracción erótica o sexual que una persona adulta siente hacia niños o adolescentes.
[+] tetralogía/S
tetralogía.
Del gr. τετραλογία tetralogía.
1. f. Conjunto de cuatro obras literarias o musicales que tienen entre sí enlace histórico o unidad de protagonismo o intención.
2. f. Conjunto de cuatro obras, tres tragedias y un drama satírico de un mismo autor, presentadas a concurso en los festivales teatrales de la Grecia clásica.
3. f. Med. Conjunto de cuatro malformaciones congénitas del corazón, que ocasiona la llamada enfermedad azul.
[+] vocalizar/A
vocalización.
1. f. Acción y efecto de vocalizar.
2. f. Mús. En el arte del canto, ejercicio preparatorio que consiste en ejecutar, valiéndose de cualquiera de las vocales, comúnmente la a o la e, una serie de escalas, arpegios, trinos, etc., sin repetir ni alterar el timbre de la que se emplea.
3. f. Mús. Pieza de música compuesta expresamente para enseñar a vocalizar.

[+] colofón/S
colofón.
Del lat. tardío colŏphon, -ōnis 'cumbre', 'término, fin', y este del gr. κολοφών kolophṓn.
1. m. Anotación al final de los libros, que indica el nombre del impresor y el lugar y fecha de la impresión, o alguna de estas circunstancias.
2. m. Remate, final de un proceso. La velada tuvo un brillante colofón con las palabras del presidente.
[+] estructuralismo/S
estructuralismo.
1. m. Teoría y método científicos que consideran un conjunto de datos como una estructura o sistema de interrelaciones.
[+] futurismo/S
futurismo.
1. m. Actitud que se caracteriza por especular, sin base científica, sobre el futuro.
2. m. Movimiento impulsado a comienzos del siglo XX por el poeta italiano F. T. Marinetti, y que expresa artísticamente los avances de la técnica y de la sociedad moderna.
3. m. Méx. electoralismo.
[+] pasodoble/S
pasodoble.
1. m. Marcha a cuyo compás puede llevar la tropa el paso ordinario.
2. m. Baile que se ejecuta al compás del pasodoble.
[+] popurrí/S
popurrí.
Del fr. pot pourri, y este calco de olla podrida.
1. m. Mezcolanza de cosas diversas, cajón de sastre.
2. m. Composición musical formada de fragmentos o temas de obras diversas.
[+] reformismo/S
reformismo.
De reforma e -ismo.
1. m. Doctrina y actitud que propugnan el cambio gradual y pacífico de una situación política, social, religiosa, etc.

[+] franquista/Sc
antifranquista.
1. adj. Contrario al régimen del general Franco, jefe del Estado español entre 1939 y 1975. Prensa antifranquista. Apl. a pers., u. t. c. s.
[+] paradigmático/GS
paradigmático, ca.
1. adj. Perteneciente o relativo al paradigma.
2. adj. Ling. Dicho de una relación: Que existe entre dos o más elementos de un paradigma.
[+] posicional/S
posicional.
1. adj. Perteneciente o relativo a la posición (‖ postura o modo en que alguien o algo está puesto).
2. adj. Perteneciente o relativo a la posición (‖ situación o disposición). El valor posicional de los signos.
[+] decimonónico/GS
decimonónico, ca.
De decimonono.
1. adj. Perteneciente o relativo al siglo XIX.

NoRAE

- radicalización, 94.3% radicalizar/A (RAE)
- reinterpretación, 94.32% interpretar/pA (RAE)
- diferenciables, 94.45% diferenciable/S
- neobarroco, 94.47% neobarroco/S
sbosio added a commit that referenced this issue May 12, 2020
sbosio added a commit that referenced this issue May 12, 2020
sbosio added a commit that referenced this issue May 12, 2020
sbosio added a commit that referenced this issue May 12, 2020
@RickieES
Copy link
Collaborator

RickieES commented Jan 3, 2023

He tomado el fichero original, ya que el del branch tampoco existe ya, y he eliminado todas las entradas que no están marcadas como erróneas. Veo varios tipos de términos:

  • Nombres propios. Algunos me parecen universales, otros no sé si tienen sentido fuera de la variante es-ES. Hay también nombres y apellidos famosos, como Quevedo o Góngora.
  • Topónimos y algunos gentilicios, en general de España. Si se añaden, serían en es-ES.
  • Términos de todo tipo de uso relativamente habitual, como amplísimo, competencial, conductual, distópico, dramatización...
  • Términos de todo tipo con un uso mucho más limitado al ámbito de la filología y la lingüística. Algunos nos podrían interesar, como clítico, que lo usamos en nuestro propio Changelog.txt a menudo. :)
  • Extranjerismos ("flashback"), nombres propios extranjeros y clásicos (Freud, Aristófanes).
  • Términos erróneos (lo que significa que hay que revisar bien lo que se añade).
  • Formas conjugadas de verbos habituales, que se deberían arreglar con correcciones en los afijos existentes o creando nuevos.

He guardado el documento como de LibreOffice, con una o más páginas por letra (distinguiendo las mayúsculas de las minúsculas, simplemente porque así estaba ordenado el original) y me salen 60 páginas, algunas muy cortas y otras no tanto. Para poder terminar de una vez con esto, yo sugiero crear un issue para la suma de las colecciones más cortas y luego otro issue separado por letra, posiblemente incluso separando mayúsculas de minúsculas. Pero la idea sería que todos ellos se atendieran con preferencia. ¿Cómo lo veis?

@olea
Copy link
Collaborator

olea commented Aug 16, 2023

@RickieES si me das instrucciones concretas (pero no de codificación de afijos, que se me queda grande) te hago las tareas que me digas. En general cualquier operación de filtrado u organización de palabras que pueda resolverse en la línea de órdenes.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

7 participants