Navigation Menu

Skip to content
This repository has been archived by the owner on Jul 9, 2023. It is now read-only.

Softcatala/nous-serveis-llengua

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

29 Commits
 
 

Repository files navigation

Nous serveis lingüístics de Softcatalà

Objectius

Crear nous serveis de consulta lingüística, relativament fàcils d'oferir, que poden ser d'utilitat per als usuaris de Softcatalà.

Possibles serveis

  • Separador i comptador de síl·labes. Exemple, amb llibreria en Perl
  • Conversor de xifres a text. Exemple, basat en numbertext.org
  • Conversor a text d'expressions horàries dels 2 sistemes horaris usats en català: de campanar i de rellotge.
  • Cerques amb expressions regulars en el diccionari. Exemple de visca.com. Això es podria no limitar al DIEC, i mostrar l'existència del lema als diferents diccionaris, amb l'enllaç corresponent (DIEC, DNV?, GDLC i DCVB bàsicament, i potser el Viccionari). També podria permetre escoltar pronunciacions de Common Voice (veure p. ex. https://orga.cat/commonvoice/)
  • Diccionari de rimes. Relacionat amb les cerques amb expressions regulars, però una mica més sofisticat.
  • Conjugador verbal, o en general flexionador de qualsevol classe de paraules (verbs, noms, adjectius, pronoms, etc.).
  • Transcripció fonètica: consulta de diccionaris o generació.
  • Cercador amigable al CLDR, potser en diversos idiomes.
  • Conversor d'unitats. Potser es podria aprofitar ConvertAll (en línia, a GitHub), i de pas contribuir la traducció.
  • Altres?

Dubtes i qüestions que cal resoldre

  • Com hauria de ser la integració en la web de Softcatalà. Una interfície per a cada servei o una interfície per a tots.
  • Oferim alguna cosa de valor o repetim serveis que ja existeixen (p. ex. Viccionari)?
    • Com a fet diferencial, aportem els diccionaris de Softcatalà, que tenen més formes que qualsevol altre diccionari (1,24 milions de formes, 143.000 lemes).

Fonts de dades i eines existents

  • Viccionari (418.000 entrades), amb flexió, definicions, transcripció fonètica...
  • Diccionaris de Softcatalà/LanguageTool (1,24 milions de formes etiquetades), i diccionaris d'anàlisi i síntesi ja implementats.
  • Wikidata:Lexicographical data, encara sense dades en català.
  • Per a transcripció fonètica:

Tasques i assignació

  • Integració dels diferents serveis en la web de Softcatalà

    • Qui: Xavi
    • Estat
      • En cada lloc
  • Conversor a text d'expressions horàries

  • Separador i comptador de síl·labes

    • Qui: Jaume Ortolà
    • Estat
    • Queda
      • Pujars els fitxers JS al servidor de Softcatalà
      • Disseny apropiat (reduir la mida del formulari)
      • Comprovar scroll en Firefox
  • Cercador avançat de paraules

  • API per obtenir eficientment l'existència d'un terme en diferents fonts, amb els seus enllaços corresponents

    • Qui: Pere Orga
    • Estat
    • Queda
      • DNV, PCCD, DSFF? DDLC? CTILC? Viccionari? CiT? Termcat? sinònims Softcatalà? sinònims IEC? sinònims Franquesa?
      • Fer una demo simple
      • Integrar en aplicacions existents (p. ex. en el cercador avançat de paraules)
  • Convertidor d'unitats

    • Qui: Pere Orga
    • Estat
    • Queda
      • Revisar la traducció
      • Si es decideix integrar, probablement simplificar (o refer) la interfície

About

Nous serveis lingüístics de Softcatalà

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published