Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

déramisation de V ? #21

Closed
eroux opened this issue Apr 29, 2016 · 4 comments
Closed

déramisation de V ? #21

eroux opened this issue Apr 29, 2016 · 4 comments
Labels

Comments

@eroux
Copy link

eroux commented Apr 29, 2016

Pour l'instant, V n'est pas déramisé en U, cela pose un problème pour reconnaître Vlixes. La ligne est commentée dans Ch::deramise, il faudrait comprendre pourquoi

@eroux eroux added the bug label Apr 29, 2016
@ycollatin
Copy link

Le 29 avril 2016, à 01h48, Elie Roux écrivit :

Pour l'instant, V n'est pas déramisé en U, cela pose un
problème pour reconnaître Vlixes. La ligne est commentée
dans Ch::deramise, il faudrait comprendre pourquoi

La méthode serait V + voyelle -> V et V + consonne -> U.

Il faudrait voir si cette règle n'a aucune exception, ou
suffisamment peu pour qu'on en fasse une liste. Il faudrait
donc chercher des exemples de U+voyelle, ou V+consonne. Et
comme il y a dans les titres et les inscriptions des mots
entièrement en majuscules, ça complique la recherche. Par
exemple, le relatif QVI (V+voyelle) doit devenir QUI, alors

que VINCO doit reste VINCO.

                    Yves

@eroux
Copy link
Author

eroux commented Apr 29, 2016

Aucune exception dans le Gaffiot en tous cas... mais je ne comprend finalement pas trop le rapport avec deramise, qui est sensé justement déramiser et donc tout transformer en U... ? S'il n'y a pas d'exception à cette règle, ça veut dire qu'il n'y a aucune ambiguité justement, et donc qu'on peut transformer les V en U pour les recherches dans le lexique non ?

@PhVerkerk
Copy link

Le problème n'est probablement pas tant dans deramise que dans le
comptage des V (quand il sera implémenté).
Il faut vérifier que ça ne crée pas de conflit avec lemmes.fr et,
surtout, avec irregs.la (où la clef est non ramiste).

Le 29/04/2016 11:29, Elie Roux a écrit :

Aucune exception dans le Gaffiot en tous cas... mais je ne comprend
finalement pas trop le rapport avec deramise, qui est sensé justement
déramiser et donc tout transformer en U... ? S'il n'y a pas
d'exception à cette règle, ça veut dire qu'il n'y a aucune ambiguité
justement, et donc qu'on peut transformer les V en U pour les
recherches dans le lexique non ?


You are receiving this because you are subscribed to this thread.
Reply to this email directly or view it on GitHub
#21 (comment)

@ycollatin
Copy link

Le 29 avril 2016, à 02h49, PhVerkerk écrivit :

Le problème n'est probablement pas tant dans deramise que dans le
comptage des V (quand il sera implémenté).
Il faut vérifier que ça ne crée pas de conflit avec lemmes.fr et,
surtout, avec irregs.la (où la clef est non ramiste).

Merci Philippe. En tout cas, Vnelli (= Unelli) n'est pas

reconnu, malgré la présence du lemme dans lemmes.la.

                    Yves

PhVerkerk added a commit that referenced this issue May 1, 2016
J'ai fait plusieurs modifs dans lemmatise :
- comptage des v, æ et œ, suivi du filtrage des solutions
- simplification de la recherche du double i contracté
- déramisation du "V" et reconnaissance d'une graphie comme Vlixes
Il resterait le cas des mots tout en majuscules comme COLLATINVS à la mode des inscriptions. Cas qu'il faudrait traiter en amont, dans lemmatiseM. On peut d'ailleurs déramiser de telles formes avant la mise en minuscules (ou simplement remplacer les "V" par des "U").

Si vos tests sont concluants, je pense que l'on peut merger cette branche fix-7 dans master. Et considérer les point 17 et 21 comme clos.
@eroux eroux closed this as completed May 3, 2016
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants