-
Notifications
You must be signed in to change notification settings - Fork 35
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
synsets with no links #152
Comments
podemos tentar quantificar? Se forem poucos, podemos sugerir correção, se forem muitos, deixamos isso para long term. |
temos ~8 mil resultados na versão df754c2 para a seguinte query: SELECT ?synset WHERE {
?synset wn30:lexicographerFile [].
## uncomment for checking nouns only:
# ?synset rdf:type wn30:NounSynset
MINUS { ?synset2 wn30:lexicographerFile [].
{?synset ?pred ?synset2.} UNION {?synset2 ?pred ?synset}
}
} note que a query se restringe aos synsets de Princeton (naturalmente). se restringirmos à substantivos, temos zero resultados (o que é bom (e esperado?)). eu inspecionei alguns resultados manualmente e acho que seria um trabalho difícil (e lexicográfico) para tentar dar relações a alguns (todos?) deles |
No curto prazo, eu gostaria apenas de confirmar se estes casos estão nos arquivos Dbfiles da PWN 3.0. Ou seja, se os erros não foram introduzidos na conversão RDF. Estes synsets, devem ter senses com relações com outros senses, logo não estão completamente descontentados. Mas @odanoburu , porque vc usou acima a relação lexicographerFile? Teria sido apenas uma forma de caracterizar que os nós são de synsets? |
acho que seria importante ver quantos sao verbos: no issue em ingles o McCrae diz 130 o que me parece muito. |
creio eu que estavam sim. podemos carregar os dados do McCrae ou de https://github.com/jrvosse/wordnet-3.0-rdf e comparar!
de fato! mas ainda assim suponho que alguns casos realmente estejam isolados na rede…
isso, já que não temos uma classe Synset única (talvez tenha uma forma melhor, mas eu não lembro 😅)
achei 124 na versão df754c2. o McCrae falou isso da versão dele já editada, ou da PWN? e se da PWN, provável que tenha sido da 3.1, que é a que ele usou como base, certo? |
bom, eu so' estava lendo o issue em ingles que voce colou acima globalwordnet/english-wordnet#172 no dia Jul 18, 2019 ele disse
|
some synsets have no links to any other synsets, like http://wnpt.sl.res.ibm.com/wn/synset?id=00894980-a
mirrors globalwordnet/english-wordnet#172
The text was updated successfully, but these errors were encountered: