Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

synsets with no links #152

Open
odanoburu opened this issue Jul 19, 2019 · 6 comments
Open

synsets with no links #152

odanoburu opened this issue Jul 19, 2019 · 6 comments

Comments

@odanoburu
Copy link
Contributor

some synsets have no links to any other synsets, like http://wnpt.sl.res.ibm.com/wn/synset?id=00894980-a

mirrors globalwordnet/english-wordnet#172

@arademaker
Copy link
Member

podemos tentar quantificar? Se forem poucos, podemos sugerir correção, se forem muitos, deixamos isso para long term.

@odanoburu
Copy link
Contributor Author

odanoburu commented Jun 10, 2021

temos ~8 mil resultados na versão df754c2 para a seguinte query:

SELECT ?synset WHERE {
  ?synset wn30:lexicographerFile  [].
  ## uncomment for checking nouns only:
  # ?synset rdf:type wn30:NounSynset
  MINUS { ?synset2 wn30:lexicographerFile []. 
          {?synset ?pred ?synset2.} UNION {?synset2 ?pred ?synset}
        }
}

note que a query se restringe aos synsets de Princeton (naturalmente). se restringirmos à substantivos, temos zero resultados (o que é bom (e esperado?)). eu inspecionei alguns resultados manualmente e acho que seria um trabalho difícil (e lexicográfico) para tentar dar relações a alguns (todos?) deles

@arademaker arademaker removed this from the pre release 1.0 milestone Jun 10, 2021
@arademaker
Copy link
Member

No curto prazo, eu gostaria apenas de confirmar se estes casos estão nos arquivos Dbfiles da PWN 3.0. Ou seja, se os erros não foram introduzidos na conversão RDF.

Estes synsets, devem ter senses com relações com outros senses, logo não estão completamente descontentados.

Mas @odanoburu , porque vc usou acima a relação lexicographerFile? Teria sido apenas uma forma de caracterizar que os nós são de synsets?

@vcvpaiva
Copy link
Member

acho que seria importante ver quantos sao verbos: no issue em ingles o McCrae diz 130 o que me parece muito.

@odanoburu
Copy link
Contributor Author

No curto prazo, eu gostaria apenas de confirmar se estes casos estão nos arquivos Dbfiles da PWN 3.0. Ou seja, se os erros não foram introduzidos na conversão RDF.

creio eu que estavam sim. podemos carregar os dados do McCrae ou de https://github.com/jrvosse/wordnet-3.0-rdf e comparar!

Estes synsets, devem ter senses com relações com outros senses, logo não estão completamente descontentados.

de fato! mas ainda assim suponho que alguns casos realmente estejam isolados na rede…

Mas @odanoburu , porque vc usou acima a relação lexicographerFile? Teria sido apenas uma forma de caracterizar que os nós são de synsets?

isso, já que não temos uma classe Synset única (talvez tenha uma forma melhor, mas eu não lembro 😅)

acho que seria importante ver quantos sao verbos: no issue em ingles o McCrae diz 130 o que me parece muito.

achei 124 na versão df754c2. o McCrae falou isso da versão dele já editada, ou da PWN? e se da PWN, provável que tenha sido da 3.1, que é a que ele usou como base, certo?

@vcvpaiva
Copy link
Member

o McCrae falou isso da versão dele já editada, ou da PWN? e se da PWN, provável que tenha sido da 3.1, que é a que ele usou como base, certo?

bom, eu so' estava lendo o issue em ingles que voce colou acima globalwordnet/english-wordnet#172 no dia Jul 18, 2019 ele disse

This seems to be a very broad task, that I don't have a clear plan for dealing with. In total this affects 7,805 adjectives and 130 verbs.

@arademaker arademaker added this to the release 1.1.0 milestone Oct 5, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants