Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

DHBB ideas para protótipo #7

Open
arademaker opened this issue Apr 2, 2017 · 3 comments
Open

DHBB ideas para protótipo #7

arademaker opened this issue Apr 2, 2017 · 3 comments

Comments

@arademaker
Copy link
Contributor

arademaker commented Apr 2, 2017

@vcvpaiva:

artigo sobre Niemayer na interface nova do DHBB.

apesar de todo o cuidado com que as entradas do dhbb sao escritas tem muita coisa que fica deixando a desejar em termos de informacao. por exemplo:

¶ Sobre o biografado foi publicado * Oscar Niemeyer * , escrito pel o jornalista Marcos Sá Correia , em 1996 , 15º volume d a coleção * Perfis do Rio * . ¶ Também teve um documentário sobre sua vida e obra chamado * A vida é um sopro . *

nao diz quem fez o documentario, se 'e acessivel no youtube, sobre o livro nao diz onde comprar, se esta' em catalogo, essas coisas seriam muito boas de saber, nao? junto com as descricoes de lugares e de instituicoes, complementariam o dicionario muito bem, trazendo-o de verdade pro seculo 21.

como o marcos sa correia tem sua propria entrada (no DHBB ou) na wikipedia https://pt.wikipedia.org/wiki/Marcos_S%C3%A1_Corr%C3%AAa tb seria bom saber (criar interlinks).

a IBM e a Nuance podem ate fazer dinheiro com uma coisa dessas mostrando pra outras instituicoes de conservacao nacional como informacao historica de qualidade pode produzir lucro, se as lojinhas de museus forem informatizadas adequadamente.
(my 2 cents como se diz por ai) digital humanities tb pode dar lucro.

@arademaker
Copy link
Contributor Author

  1. OWN-PT-Named: um KB de lugares/locacoes, instituicoes, pessoas ligadas a DHBB, Wikipedia,
    nossos aboxes com suas URIs.
    construido a partir do texto do DHBB, e de outras kbs que nem freebase, yago, geonames, dbpedia, etc.

maneiras de consertar o DHBB-marcado, e.g.
http://129.41.145.38/kb-extraction/article?db=dhbb&id=9770cbc0-325c-11e5-877e-038289562b7f
o nome do sujeito esta' errado. o nome dele 'e joao henrique pimentel, nao joao Henrique!

  1. POS-tagging pra portugues que a gente possa consertar.
    se possivel modulo independente com interface de jogar uma sentenca receber a marcacao, alem de batch processing, 'e claro.

  2. Universal dependencies, consertaveis tb, grafos

  3. MWEs e seus tipos (rodar o mwetool no DHBB e ver o que da'?)

  4. modulo de mapping words in sentences to OWN-PT, com disambiguacao manual?
    volume usado dentro do DHBB 'e muito mais "livro" do que volume dimensional?

@arademaker
Copy link
Contributor Author

  1. Nao precisamos ter um pre-processamento que inclua transformar abreviacoes que nem MG em Minas Gerais?

@vcvpaiva
Copy link

vcvpaiva commented Nov 5, 2023

MWEs e seus tipos (rodar o mwetool no DHBB e ver o que da'?)

SIM!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants