Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

compilação de corpus com os exemplos das lições de Navarro (2016) #15

Open
juliana-gurgel opened this issue May 12, 2022 · 4 comments
Assignees
Labels
corpus This issue pertains to corpus data enhancement New feature or request question Further information is requested

Comments

@juliana-gurgel
Copy link
Collaborator

Os arquivos conterão as sentenças alinhadas (yrl-por) dos textos das 13 lições de Navarro (2016).

@juliana-gurgel juliana-gurgel added the enhancement New feature or request label May 12, 2022
@juliana-gurgel juliana-gurgel self-assigned this May 12, 2022
@leoalenc
Copy link
Contributor

@juliana-gurgel e @dominickmaia, com o commit 1e54829, a tarefa foi concluída, certo? Podemos fechar esta issue?

@leoalenc leoalenc changed the title upload dos textos das lições de Navarro (2016) inclusão dos exemplos das lições de Navarro (2016) May 16, 2022
leoalenc added a commit that referenced this issue May 16, 2022
@leoalenc leoalenc changed the title inclusão dos exemplos das lições de Navarro (2016) compilação de corpus com os exemplos das lições de Navarro (2016) May 16, 2022
@leoalenc
Copy link
Contributor

Em 8c66ced, reorganizei os arquivos do corpus, transferindo-os para a pasta data. Ver #2.

leoalenc added a commit that referenced this issue May 16, 2022
@leoalenc
Copy link
Contributor

@juliana-gurgel e @dominickmaia, constatei que, no texto 9, uma sentença em nheengatu estava precedida de #, ao passo que a versão em português não estava marcada como comentário. Corrigi isso. A propósito: fica complicado pro código do etiquetador processar comentários que se estendem por múltiplas linhas marcados com '''. Melhor preceder cada linha que não deve ser etiquetada com #.

@leoalenc
Copy link
Contributor

@juliana-gurgel e @dominickmaia, constatei que, no texto 9, uma sentença em nheengatu estava precedida de #, ao passo que a versão em português não estava marcada como comentário. Corrigi isso. A propósito: fica complicado pro código do etiquetador processar comentários que se estendem por múltiplas linhas marcados com '''. Melhor preceder cada linha que não deve ser etiquetada com #.

Podemos continuar usando pares de ''' para comentários de múltiplas linhas, ver #44.

@leoalenc leoalenc added question Further information is requested corpus This issue pertains to corpus data labels May 31, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
corpus This issue pertains to corpus data enhancement New feature or request question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants