Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

como lidar com as palavras "estilada" e "umixír" de Hartt (1938) #446

Open
3 of 5 tasks
leoalenc opened this issue Jul 4, 2024 · 2 comments
Open
3 of 5 tasks

como lidar com as palavras "estilada" e "umixír" de Hartt (1938) #446

leoalenc opened this issue Jul 4, 2024 · 2 comments
Assignees
Labels
corpus This issue pertains to corpus data documentation Improvements or additions to documentation morphological parsing Lemmatization and morphological analysis question Further information is requested UD Annotation This issue relates to Universal Dependencies annotation

Comments

@leoalenc
Copy link
Contributor

leoalenc commented Jul 4, 2024

https://github.com/Levymelo:

Q1. A frase no texto do Hartt traz uma palavra em itálico, dando a entender que é uma palavra de outra língua. Devo adaptar "estilada" como está?

Q2. "Umixír" aparenta ter o significado de queimar, arder. Entretanto em Ávila, para esses significados, só temos "sapí" e "ukái", que não representam aparentemente sua forma de maneira semelhante.

627 - kuaá estilada sasy reté, umixír se kuruká. 627 - Kwaá ... sasí reté, ... se kuruká. * 627 - esta estilada é muito forte, queimou minha garganta.

  • adaptar estilada como está?
  • como anotar essa palavra?
  • como adaptar umixír?
  • anotar exemplo 627 (@dominickmaia, @juliana-gurgel )
  • anotar demais exemplos de Hartt (1938) com a palavra estilada, seja no texto nheengatu, seja no texto em português (@dominickmaia, @juliana-gurgel )
@leoalenc leoalenc added documentation Improvements or additions to documentation question Further information is requested corpus This issue pertains to corpus data morphological parsing Lemmatization and morphological analysis UD Annotation This issue relates to Universal Dependencies annotation labels Jul 4, 2024
@leoalenc
Copy link
Contributor Author

leoalenc commented Jul 4, 2024

O substantivo estilada deriva do verbo estilar, mesma coisa que que destilar, significando "bebida destilada":

estilar
A A A A
(es.ti.lar)

v.

  1. Ant. Cair gota a gota; DESTILAR; GOTEJAR [td. : estilar gotas de soro] [int. : Ficou longo tempo a estilar.]

  2. Separar (líquidos) por processo de evaporação [td. ]

  3. Fig. Chorar [td. : Estilava lágrimas amargas]

[F.: Do lat. stillare. Hom./Par.: estila(s) (fl.), estila(s) (sf.[pl.]); estilo (fl.), estilo (sm.)]

Avila (2021):

~/nheengatu/avila$ grep -Eah "mixír" avila*.txt

mixira2 [hist.] var. de mixiri2 ■ Reg. hist.: [Dias [michira], 555; Magalhães [mixíra], 116]
■ Reg. hist.: [Costa [mixiri], 197; Stradelli [mixire], 414; Coudreau [omixiri], 469; Magalhães [mixíri], 96; Rodrigues, [mechire]
60, [mexire] 65; Dias [michira], 556; Marcoy [mexira], 445; Hartt [mixir, mixír], 361, 364; Amorim [mixyre], 197, 363, 446,
[mixíra], 116] ● (do tupi (e)mixyra (r, s))

Entrada de Avila (2021) para o verbo mixiri, que corresponde a mixír de Hartt (1938):

mixiri1 (v. tr.) 1) assar: Amixiri aikú se rimbiú. (Hartt, 361, adap.) - Estou assando a minha comida.; Ape paá umaã yuí-itá
upupuri, ape unheẽ tayera-itá supé: ― Pemaã nhaã-itá upupuri waá-itá, pesú peyuuka, pemixiri yasaã arama sá puranga
yambaú arã aintá (Leetra Indígena. n. 17, 83, adap.) - Então ele viu as rãs saltitando, aí disse para suas filhas: ― Olhem
aquelas que estão pulando, vão pegar e assem para provarmos se elas são boas para nós comermos.
2) [hist.] fritar (Stradelli, 414)
■ Reg. hist.: [Costa [mixiri], 197; Stradelli [mixire], 414; Coudreau [omixiri], 469; Magalhães [mixíri], 96; Rodrigues, [mechire]
60, [mexire] 65; Dias [michira], 556; Marcoy [mexira], 445; Hartt [mixir, mixír], 361, 364; Amorim [mixyre], 197, 363, 446,
458; Studart [mixire], 36] ● (do tupi mixyr)

@dominickmaia , de fato, como sugeriu Levy, o itálico foi empregado por Hartt (1938) para indicar que se trata de palavra do português empregada na fala em nheengatu. Podemos, sim, substituir o itálico por aspas, pois não podemos codificar o primeiro em texto puro. Formulamos a seguinte diretriz para adaptação:

itálico no original => aspas na transcrição

Este é o resultado da transcrição e adaptação do exemplo:

627 - kuaá "estilada" sasy reté, umixír se kuruká.

627 - Kwaá "estilada" sasí reté, umixiri se kuruká.

627 - esta estilada é muito forte, queimou minha garganta.

@leoalenc
Copy link
Contributor Author

leoalenc commented Jul 4, 2024

@dominickmaia , @heliolbs e @juliana-gurgel , vejam o procedimento para anotar substantivos do português empregados no discurso nheengatu, os quais, via de regra, não vamos incluir no glossário do Yauti:

Python 3.8.10 (default, Nov 22 2023, 10:22:35) 
[GCC 9.4.0] on linux
Type "help", "copyright", "credits" or "license()" for more information.
>>> import Yauti
>>> s='''Kwaá "estilada"/=n:o|por sasí reté, umixiri se kuruká.'''
>>> Yauti.pp(s)
1	Kwaá	kwaá	ADV	ADVDX	AdvType=Loc|Deixis=Prox|PronType=Dem	5	advmod	_	TokenRange=0:4
1	Kwaá	kwaá	DET	DEMX	Deixis=Prox|Number=Sing|PronType=Dem	3	det	_	TokenRange=0:4
2	"	"	PUNCT	PUNCT	_	3	punct	_	SpaceAfter=No|TokenRange=4:5
3	estilada	estilada	NOUN	N	Number=Sing	5	nsubj	_	OrigLang=por|SpaceAfter=No|TokenRange=6:14
4	"	"	PUNCT	PUNCT	_	3	punct	_	TokenRange=14:15
5	sasí	sasí	NOUN	N	Number=Sing	6	nmod:poss	_	TokenRange=16:20
5	sasí	sasí	VERB	V3	Number=Sing|Person=3|Rel=NCont|VerbForm=Fin	0	root	_	TokenRange=16:20
6	reté	reté	ADJ	A	_	5	amod	_	SpaceAfter=No|TokenRange=21:25
6	reté	reté	ADV	ADVS	AdvType=Deg	5	advmod	_	SpaceAfter=No|TokenRange=21:25
6	reté	teté	NOUN	N	Number=Sing|Rel=Cont	5	obj	_	SpaceAfter=No|TokenRange=21:25
7	,	,	PUNCT	PUNCT	_	8	punct	_	TokenRange=25:26
8	umixiri	mixiri	VERB	V	Person=3|VerbForm=Fin	5	parataxis	_	TokenRange=27:34
9	se	se	PRON	PRON2	Case=Gen|Number=Sing|Person=1|PronType=Prs	5	_	_	TokenRange=35:37
10	kuruká	kuruká	_	_	_	5	_	_	SpaceAfter=No|TokenRange=38:44
11	.	.	PUNCT	PUNCT	_	5	punct	_	SpaceAfter=No|TokenRange=44:45

A etiqueta especial =n:o|por chama, por meio de =n, uma função que cria um substantivo de origem portuguesa (indicada por o|por).

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
corpus This issue pertains to corpus data documentation Improvements or additions to documentation morphological parsing Lemmatization and morphological analysis question Further information is requested UD Annotation This issue relates to Universal Dependencies annotation
Projects
None yet
Development

No branches or pull requests

3 participants