# **Seminario de métodos computacionales para lenguas amerindias**
### Roberto Zariquiey Biondi, rzariquiey@pucp.edu.pe 
### Javier Vera Zúñiga, jveraz@pucp.edu.pe

# Una aplicación algo más realista :)
## Verbos en Kakataibo

En esta aplicación, la idea es expresar (una versión muy simplificada de) la formación de verbos en **Kakataibo** en los términos que hemos aprendido de **Python:** **variables**, **listas** y ciclos **for.** Tenemos los siguientes elementos:

1. Una lista de verbos como entradas de diccionario.
2. Glosas de significado de esta lista.
3. Prefijo de parte del cuerpo: më-
4. Sufijo nominalizador (infinitivo): -ti

¿Cómo expresamos esto en términos de **Python**? En realidad, hay muchas respuestas posibles, que dependen de:

1. los elementos de **Python** que utilicemos;
2. la **simpleza** de los códigos; y
3. la manera en que nuestro código pueda ser **reusable.**

Con respecto al primer punto, conocemos **variables**, que asignaremos a los elementos; **listas**, que usaremos para almacenar la información; y ciclos **for**, con el objetivo de ir construyendo formas verbales de forma iterativa. El segundo punto es importante, aunque un poco difícil de explicar. Más bien, transformar este principio en la siguiente pregunta: ¿De todas las formas posibles de plantear este problema, cuál es la **más simple**? A veces en **Python**, se trata de proponer soluciones breves, es decir, que utilizan la menor cantidad de líneas de código (busquen **pythonic** en google). Esto a veces muestra soluciones muy ingeniosas, pero que esconden un problema: los códigos siempre deben ser entendibles por otras personas. 

En lo que sigue, iremos viendo problemas cada vez más complejos, que parten desde una versión simple de la formación de verbos, que permitirán introducir algunos conceptos nuevos de **Python.**

## Problema 1. Construir entradas tipo diccionario de verbos nominalizados y sufijados. 

Cada verbo está asociado a una glosa. Para almacenar este par, usamos **listas** (como siempre). Es decir, usamos

In [1]:
par_verbo = ['Tax','golpear con puño']

La idea, que puede parecer al principio un poco sorprendente, es que estas listas serán almancenadas dentro de otra lista. ¡Listas dentro de listas! Por supuesto, y será una idea que nos acompañará siempre en **Python.** Un aspecto esencial es que sabemos (porque así lo estamos decidiendo) que en cada mini lista (o sub-lista) el primer elemento (de índice 0) es la base verbal, y el segundo elemento (de índice 1) es la glosa. 

In [2]:
## verbos: Tax, Chachi, Tash, Më, Pia a, Berua
## significados: golpear, hincar, dar una cachetada, golpear de cualquier forma, flechar, cuidar 
lista_verbos = [['Tax','golpear con puño'],['Chachi','hincar'],['Tash','palmear'],['Më','golpear'],['Pia a','flechar'],['Berua','cuidarse uno mismo']]

In [3]:
## Creamos dos variables, una para el prefijo y otra para el sufijo. 

## parte del cuerpo: cuyo significado es "mano"
prefijo = 'më-'
## nominalizador
sufijo = '-ti'

¿Cómo procedemos? Debemos **recorrer** los pares almacenados en **lista_verbos** (o sea, usando un ciclo **for**), para ir prefijando y sufijando. 

In [4]:
## Primero. En una lista vacía (típica forma de comenzar), guardaremos sub-listas de cuatro elementos:
## primero: verbo
## segundo: glosa
## tercero: verbo prefijado
## cuarto: verbo prefijado+sufijado
lista_verbos_nom_pref = []

In [5]:
## recorremos los pares de lista_verbos

for par_verbo in lista_verbos:
    ## verbo
    verbo = par_verbo[0]
    ## entrada de "diccionario"
    entrada = []
    ## en entrada guardamos el verbo
    entrada = entrada + [verbo]
    ## agregamos la glosa
    entrada = entrada + [par_verbo[1]]
    ## prefijemos primero
    verbo_prefijado = prefijo + verbo
    ## guardamos el verbo prefijado (en minúscula)
    entrada = entrada + [verbo_prefijado.lower()]
    ## ahora, sufijamos
    verbo_sufijado = verbo_prefijado + sufijo
    ## guardamos la forma sufijada (en minúscula)
    entrada = entrada + [verbo_sufijado.lower()]
    ## guardamos las entradas
    lista_verbos_nom_pref = lista_verbos_nom_pref + [entrada]

In [6]:
lista_verbos_nom_pref

[['Tax', 'golpear con puño', 'më-tax', 'më-tax-ti'],
 ['Chachi', 'hincar', 'më-chachi', 'më-chachi-ti'],
 ['Tash', 'palmear', 'më-tash', 'më-tash-ti'],
 ['Më', 'golpear', 'më-më', 'më-më-ti'],
 ['Pia a', 'flechar', 'më-pia a', 'më-pia a-ti'],
 ['Berua', 'cuidarse uno mismo', 'më-berua', 'më-berua-ti']]

**Otro problema relacionado:** ¿Es posible, para un verbo específico, consultar automáticamente por la forma derivada? Es decir,  ¿Cómo podemos usar **lista_verbos_nom_pref** como una especie de **diccionario**? 

In [7]:
## extraemos la lista de verbos de lista_verbos

## almacenamos el primer elemento de cada par
verbos = []

## recorremos los pares
for par_verbo in lista_verbos:
    ## un verbo es el primer elemento (de índice 0)
    verbo = par_verbo[0]
    ## guardamos el verbo
    verbos = verbos + [verbo]

In [8]:
verbos

['Tax', 'Chachi', 'Tash', 'Më', 'Pia a', 'Berua']

In [9]:
## creamos una consulta. Esto puede cambiar, y cambiará el resultado
verbo_consulta = 'Tax'

## ¿cuál es el índice de verbo_consulta en la lista verbos?
indice_consulta = verbos.index(verbo_consulta)

## extraemos el elemento de índice 3 (el cuarto), en la posición indice_consulta 
resultado = lista_verbos_nom_pref[indice_consulta][3]

In [10]:
resultado

'më-tax-ti'

In [11]:
## otra forma de expresar las líneas anteriores! usemos funciones

## noten que la sintaxis es similar al ciclo for

def formacion_verbos(verbo_consulta):
    ## almacenamos el primer elemento de cada par
    verbos = []

    ## recorremos los pares
    for par_verbo in lista_verbos:
        ## un verbo es el primer elemento (de índice 0)
        verbo = par_verbo[0]
        ## guardamos el verbo
        verbos = verbos + [verbo]
    ## ¿cuál es el índice de verbo_consulta en la lista verbos?
    indice_consulta = verbos.index(verbo_consulta)

    ## extraemos el elemento de índice 3 (el cuarto), en la posición indice_consulta 
    resultado = lista_verbos_nom_pref[indice_consulta][3]
    
    print(resultado)

In [12]:
## verbo a consultar
verbo_consulta = 'Tax'

formacion_verbos(verbo_consulta)

më-tax-ti


In [13]:
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets

In [14]:
interact(formacion_verbos, verbo_consulta = widgets.Dropdown(options = verbos, description="Verbo: "));

interactive(children=(Dropdown(description='Verbo: ', options=('Tax', 'Chachi', 'Tash', 'Më', 'Pia a', 'Berua'…

## Problema 2. Una versión del mismo problema sin construir los datos

En el **problema 1,** primero construimos los datos y luego exploramos mediante la variable verbo_consulta. ¿Será posible construir la respuesta al momento de responder? Por supuesto!

In [15]:
## Creamos dos variables, una para el prefijo y otra para el sufijo. 

## parte del cuerpo: cuyo significado es "mano"
prefijo = 'më-'
## nominalizador
sufijo = '-ti'

En este caso, simplemente creamos una función que recibe **verbo_consulta** y entrega la respuesta

In [16]:
## otra forma de expresar las líneas anteriores! usemos funciones

## noten que la sintaxis es similar al ciclo for

def formacion_verbos2(verbo_consulta):
    
    ## prefijamos 
    verbo_prefijado = prefijo + verbo_consulta
    ## en minúscula
    verbo_prefijado = verbo_prefijado.lower()
    ## ahora, sufijamos
    verbo_sufijado = verbo_prefijado + sufijo
    ## en minúscula
    verbo_sufijado = verbo_sufijado.lower()
    
    print(verbo_sufijado)

In [17]:
## verbo a consultar
verbo_consulta = 'Tax'

formacion_verbos2(verbo_consulta)

më-tax-ti


In [18]:
interact(formacion_verbos2, verbo_consulta = widgets.Dropdown(options = verbos, description="Verbo: "));

interactive(children=(Dropdown(description='Verbo: ', options=('Tax', 'Chachi', 'Tash', 'Më', 'Pia a', 'Berua'…

## Ideas clase Kakataibo!

### introducción a la morfología
- aglutinante: la mayoría de sus procesos son regulares (poca fusión)
    - pi-tëkën-kan-i-n
    - eat-again-PL-IPFV-1/2

- fusional: morfemas portmanteau + segmentos nasales (morfofonológicos)

- complejidad morfológica (número de elementos): estructuras analíticas y sintéticas

- palabras: no muchas palabras tienen muchos morfemas :) Los hablantes prefieren palabras simples

- morfología flexiva y derivativa: elementos obligatorios para ciertas formas verbales (los verbos necesitan aspecto y persona!!!)

- sufijos derivativos y flexivos
    - flexivos --> orden fijo akë-x-a (regla de orden!)
    - derivativos --> orden móvil (con otra interpretación) (pueden ser reemplazados por adverbios) (se pueden repetir)
    - dominios separados: V__DER__FLEX__
    

### morfología verbal
- sufijos verbales derivativos: antes de los flexivos!
- morfemas flexivos: restricciones combinatorias
    - posicionales: orden!!! 
    - slots: I II-A plural II-B III IV
    - cada slot es un paradigma
    - II-B III IV son OBLIGATORIOS

In [24]:
## lista de verbos transitivos
## ¿qué pasa con -ti?
lista_verbos_transitivos = ["mani", "main", "chan", "bexë" , "tson"]
lista_verbos_transitivos_glosas = ["vaciar a otra olla", "enterrar", "romper", "oler la cara", "sentar"]

#### opcional #### 
## slot I
slot_I = ["-bait", "-nët", "-pun", "-rabë́", "-inë", "-itsin", "-këan"]
slot_I_glosas = ["durative, the same day", "durative, the night before", "hours ago", 
          "habitual non-remote past", "durative remote past", "conditional", "frustrative"]

## slot II_A
#slot_II_A = [['-on','the day before'],['-ëxan','days ago']] (ejemplo de representación con lista de listas)
slot_II_A = ["-on", "-ëxan"]
slot_II_A_glosas = ["the day before", "days ago"]

slot_plural = "-kan"

#### obligatorio #### 
## slot_II_B
slot_II_B = ["-i", "-a", "-akë", "-a"]
slot_II_B_glosas = ["imperfective", "remote", "remote past", "stative"]

## slot_III
slot_III = ["-n", "-x", '']
slot_III_glosas = ["first/second person", "third person", "unmarked"]

## slot_IV
slot_IV = ["-a", "-ín"]
slot_IV_glosas = ["non-proximal to the addressee", "proximal to the addressee"]

In [53]:
## Problema: elegir un verbo + cierta información flexiva --> forma flexionada (al menos las formas obligatorias)

## versión 1: todos los morfemas son obligatorios!

## slot_I
slot_I_suffix = "durative, the same day"

## slot_II_A
slot_II_A_suffix = "days ago"

## plural: toma valores 1 o 0; si es 1 se usa "-kan", si es 0 se usa ""
slot_plural = "-kan"

## slot_II_B
slot_II_B_suffix = "remote past"

## slot_III
slot_III_suffix = "first/second person"

## slot_I
slot_IV_suffix = "non-proximal to the addressee"

In [37]:
verbo = "chan"

In [44]:
## índice de las glosa slot_I_suffix en la lista slot_I_glosas
index_slot_I = slot_I_glosas.index(slot_I_suffix)
## sufijo corresondiente al índice index_slot_I en la lista slot_I
suffix_slot_I = slot_I[index_slot_I]

In [45]:
suffix_slot_I

'-bait'

In [46]:
verbo_inflex_slot_I = verbo + suffix_slot_I

In [47]:
verbo_inflex_slot_I

'chan-bait'

In [48]:
## índice de las glosa slot_II_A_suffix en la lista slot_II_A_glosas
index_slot_II_A = slot_II_A_glosas.index(slot_II_A_suffix)
## sufijo corresondiente al índice index_slot_II_A en la lista slot_II_A
suffix_slot_II_A = slot_II_A[index_slot_II_A]

In [49]:
suffix_slot_II_A

'-ëxan'

In [50]:
verbo_inflex_slot_I_IIA = verbo_inflex_slot_I + suffix_slot_II_A

In [51]:
verbo_inflex_slot_I_IIA

'chan-bait-ëxan'

In [54]:
verbo_inflex_slot_I_IIA_plural = verbo_inflex_slot_I_IIA + slot_plural

In [55]:
verbo_inflex_slot_I_IIA_plural

'chan-bait-ëxan-kan'

In [56]:
## índice de las glosa slot_II_B_suffix en la lista slot_II_B_glosas
index_slot_II_B = slot_II_B_glosas.index(slot_II_B_suffix)
## sufijo corresondiente al índice index_slot_II_B en la lista slot_II_B
suffix_slot_II_B = slot_II_B[index_slot_II_B]

In [57]:
suffix_slot_II_B

'-akë'

In [58]:
verbo_inflex_slot_I_IIA_plural_IIB = verbo_inflex_slot_I_IIA_plural + suffix_slot_II_B

In [59]:
verbo_inflex_slot_I_IIA_plural_IIB

'chan-bait-ëxan-kan-akë'

In [61]:
## índice de las glosa slot_III_suffix en la lista slot_III_glosas
index_slot_III = slot_III_glosas.index(slot_III_suffix)
## sufijo corresondiente al índice index_slot_III en la lista slot_III
suffix_slot_III = slot_III[index_slot_III]

In [62]:
suffix_slot_III

'-n'

In [63]:
verbo_inflex_slot_I_IIA_plural_IIB_III = verbo_inflex_slot_I_IIA_plural_IIB + suffix_slot_III

In [64]:
verbo_inflex_slot_I_IIA_plural_IIB_III

'chan-bait-ëxan-kan-akë-n'

In [65]:
## si slot_III es 1°/2° entonces slot IV no va!
## regla de morfofonología

In [19]:
## problemas pendientes:
## 1. según el número de segmentos, depende el prefijo. Alomorfía del ergativo (eminentemente prosódica)
## 2. Anotar las sílabas
## 3. Silabificador para kakataibo
## 4. Conjugar los verbos con sufijos
## 5. tres formas -> encontrar la glosa (clase if/else)
## 6. Generar datos computarizados 
## 7. Minúscula