# **Análisis Computacional de Datos Lingüísticos**
### Javier Vera Zúñiga, javier.vera@pucv.cl
## **Clase 2**

### A. Listas en **Python.** (clase 1)
Podemos decir que a **Python** le gustan las **listas.** Esta estructura aparece en muchos lados como una manera de ordenar datos, y al mismo tiempo como una forma de iterar operaciones (repetir una tarea una cantidad definida de veces). En **Python**, las listas se definen (relajadamente) como una secuencia ordenada de **"cosas".** Estas **"cosas"** pueden ser cualquier **cosa**, incluso otras listas. Veamos ejemplos **:)**

#### definiciones básicas! :)

In [1]:
## definamos la lista A. Las listas se pueden definir vacías

A = []

## o bien con algún elemento adentro

B = ['verde','casa','perro'] 

In [2]:
B

['verde', 'casa', 'perro']

In [3]:
## OJO!!! Si notan en las asignaciones anteriores, utilizamos el signo "=". En Python (y en muchos lenguajes), este signo 
## no indica "igualdad", sino algo más interesante: en "A = []", decimos "lo que está a la derecha de "=" se asigna al nombre
## "A". Para la igualdad lógica se usa doble signo de igualdad "=="."

In [4]:
2==3,3==3,2==2*1

(False, True, True)

In [5]:
## también podemos definir A con el operador list(). Este operador puede convertir cosas en listas. Pruebe!!!

#A = list()

In [6]:
## ¿cómo podemos ver qué hay en una lista? Imprimiéndola! Con "len", obtenemos el número de elementos que posee la lista. 

print(len(A)) ## esto es esperable, A no tiene elementos
print(len(B)) ## sabemos que B tiene tres elementos, inicialmente

0
3


In [7]:
## la propiedad esencial de las listas es que están ordenadas!!!
## por esta razón, tienen posiciones! Insisto: los elementos están asociados a un índice, que puede recorrerse. 

print(B[0],B[1],B[2])

verde casa perro


In [8]:
## las listas pueden indexarse por índices, como vimos arriba, 
## B[0]
## o bien, por rebanadas!!!

B_slice = B[1:2]

In [9]:
B_slice

['casa']

In [10]:
## entonces, el primer índice indica "desde índice x" y el segundo "hasta antes del índice y"

B_slice = B[0:3]

In [11]:
B_slice

['verde', 'casa', 'perro']

##### mini-ejercicio 1: pruebe, además, qué ocurre con 
```python
B[:2]
```
y 
```python
B[:1]
```

In [12]:
B

['verde', 'casa', 'perro']

In [14]:
## ¿Qué pasa si imprimimos B[3]? ¿A[0]?

print(A[0])

IndexError: list index out of range

In [15]:
B[0]

'verde'

In [16]:
len(B)

3

In [17]:
## si imprimimos la línea anterior, obtenemos un "IndexError". Es decir, Python nos dice "ojo!!! no existen elementos
## asociados a tales índices
## noten que el máximo índice posible es "largo de la lista menos 1"!!!

In [18]:
## => solo podemos imprimir los elementos en posiciones menores al largo

b = len(B)
a = len(A)

In [19]:
print(a)
print(b)

0
3


In [20]:
## ahora, los enteros "a" y "b" tienen un espacio de memoria asignado que guarda los valores 0 y 3. Podemos utilizarlos 
## como queramos, por ejemplo

c = a+3*(2-b)

In [21]:
print(c)

-3


In [22]:
A

[]

In [23]:
A

[]

#### agreguemos elementos a listas! :) Las listas son como una **cola** de supermercado. El primero que llega (si nadie se aprovecha) es el primero en ser atendido. Entonces, agregar elementos a una lista implica que estos queden al final :)

In [25]:
## ¿Agregar elementos? Sabemos el símbolo "=" no es "igual": indica que lo que está a la
## derecha de "=" se asigna a lo que está a la izquierda de "="
## ¿Qué pasa si aprietan "run" muchas veces?

A = A + ['chao']

In [26]:
A

['chao', 'chao']

In [27]:
## el símbolo "+" indica "concatenación", y se usa en muchos contextos!. Noten que para agregar 'hola' a A, es necesario que 
##'hola' esté adentro de una lista, es decir ['hola']. En general, podemos concatenar (usando "+") elementos del mismo tipo. 
## Prueben la siguiente asignación y miren el error!

In [28]:
type(A)

list

In [29]:
type(['hola'])

list

In [30]:
A = A + 'hola'

TypeError: can only concatenate list (not "str") to list

In [31]:
## miremos A

A

['chao', 'chao']

#### ciclos for :)

In [32]:
A

['chao', 'chao']

In [33]:
## ¿Podemos automatizar el proceso de agregar elementos a una lista? Sí se puede!!!, usemos "ciclos for"!!!
## Un ciclo "for" ejecuta una acción muchas veces, y esas veces están definidas con una lista!!!

for item in A: ## ciclo "for" definido con los elementos de A
    print(item)

chao
chao


In [34]:
## OJO!!! Para Python, las listas y los ciclos "for" son lo mismo! Esto puede parecer raro al principio, pero encierra algo
## muy conveniente: debemos aprender qué representación es mejor para cada contexto. 

Desmenucemos un poco el ciclo **for** de más arriba. 

La primera línea
```python
for item in A:
```
tiene varios elementos: (1) **for**; (2) **item**; (3) **in**; (4) **A**; y (5) **:**.
1. **for**: esta palabra (que se colorea en **jupyter**) es un indicador de que viene un ciclo de este tipo (hay otros!)
2. **item** es un nombre: **Python** nos dice que en cada paso del ciclo **for** tomamos un nuevo elemento de **A** que se llama **item**. Podríamos usar cualquier nombre. 
3. **in** es otra palabra coloreada (que no podemos usar como nombre para algo) y que dice **dónde**.
4. **A** es la lista que recorremos!
5. El signo **:** es imprescindible. Además, si apretamos **enter** luego de este signo, el salto de línea aparece automáticamente. 

La segunda línea
```python
print(item)
```
siempre indica qué queremos hacer en cada paso. 

In [35]:
## otra versión de lo mismo. Un ciclo "for" puede recorrer directamente los elementos de una lista, como arriba, o bien los
## elementos asociados a posiciones específicas. Veamos!

for i in range(len(A)): ## ciclo "for" definido con los índices (las posiciones) de A
    print(A[i])

chao
chao


In [36]:
print(i)

1


##### mini-ejercicio 2: desmenuce la línea

```python
for i in range(len(A)):
```

indicación: utilice 

```python
list(range(n))
```

para visualizar este operador. 

In [37]:
## range!

print(range(len(A)))
print(list(range(len(A))))

range(0, 2)
[0, 1]


In [38]:
## es decir, "range(X)" entrega todos los números entre 0 y X-1. "range" es, a su vez, un tipo de lista. 
## Conclusión: ciclos "for" son equivalentes a listas. Eso es muy cómodo!

for i in range(len(A)):
    A = A + ['hola'] ## aquí en cada paso agregamos 'hola' a "A"

In [39]:
print(A)

['chao', 'chao', 'hola', 'hola']


In [40]:
## otro ejemplo: 

print(len(A))
print(len(B))

for item in B:
    A = A + [item]

print(A)
print(len(A))

## Es decir, agregamos (por cada elemento de B) un 'hola' a A!

4
3
['chao', 'chao', 'hola', 'hola', 'verde', 'casa', 'perro']
7


##### mini-ejercicio 3: explique qué hace el código

```python
for item in B:
    A = A + [item]
```

In [41]:
## otra ejemplo: definimos una lista vacía y guardamos los elementos de "A" en "C". 

C = []
for item in A:
    C = C + ['hola']

In [42]:
C

['hola', 'hola', 'hola', 'hola', 'hola', 'hola', 'hola']

##### ciclos for en 1 dimensión :)

In [43]:
## Como hemos visto, los ciclos "for" tienen dos dimensiones: una línea que los define y otras posibles líneas donde indicamos
## qué hacemos "dentro" del ciclo "for". Sin embargo, sabemos que los ciclos "for" son expresables como listas. 
## ¿Qué más podemos hacer?

C = [item for item in A]

```python
C = [item for item in A]
```
es equivalente a 

```python
C = []
for item in A:
    C = C + [item]
```

noten que en estas dos representaciones (a **Python** le gusta más la primera :)) los elementos de la lista que usamos para definir el ciclo **for** (**A**) son utilizados para hacer algo con este ciclo. Sin embargo, esto no es necesario! Miren la línea siguiente :)

In [44]:
C = ['chao' for item in A]

## ¿Qué es mejor?: for en 2D o en 1D? :)

In [45]:
C

['chao', 'chao', 'chao', 'chao', 'chao', 'chao', 'chao']

### B. Diccionarios en **Python!**
Además de listas, una idea muy útil es trabajar con **diccionarios.** A **Python** le encantan los diccionarios. Esta estructura se define como esperamos que se defina: existen **keys** (las entradas del diccionario), y **values** (las definiciones). El aspecto **central** es el siguiente: los **diccionarios**, a diferencia de las **listas**, **no están ordenados!!!** Esta es una ventaja: si no asignamos posiciones, entonces no necesitamos un lugar en la memoria para este propósito. Por eso, usemos **diccionarios** cada vez que podamos :)

In [46]:
## definamos un diccionario vacío, usamos llaves "{}" en vez de "[]"

D = {}

In [47]:
D

{}

In [66]:
N = {'hola':{},'chao':[2]}

In [79]:
N['chao']

[2]

In [76]:
N

{'hola': {}, 'chao': [2], 'perro': 5}

In [78]:
N.keys()

dict_keys(['hola', 'chao', 'perro'])

In [68]:
V = {1:'hola',2:'chao'}

In [69]:
V.keys()

dict_keys([1, 2])

In [70]:
V.values()

dict_values(['hola', 'chao'])

In [71]:
## ¿cómo agregamos elementos? Los diccionarios tienen keys y values (como entrada y definición)
## los keys pueden ser (típicamente números o nombres). Los values pueden ser cualquier cosa :) Veamos!

D = {1:['hola','chao'], 2:45, 'hola':'chao'}

In [72]:
D

{1: ['hola', 'chao'], 2: 45, 'hola': 'chao'}

In [106]:
D.keys()

dict_keys([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [107]:
D[1]

2

In [108]:
## los diccionarios NO tienen orden, solo entradas!

print(D[1])
print(D[2])
print(D['hola'])

2
3


KeyError: 'hola'

In [109]:
A = []
for item in range(5):
    A = A + [item]

In [88]:
A

[0, 1, 2, 3, 4]

In [89]:
A = [item for item in range(5)]

In [91]:
A

[0, 1, 2, 3, 4]

In [97]:
## un diccionario más en serio!
## notemos que usamos un ciclo "for" en 1 dimensión para la definición de "D". Tal como en las listas, podemos definir "D"
## en 1 dimensión

D = {i:i+1 for i in range(10)}

In [98]:
D

{0: 1, 1: 2, 2: 3, 3: 4, 4: 5, 5: 6, 6: 7, 7: 8, 8: 9, 9: 10}

In [99]:
D={}

In [100]:
len(D)

0

In [101]:
## o bien, en dos dimensiones!!!

D={}

for i in [0,1,2,3,4,5,6,7,8,9]:
    D[i]=i+1
    

In [115]:
D={}

In [116]:
D[0]=1

In [117]:
D

{0: 1}

In [118]:
D[1]=2

In [119]:
D

{0: 1, 1: 2}

In [130]:
K = [0]*100

In [132]:
len(K)

100

In [133]:
M = ['chao']*5+['hola']*5

In [134]:
M

['chao',
 'chao',
 'chao',
 'chao',
 'chao',
 'hola',
 'hola',
 'hola',
 'hola',
 'hola']

In [141]:
## o bien, en dos dimensiones!!!

D={0:49355}
for i in range(10):
    D[i]=M[i]
    
## en la línea D[i]=i+1 se crea el key "i", asignado al value "i+1". 

In [142]:
D

{0: 'chao',
 1: 'chao',
 2: 'chao',
 3: 'chao',
 4: 'chao',
 5: 'hola',
 6: 'hola',
 7: 'hola',
 8: 'hola',
 9: 'hola'}

In [112]:
## no es la posición "5", sino es que la "entrada" o "key" 5!!!

D[5]

6

In [113]:
## ¿Cómo extraemos los keys y values?

## keys!

keys = list(D.keys())
print(keys)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [114]:
## values!

values = list(D.values())
print(values)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


##### ejercicio: contemos las palabras de un texto!

In [147]:
## texto 
texto = 'El Mapuche también conocido como mapudungún del autoglotónimo mapudungun lengua de la tierra o araucano es el idioma de los mapuches un pueblo amerindio que habita los actuales países de Chile y Argentina Su número de hablantes activos se estima entre 100000 y 200000 y el número de hablantes pasivos en unas 100000 personas más Ha influido el léxico del español en su área de distribución y a su vez el suyo ha incorporado palabras del español y del quechua No ha sido clasificada satisfactoriamente y por el momento se la considera una lengua aislada'

In [148]:
## cosas de deberíamos hacer (simplificando las cosas)
## 1. dividir en palabras (el espacio entre dos puntos en blanco)
## 2. palabras en minúscula

## Queda como lista!!!

texto_split = texto.split()

In [149]:
texto_split[:20]

['El',
 'Mapuche',
 'también',
 'conocido',
 'como',
 'mapudungún',
 'del',
 'autoglotónimo',
 'mapudungun',
 'lengua',
 'de',
 'la',
 'tierra',
 'o',
 'araucano',
 'es',
 'el',
 'idioma',
 'de',
 'los']

La **noción de palabra** (definida como la secuencia de caracteres entre dos espacios en blanco) es problemática. Algunos papers interesantes:

1. Bickel, Balthasar & Fernando Zúñiga. 2017. The ’word’ in polysynthetic languages: phonological and syntactic challenges. In Michael Fortescue, Marianne Mithun & Nicholas Evans (eds.), The handbook of polysynthesis, 158-185. Oxford: Oxford University Press.
2. Spencer, Andrew & Ana Luís. 2012. The canonical clitic. In Dunstan Brown, Marina Chumakina & Greville Corbett (eds.), Canonical morphology and syntax, 123–150. Oxford: Oxford University Press. Haspelmath, Martin 2011. The indeterminacy of word segmentation and the nature of morphology and syntax. Folia Linguistica 45(1), 31–80.

¿Cómo influye la noción de "palabra" en el conteo de palabras? ¿Qué ocurre en lenguas polisintéticas?

In [150]:
## ¿Cómo queda "text_split"?

texto_split[:10]

['El',
 'Mapuche',
 'también',
 'conocido',
 'como',
 'mapudungún',
 'del',
 'autoglotónimo',
 'mapudungun',
 'lengua']

In [151]:
## veamos dos formas de poner las palabras en minúscula: en una línea o bi-dimensional!!!

## 1 línea :)
## en cada paso de ciclo, un elemento sucesivo de "texto_split" es llamado "word" y se agrega a la lista luego de aplicar
## "word.lower()"

texto_split_min = []
for word in texto_split:
    texto_split_min = texto_split_min + [word.lower()]

In [152]:
texto_split_min[:5]

['el', 'mapuche', 'también', 'conocido', 'como']

In [153]:
## más de 1 línea :)
## en cada paso del ciclo, un elemento sucesivo de "texto_split" es llamado "palabra". Luego, "palabra.lower()" es agregado a
## la lista "text_split_min", que se define inicialmente vacía. 
text_split_min = []
for palabra in texto_split:
    text_split_min = text_split_min + [palabra.lower()]

In [154]:
text_split_min[:5]

['el', 'mapuche', 'también', 'conocido', 'como']

In [158]:
## ¿Y si juntamos todo? :) Usemos funciones!!!

## input: T es un string del corpus ...
## output: listas de strings en minúscula
def preparacion_texto(T):

    texto_split = T.split()
    texto_preparado = []
    for palabra in texto_split:
        texto_preparado = texto_preparado + [palabra.lower()]
    return texto_preparado

In [159]:
A = preparacion_texto(texto)

In [160]:
A[:20]

['el',
 'mapuche',
 'también',
 'conocido',
 'como',
 'mapudungún',
 'del',
 'autoglotónimo',
 'mapudungun',
 'lengua',
 'de',
 'la',
 'tierra',
 'o',
 'araucano',
 'es',
 'el',
 'idioma',
 'de',
 'los']

Desmenucemos un poco la **función** de más arriba. 

La primera línea
```python
def preparacion_texto(T):
```
tiene varios elementos: (1) **def**; (2) **preparacion_texto**; (3) **T**; y (4) **:**.
1. **def**: otra palabra coloreada en **jupyter**) que funciona como indicador de que viene una función. 
2. **preparacion_texto** es el nombre de la función. Con este nombre, podemos reutilizarla más adelante.  
3. **T** es el **input** de la función. Pueden ser uno o varios inputs. 
4. El signo **:** es imprescindible. Además, si apretamos **enter** luego de este signo, el salto de línea aparece automáticamente. 

La dos líneas siguientes 
```python
texto_split = T.split(' ')
texto_preparado = [word.lower() for word in texto_split]
```
son el cuerpo de la función: separamos por espacios en blanco y podemos en minúsculas. 

La línea final 

```python
return texto_preparado
```

entrega el **output**. 

##### mini-ejercicio 4: implemente funciones que hagan las siguientes cosas

1. función **suma**: recibe un entero **n** y suma todos los números menores o iguales a **n**. No use la función **sum** :)
2. función **2grama**: recibe un string **T** (un texto) y entrega todos los bigramas, es decir las secuencias de dos palabras sucesivas. 
3. función **ngrama**: recibe un string **T** (un texto) y entrega todos los ngramas, es decir las secuencias de n palabras sucesivas.  
4. función **nostops**: recibe un string **T** (un texto) y una lista **S**. Entrega una lista de palabras que no aparezcan en **S**. 
5. función **alreves**: recibe un string **T** (un texto) y entrega una lista de strings ordenamos al revés. La última palabra primera, y así sucesivamente. Indicación: pueden usar índices negativos!

In [161]:
## usamos la función y le asignamos un nombre!

texto = preparacion_texto(texto)

In [162]:
texto[:10]

['el',
 'mapuche',
 'también',
 'conocido',
 'como',
 'mapudungún',
 'del',
 'autoglotónimo',
 'mapudungun',
 'lengua']

In [164]:
len(texto)

95

In [163]:
## Implementemos una función que identifique las palabras únicas de un texto (los types). 

## input: T es un string
## output: lista de strings no repetidos
palabras_unicas = []

for palabra in texto:
    if palabra not in palabras_unicas:
        palabras_unicas = palabras_unicas + [palabra]
    

In [165]:
len(palabras_unicas)

64

In [166]:
len(palabras_unicas)/len(texto)

0.6736842105263158

###### mini-ejercicio 5: función diccionario_posiciones
Esta **función** recibe un string **T** y entrega un diccionario de palabras únicas **D** (usando la función **conteo**), en donde los **values** son listas que indican las posiciones (en el texto dividido en palabras) en donde aparece cada **key**. Es decir, por ejemplo, 

```python
D['el']
```
tener la forma

```python
[1,20]
```

In [73]:
## ahora contemos palabras
## hay muchas formas de hacerlo. Para los sofisticados (busquen "Counter" en la librería collections)
## usemos una forma que utilice los conceptos que hemos aprendido

palabras_unicas = []

for palabra in texto:
    if palabra not in palabras_unicas:
        palabras_unicas += [palabra]

In [74]:
len(palabras_unicas)

64

In [75]:
## otra forma!

palabras_unicas = []

for palabra in texto:
    if palabra not in palabras_unicas:
        palabras_unicas.append(palabra)

In [76]:
len(palabras_unicas)

64

In [77]:
len(palabras_unicas)

64

In [78]:
## ¿Cuántas palabras?

print(len(texto))
print(len(palabras_unicas))

95
64


In [79]:
## sigamos! ya que tenemos una manera de identificar las palabras no-repetidas de un texto, queremos definir un diccionario
## de frecuencias. Comencemos con uno en donde los values son 0 :)

D = {palabra:0 for palabra in palabras_unicas}

In [80]:
D['el']

0

In [81]:
## Idea!!! recorrer "texto" e ir sumando 1 cada que vez que aparece una palabra

for palabra in texto:
    
    D[palabra] += 1

In [82]:
D

{'el': 6,
 'mapuche': 1,
 'también': 1,
 'conocido': 1,
 'como': 1,
 'mapudungún': 1,
 'del': 4,
 'autoglotónimo': 1,
 'mapudungun': 1,
 'lengua': 2,
 'de': 6,
 'la': 2,
 'tierra': 1,
 'o': 1,
 'araucano': 1,
 'es': 1,
 'idioma': 1,
 'los': 2,
 'mapuches': 1,
 'un': 1,
 'pueblo': 1,
 'amerindio': 1,
 'que': 1,
 'habita': 1,
 'actuales': 1,
 'países': 1,
 'chile': 1,
 'y': 6,
 'argentina': 1,
 'su': 3,
 'número': 2,
 'hablantes': 2,
 'activos': 1,
 'se': 2,
 'estima': 1,
 'entre': 1,
 '100000': 2,
 '200000': 1,
 'pasivos': 1,
 'en': 2,
 'unas': 1,
 'personas': 1,
 'más': 1,
 'ha': 3,
 'influido': 1,
 'léxico': 1,
 'español': 2,
 'área': 1,
 'distribución': 1,
 'a': 1,
 'vez': 1,
 'suyo': 1,
 'incorporado': 1,
 'palabras': 1,
 'quechua': 1,
 'no': 1,
 'sido': 1,
 'clasificada': 1,
 'satisfactoriamente': 1,
 'por': 1,
 'momento': 1,
 'considera': 1,
 'una': 1,
 'aislada': 1}

In [83]:
## ¿Y si juntamos todo? :) Usemos funciones!!!
## ejercicio: crear una función que reciba un texto y entregue el diccionario D :)
## otro ejercicio: crear una función que reciba un string y entregue los mismo que la función anterior.
## indicación para el otro ejercicio: puede utilizar una función dentro de otra función :)

In [84]:
## definamos la función frecuencias :)

## input: string T
## output: diccionario de frecuencias D
def frecuencias(T):
    ## dividimos la función en tres partes:
    ## 1. parte A: "T" es transformado a una lista de strings en minúscula "texto_preparado"
    ## 2. parte B: identificamos las palabras únicas de "texto_preparado" y las guardamos en "palabras_unicas"
    ## 3. parte C: construimos el diccionario de frecuencia usando los elementos de "palabras_unicas" como keys
    
    ## parte A
    #texto_tokenizado = preparacion_texto(T) ## usamos la función previa "preparacion_texto"
    ## dividimos en palabras
    texto_tokenizado = T.split(' ')
    ## palabras en minúsculas ## en 2D!!!
    texto_tokenizado = [palabra.lower() for palabra in texto_tokenizado if palabra not in list('``!"#$%&\¿()*+,-./:;<=>?@[\\]_{|}')]
    
    ## parte B
    ## iniciamos con una lista vacía
    palabras_unicas = []
    ## recorremos el texto_tokenizado
    for palabra in texto_tokenizado:
        ## si una palabra no está, entonces la agregamos :)
        if palabra not in palabras_unicas:
            palabras_unicas.append(palabra)
    
    ## parte C
    ## diccionado de frecuencias iniciado con ceros
    D = {palabra:0 for palabra in palabras_unicas}
    ## recorremos texto_tokenizado y sumamos 1 cada vez que aparece una palabra
    for palabra in texto_tokenizado:
        D[palabra] += 1
    
    return D

In [85]:
texto = 'El Mapuche también conocido como mapudungún del autoglotónimo mapudungun lengua de la tierra o araucano es el idioma de los mapuches un pueblo amerindio que habita los actuales países de Chile y Argentina Su número de hablantes activos se estima entre 100000 y 200000 y el número de hablantes pasivos en unas 100000 personas más Ha influido el léxico del español en su área de distribución y a su vez el suyo ha incorporado palabras del español y del quechua No ha sido clasificada satisfactoriamente y por el momento se la considera una lengua aislada'

In [86]:
freq_example = frecuencias(texto)

In [87]:
freq_example

{'el': 6,
 'mapuche': 1,
 'también': 1,
 'conocido': 1,
 'como': 1,
 'mapudungún': 1,
 'del': 4,
 'autoglotónimo': 1,
 'mapudungun': 1,
 'lengua': 2,
 'de': 6,
 'la': 2,
 'tierra': 1,
 'o': 1,
 'araucano': 1,
 'es': 1,
 'idioma': 1,
 'los': 2,
 'mapuches': 1,
 'un': 1,
 'pueblo': 1,
 'amerindio': 1,
 'que': 1,
 'habita': 1,
 'actuales': 1,
 'países': 1,
 'chile': 1,
 'y': 6,
 'argentina': 1,
 'su': 3,
 'número': 2,
 'hablantes': 2,
 'activos': 1,
 'se': 2,
 'estima': 1,
 'entre': 1,
 '100000': 2,
 '200000': 1,
 'pasivos': 1,
 'en': 2,
 'unas': 1,
 'personas': 1,
 'más': 1,
 'ha': 3,
 'influido': 1,
 'léxico': 1,
 'español': 2,
 'área': 1,
 'distribución': 1,
 'a': 1,
 'vez': 1,
 'suyo': 1,
 'incorporado': 1,
 'palabras': 1,
 'quechua': 1,
 'no': 1,
 'sido': 1,
 'clasificada': 1,
 'satisfactoriamente': 1,
 'por': 1,
 'momento': 1,
 'considera': 1,
 'una': 1,
 'aislada': 1}