# **Seminario de métodos computacionales para lenguas amerindias**
### Roberto Zariquiey Biondi, rzariquiey@pucp.edu.pe 
### Javier Vera Zúñiga, jveraz@pucp.edu.pe

# (Aún) más sobre sobre listas 
En este pequeño apunte, vamos a profundizar en la estructura que debería convertirse en favorita: **listas**. Ya sabemos, de forma un poco preliminar, que las listas 

- Son estructuras que **almacenan** elementos; 
- Están **ordenadas**; y
- Sirven para definir **ciclos for.**

Para entender estos tres puntos, debemos profundizar en el manejo de listas, y sus trucos. 

Para partir, usemos el siguiente string, adaptado de [Ada Lovelace](https://es.wikipedia.org/wiki/Ada_Lovelace)

In [3]:
string_bio = 'Augusta Ada King, condesa de Lovelace, registrada al nacer como Augusta Ada Byron y conocida habitualmente como Ada Lovelace, fue una matemática y escritora británica, célebre sobre todo por su trabajo acerca de la computadora mecánica de uso general de Charles Babbage, la denominada máquina analítica. Fue la primera en reconocer que la máquina tenía aplicaciones más allá del cálculo puro y en haber publicado lo que se reconoce hoy como el primer algoritmo destinado a ser procesado por una máquina, por lo que se la considera como la primera programadora de ordenadores.'

Para convertir el string anterior en una lista, debemos primero pensar qué es una palabra. Este problema, que parece inocente, puede volverse muy difícil (o incluso un poco imposible) en ciertas lenguas. En español, una buena aproximación en dividir el string por los espacios en blanco. Es decir,

In [7]:
lista_palabras = string_bio.split(' ')

En la línea anterior, noten que usamos una función predefinida
```python
.split(' ')
```
con el fin de transformar un **string** en una **lista**. Detrás de este proceso, hay dos enseñanzas:

- En **Python**, un elemento puede transformarse de un tipo a otro (en este caso, de **string** a **lista**); y
- Existen operaciones, que llamaremos **funciones**, que predefinidas (por alguien, uno mismo u otros) sirven para operar sobre un elemento y cambiarlo (en este caso, sobre el string, dividiendo por espacios en blanco). 

Pruebe cambiando 
```python
.split(' ')
```
por 

```python
.split('a')
```
¿Qué ocurre?

**EJERCICIO 1:** Detecte automáticamente el número de oraciones contenidas en 
```python
string_bio
```

**Recomendaciones:**

1. Piense en qué es una oración, y trate de expresar esta idea en términos de **Python.**
2. Use todo lo que hemos visto (no es tanto, pero sirve para responder esta pregunta). 

**lista_palabras** es ahora una lista que contiene las palabras, entendidas como secuencias de caracteres separadas por espacios en blanco. 

In [9]:
lista_palabras

['Augusta',
 'Ada',
 'King,',
 'condesa',
 'de',
 'Lovelace,',
 'registrada',
 'al',
 'nacer',
 'como',
 'Augusta',
 'Ada',
 'Byron',
 'y',
 'conocida',
 'habitualmente',
 'como',
 'Ada',
 'Lovelace,',
 'fue',
 'una',
 'matemática',
 'y',
 'escritora',
 'británica,',
 'célebre',
 'sobre',
 'todo',
 'por',
 'su',
 'trabajo',
 'acerca',
 'de',
 'la',
 'computadora',
 'mecánica',
 'de',
 'uso',
 'general',
 'de',
 'Charles',
 'Babbage,',
 'la',
 'denominada',
 'máquina',
 'analítica.',
 'Fue',
 'la',
 'primera',
 'en',
 'reconocer',
 'que',
 'la',
 'máquina',
 'tenía',
 'aplicaciones',
 'más',
 'allá',
 'del',
 'cálculo',
 'puro',
 'y',
 'en',
 'haber',
 'publicado',
 'lo',
 'que',
 'se',
 'reconoce',
 'hoy',
 'como',
 'el',
 'primer',
 'algoritmo',
 'destinado',
 'a',
 'ser',
 'procesado',
 'por',
 'una',
 'máquina,',
 'por',
 'lo',
 'que',
 'se',
 'la',
 'considera',
 'como',
 'la',
 'primera',
 'programadora',
 'de',
 'ordenadores.']

In [10]:
## número de elementos de lista_palabras

numero_palabras = len(lista_palabras)

In [11]:
numero_palabras

93

Sin embargo, es posible que no queramos visualizar las 93 palabras almacenadas en lista_palabras, sino que las primeras 5, ¿Cómo hacemos eso?

In [12]:
muestra_palabras = lista_palabras[:5]

In [13]:
muestra_palabras

['Augusta', 'Ada', 'King,', 'condesa', 'de']

Desmenucemos 

```python
muestra_palabras = lista_palabras[:5]
```

Aparte de la asignación de variable (de derecha a izquierda), nos importan los siguientes elementos:

- Accedemos a un elemento particular de una lista usando **[...]**; y
- si queremos los elementos **hasta** una posición **n**, usamos

```python
lista[:n]
```

También es posible, que queramos visualizar los elementos desde la posición 1

In [14]:
desde_palabras = lista_palabras[1:]

In [15]:
desde_palabras

['Ada',
 'King,',
 'condesa',
 'de',
 'Lovelace,',
 'registrada',
 'al',
 'nacer',
 'como',
 'Augusta',
 'Ada',
 'Byron',
 'y',
 'conocida',
 'habitualmente',
 'como',
 'Ada',
 'Lovelace,',
 'fue',
 'una',
 'matemática',
 'y',
 'escritora',
 'británica,',
 'célebre',
 'sobre',
 'todo',
 'por',
 'su',
 'trabajo',
 'acerca',
 'de',
 'la',
 'computadora',
 'mecánica',
 'de',
 'uso',
 'general',
 'de',
 'Charles',
 'Babbage,',
 'la',
 'denominada',
 'máquina',
 'analítica.',
 'Fue',
 'la',
 'primera',
 'en',
 'reconocer',
 'que',
 'la',
 'máquina',
 'tenía',
 'aplicaciones',
 'más',
 'allá',
 'del',
 'cálculo',
 'puro',
 'y',
 'en',
 'haber',
 'publicado',
 'lo',
 'que',
 'se',
 'reconoce',
 'hoy',
 'como',
 'el',
 'primer',
 'algoritmo',
 'destinado',
 'a',
 'ser',
 'procesado',
 'por',
 'una',
 'máquina,',
 'por',
 'lo',
 'que',
 'se',
 'la',
 'considera',
 'como',
 'la',
 'primera',
 'programadora',
 'de',
 'ordenadores.']

¿Y podemos combinar todo lo anterior? **Por supuesto!**

In [16]:
muestra_palabras = lista_palabras[:5]
desde_palabras = lista_palabras[1:5]

In [17]:
muestra_palabras

['Augusta', 'Ada', 'King,', 'condesa', 'de']

In [18]:
desde_palabras

['Ada', 'King,', 'condesa', 'de']

**EJERCICIO 2:** Investigue sobre índices negativos en listas, ¿Qué indica la siguiente? 
```python
lista_palabras[-1]
```

Con todo lo anterior, pensemos en el siguiente problema. Supongamos que para cada palabra de **lista_palabras** queremos guardar la palabra que está a la derecha. Esto tiene múltiples aplicaciones, entre ellas, el estudio de contextos de aparición de palabras ¿Cómo resolvemos este problema? Este problema se podría resolver de muchas formas. Aquí buscaremos una solución simple, basada en las posibilidades que nos entregan los índices de las listas. 

Noten que los elementos sucesivos de **muestra_palabras** son exactamente lo que buscamos: el primer elemento de esta lista es el segundo elemento de **muestra_palabras**, y así sucesivamente. 

En resumen, la solución aparece al utilizar

```python
lista_palabras
```
y

```python
lista_palabras[1:]
```

In [None]:
## aquí guardamos lo que estamos buscando
lista_palabras_sucesivas = []

## recorremos las palabras de lista_palabras


In [1]:
## Partamos con un problema (muy) simple. En la lista lista_palabras, tenemos un conjunto de strings

lista_palabras = ['palabra1','palabra2','palabra3','palabra4','palabra5','palabra6']

In [2]:
lista_palabras

['palabra1', 'palabra2', 'palabra3', 'palabra4', 'palabra5', 'palabra6']

In [3]:
## la idea es agregar a cada string un sufijo

sufijo = '-plural'

In [4]:
## NOTA: para concatenar dos strings, simplemente usamos "+". Por ejemplo,

string1 = 'a'
string2 = 'b'

In [5]:
string_concatenado = string1+string2

In [6]:
string_concatenado

'ab'

In [7]:
## ahora, volvamos a nuestro problema! :) Supongamos que en cada string de "lista_palabras" queremos agregar el sufijo sufijo.
## ¿Cómo lo hacemos? Primero, de una forma al parecer un poco lenta!

lista_palabras_sufijadas = ['palabra1'+sufijo,'palabra2'+sufijo,'palabra3'+sufijo,'palabra4'+sufijo,'palabra5'+sufijo,'palabra6'+sufijo,]

In [8]:
lista_palabras_sufijadas

['palabra1-plural',
 'palabra2-plural',
 'palabra3-plural',
 'palabra4-plural',
 'palabra5-plural',
 'palabra6-plural']

In [10]:
## es decir, manualmente agregamos el sufijo a cada palabra. Esto parece ser inmanejable si tenemos muchas palabras!
## usemos un ciclo for!!!!

## Los ciclos for, en Python, se basan en que las listas están ordenadas! Esto significa que existe un primer elemento, asociado al índice 0,
## un segundo elemento, asociado al índice 1, y así sucesivamente hasta el elemento final, asociado al índice (largo de la lista menos 1)

## En términos prácticos, al elegir los índices (o los elementos) de una lista sucesivamente podemos realizar cualquier operación
## que deba realizarse tantas veces como el largo de una lista. Esto es muy importante :) Miren esto,

palabra_sufijada1 = lista_palabras[0]+sufijo

In [11]:
palabra_sufijada1

'palabra1-plural'

In [12]:
## y si esto lo realizamos para todas las palabras que faltan

palabra_sufijada2 = lista_palabras[1]+sufijo
palabra_sufijada3 = lista_palabras[2]+sufijo
palabra_sufijada4 = lista_palabras[3]+sufijo
palabra_sufijada5 = lista_palabras[4]+sufijo
palabra_sufijada6 = lista_palabras[5]+sufijo

In [13]:
## Con esto,

lista_palabras_sufijadas = [palabra_sufijada1,palabra_sufijada2,palabra_sufijada3,palabra_sufijada4,palabra_sufijada5,palabra_sufijada6]

In [14]:
lista_palabras_sufijadas

['palabra1-plural',
 'palabra2-plural',
 'palabra3-plural',
 'palabra4-plural',
 'palabra5-plural',
 'palabra6-plural']

In [15]:
## Seguimos haciendo muchas veces una misma operación! Lo importante es que necesitamos una forma de "iterar", es decir, de recorrer
## la lista lista_palabras, y ordenadamente desde el primer elemento, hasta el último, ir agregando el sufijo. Para esto, 
## usamos un ciclo "for"!!!

## definamos una lista vacía

lista_palabras_sufijadas = []

In [16]:
lista_palabras_sufijadas

[]

In [17]:
## En esta lista, iremos guardando los elementos de "lista_palabras" que vayamos sufijando ¿Cómo hacemos esto?
## Esencialmente, de dos formas equivalentes:

### o bien, recorremos los "índices" de lista_palabras 

### o bien, recorremos los "elementos" de lista_palabras

## y vamos sufijando!

In [18]:
## OPCIÓN 1: índices de lista_palabras
## para obtener los índices, usamos range! range es una lista (o casi) que nos entrega números entre 0 y el número que indiquemos
## Es decir,

list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [19]:
## entrega números entre 0 y 9. Esto calza perfecto con los índices de los elementos de una lista de largo 10!!!
## en nuestro caso, esto queda

N = list(range(len(lista_palabras)))

In [20]:
N

[0, 1, 2, 3, 4, 5]

In [21]:
## noten que N es una lista que contiene los índices de los elementos de la lista lista_palabras ¿Cómo usamos esto?

## recorremos los elementos de lista_palabras a través de sus índices. 
for i in N:
    ## i es una variable, que en cada paso cambia de valor (0,1,...,5)
    ## elemento de lista_palabras en la posición i
    palabra = lista_palabras[i]
    ## sufijamos!
    palabra_sufijada = palabra+sufijo
    ## guardamos!
    lista_palabras_sufijadas+=[palabra_sufijada]

In [22]:
## y mágicamente estamos ok!

lista_palabras_sufijadas

['palabra1-plural',
 'palabra2-plural',
 'palabra3-plural',
 'palabra4-plural',
 'palabra5-plural',
 'palabra6-plural']

In [23]:
## volvemos a definir esta lista como vacía

lista_palabras_sufijadas = []

In [24]:
## OPCIÓN 2: elementos de lista_palabras
## la idea es recorrer los elementos de lista_palabras, que sabemos están ordenados

## ahora, recorremos los elementos de lista_palabras. Sabemos que están ordenados! Por esto, palabra es primero, el primer elemento
## luego, el segundo elemento, y así sucesivamente hasta el último elemento de la lista

## palabra es una variable en este caso, que en cada paso se reasigna a un elemento de la lista lista_palabras
for palabra in lista_palabras:
    ## sufijamos!
    palabra_sufijada = palabra+sufijo
    ## guardamos!
    lista_palabras_sufijadas+=[palabra_sufijada]

In [25]:
## y nuevamente obtenemos lo que buscábamos!

lista_palabras_sufijadas

['palabra1-plural',
 'palabra2-plural',
 'palabra3-plural',
 'palabra4-plural',
 'palabra5-plural',
 'palabra6-plural']