# **Seminario de métodos computacionales para lenguas amerindias**
### Roberto Zariquiey Biondi, rzariquiey@pucp.edu.pe 
### Javier Vera Zúñiga, jveraz@pucp.edu.pe

# (Aún) más sobre sobre listas 
En este pequeño apunte, vamos a profundizar en la estructura que debería convertirse en favorita: **listas**. Ya sabemos, de forma un poco preliminar, que las listas 

- Son estructuras que **almacenan** elementos; 
- Están **ordenadas**; y
- Sirven para definir **ciclos for.**

Para entender estos tres puntos, debemos profundizar en el manejo de listas, y sus trucos. 

Para partir, usemos el siguiente string, adaptado de [Ada Lovelace](https://es.wikipedia.org/wiki/Ada_Lovelace)

In [3]:
string_bio = 'Augusta Ada King, condesa de Lovelace, registrada al nacer como Augusta Ada Byron y conocida habitualmente como Ada Lovelace, fue una matemática y escritora británica, célebre sobre todo por su trabajo acerca de la computadora mecánica de uso general de Charles Babbage, la denominada máquina analítica. Fue la primera en reconocer que la máquina tenía aplicaciones más allá del cálculo puro y en haber publicado lo que se reconoce hoy como el primer algoritmo destinado a ser procesado por una máquina, por lo que se la considera como la primera programadora de ordenadores.'

Para convertir el string anterior en una lista, debemos primero pensar qué es una palabra. Este problema, que parece inocente, puede volverse muy difícil (o incluso un poco imposible) en ciertas lenguas. En español, una buena aproximación en dividir el string por los espacios en blanco. Es decir,

In [7]:
lista_palabras = string_bio.split(' ')

En la línea anterior, noten que usamos una función predefinida
```python
.split(' ')
```
con el fin de transformar un **string** en una **lista**. Detrás de este proceso, hay dos enseñanzas:

- En **Python**, un elemento puede transformarse de un tipo a otro (en este caso, de **string** a **lista**); y
- Existen operaciones, que llamaremos **funciones**, que predefinidas (por alguien, uno mismo u otros) sirven para operar sobre un elemento y cambiarlo (en este caso, sobre el string, dividiendo por espacios en blanco). 

Pruebe cambiando 
```python
.split(' ')
```
por 

```python
.split('a')
```
¿Qué ocurre?

**EJERCICIO 1:** Detecte automáticamente el número de oraciones contenidas en 
```python
string_bio
```

**Recomendaciones:**

1. Piense en qué es una oración, y trate de expresar esta idea en términos de **Python.**
2. Use todo lo que hemos visto (no es tanto, pero sirve para responder esta pregunta). 

**lista_palabras** es ahora una lista que contiene las palabras, entendidas como secuencias de caracteres separadas por espacios en blanco. 

In [9]:
lista_palabras

['Augusta',
 'Ada',
 'King,',
 'condesa',
 'de',
 'Lovelace,',
 'registrada',
 'al',
 'nacer',
 'como',
 'Augusta',
 'Ada',
 'Byron',
 'y',
 'conocida',
 'habitualmente',
 'como',
 'Ada',
 'Lovelace,',
 'fue',
 'una',
 'matemática',
 'y',
 'escritora',
 'británica,',
 'célebre',
 'sobre',
 'todo',
 'por',
 'su',
 'trabajo',
 'acerca',
 'de',
 'la',
 'computadora',
 'mecánica',
 'de',
 'uso',
 'general',
 'de',
 'Charles',
 'Babbage,',
 'la',
 'denominada',
 'máquina',
 'analítica.',
 'Fue',
 'la',
 'primera',
 'en',
 'reconocer',
 'que',
 'la',
 'máquina',
 'tenía',
 'aplicaciones',
 'más',
 'allá',
 'del',
 'cálculo',
 'puro',
 'y',
 'en',
 'haber',
 'publicado',
 'lo',
 'que',
 'se',
 'reconoce',
 'hoy',
 'como',
 'el',
 'primer',
 'algoritmo',
 'destinado',
 'a',
 'ser',
 'procesado',
 'por',
 'una',
 'máquina,',
 'por',
 'lo',
 'que',
 'se',
 'la',
 'considera',
 'como',
 'la',
 'primera',
 'programadora',
 'de',
 'ordenadores.']

In [10]:
## número de elementos de lista_palabras

numero_palabras = len(lista_palabras)

In [11]:
numero_palabras

93

Sin embargo, es posible que no queramos visualizar las 93 palabras almacenadas en lista_palabras, sino que las primeras 5, ¿Cómo hacemos eso?

In [12]:
muestra_palabras = lista_palabras[:5]

In [13]:
muestra_palabras

['Augusta', 'Ada', 'King,', 'condesa', 'de']

Desmenucemos 

```python
muestra_palabras = lista_palabras[:5]
```

Aparte de la asignación de variable (de derecha a izquierda), nos importan los siguientes elementos:

- Accedemos a un elemento particular de una lista usando **[...]**; y
- si queremos los elementos **hasta** una posición **n**, usamos

```python
lista[:n]
```

También es posible, que queramos visualizar los elementos desde la posición 1

In [14]:
desde_palabras = lista_palabras[1:]

In [15]:
desde_palabras

['Ada',
 'King,',
 'condesa',
 'de',
 'Lovelace,',
 'registrada',
 'al',
 'nacer',
 'como',
 'Augusta',
 'Ada',
 'Byron',
 'y',
 'conocida',
 'habitualmente',
 'como',
 'Ada',
 'Lovelace,',
 'fue',
 'una',
 'matemática',
 'y',
 'escritora',
 'británica,',
 'célebre',
 'sobre',
 'todo',
 'por',
 'su',
 'trabajo',
 'acerca',
 'de',
 'la',
 'computadora',
 'mecánica',
 'de',
 'uso',
 'general',
 'de',
 'Charles',
 'Babbage,',
 'la',
 'denominada',
 'máquina',
 'analítica.',
 'Fue',
 'la',
 'primera',
 'en',
 'reconocer',
 'que',
 'la',
 'máquina',
 'tenía',
 'aplicaciones',
 'más',
 'allá',
 'del',
 'cálculo',
 'puro',
 'y',
 'en',
 'haber',
 'publicado',
 'lo',
 'que',
 'se',
 'reconoce',
 'hoy',
 'como',
 'el',
 'primer',
 'algoritmo',
 'destinado',
 'a',
 'ser',
 'procesado',
 'por',
 'una',
 'máquina,',
 'por',
 'lo',
 'que',
 'se',
 'la',
 'considera',
 'como',
 'la',
 'primera',
 'programadora',
 'de',
 'ordenadores.']

¿Y podemos combinar todo lo anterior? **Por supuesto!**

In [16]:
muestra_palabras = lista_palabras[:5]
desde_palabras = lista_palabras[1:5]

In [17]:
muestra_palabras

['Augusta', 'Ada', 'King,', 'condesa', 'de']

In [18]:
desde_palabras

['Ada', 'King,', 'condesa', 'de']

**EJERCICIO 2:** Investigue sobre índices negativos en listas, ¿Qué indica la siguiente? 
```python
lista_palabras[-1]
```

Con todo lo anterior, pensemos en el siguiente problema. Supongamos que para cada palabra de **lista_palabras** queremos guardar la palabra que está a la derecha. Esto tiene múltiples aplicaciones, entre ellas, el estudio de contextos de aparición de palabras ¿Cómo resolvemos este problema? Este problema se podría resolver de muchas formas. Aquí buscaremos una solución simple, basada en las posibilidades que nos entregan los índices de las listas. 

Noten que los elementos sucesivos de **muestra_palabras** son exactamente lo que buscamos: el primer elemento de esta lista es el segundo elemento de **muestra_palabras**, y así sucesivamente. 

En resumen, la solución aparece al utilizar

```python
lista_palabras
```
y

```python
lista_palabras[1:]
```

In [20]:
## aquí guardamos lo que estamos buscando
lista_palabras_sucesivas = []

## recorremos las palabras de lista_palabras ¿Por qué restamos 1?
for i in range(len(lista_palabras)-1):
    ## seleccionamos una palabra
    palabra = lista_palabras[i]
    ## seleccionamos la palabra sucesiva
    palabra_sucesiva = lista_palabras[1:][i]
    ## construimos la lista_par
    lista_par = [palabra, palabra_sucesiva]
    ## guardamos el par: ¿Una lista dentro de otra lista?
    lista_palabras_sucesivas = lista_palabras_sucesivas + [lista_par]

In [21]:
lista_palabras_sucesivas[:5]

[['Augusta', 'Ada'],
 ['Ada', 'King,'],
 ['King,', 'condesa'],
 ['condesa', 'de'],
 ['de', 'Lovelace,']]

**EJERCICIO 3:** Reescriba el código anterior con una nueva versión de la línea
```python
## seleccionamos la palabra sucesiva
    palabra_sucesiva = lista_palabras[1:][i]
```

**EJERCICIO 4:** ¿Por qué?
```python
lista_palabras_sucesivas[0][0]
```
es

```python
'Augusta'
```