<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="./figures/cover-small.jpg">

*Este libro es una versión al español de [Python for Everybody](https://www.py4e.com/) escrito por el [Dr. Charles R. Severance](http://www.dr-chuck.com/); este contenido esta disponible en [GitHub](https://github.com/csev/py4e).*

Detalles de Copyright

*Copyright ~ 2009- Charles Severance.
Este trabajo está registrado bajo una Licencia Creative Commons AttributionNonCommercial-ShareAlike 3.0 [CC BY-NC-SA](https://creativecommons.org/licenses/by-nc-sa/3.0/).*

<!--NAVIGATION-->
| [Indice](indice.ipynb) | 

< [Capítulo 7 - Archivos](cap07.ipynb) | [Capítulo 9 - Diccionarios](cap09.ipynb) >

# Capítulo 8 - Listas

## Una lista es una secuencia

Como una cadena, una lista es una secuencia de valores. En una cadena, los valores son caracteres; en una lista, pueden ser de cualquier tipo. Los valores en la lista se llaman elementos o, a veces, items.

Hay varias formas de crear una nueva lista; lo más simple es incluir los elementos entre corchetes `[y]`:

In [1]:
[10, 20, 30, 40]
['crunchy frog', 'ram bladder', 'lark vomit']

['crunchy frog', 'ram bladder', 'lark vomit']

El primer ejemplo es una lista de cuatro enteros. El segundo es una lista de tres cadenas. Los elementos de una lista no tienen que ser del mismo tipo. La siguiente lista contiene una cadena, un flotante, un entero y (¡para menos!) Otra lista:

In [2]:
['spam', 2.0, 5, [10, 20]]

['spam', 2.0, 5, [10, 20]]

Si hay Una lista dentro de otra lista esto es una lista anidada.

Una lista que no contiene elementos se llama lista vacía; puede crear uno con corchetes vacíos, `[]`.

Como era de esperar, puede asignar valores de lista a las variables:

In [3]:
queso = ['Cheddar', 'Edam', 'Gouda']
numeros = [17, 123]
vacio = []
print(queso, numeros, vacio)

['Cheddar', 'Edam', 'Gouda'] [17, 123] []


## Las listas son mutables

La sintaxis para acceder a los elementos de una lista es la misma que para acceder a los caracteres de una cadena: el operador de corchetes. La expresión entre corchetes especifica el índice. Recuerde que los índices comienzan en 0:

In [4]:
print(queso[0])

Cheddar


A diferencia de las cadenas, las listas son mutables porque puede cambiar el orden de los elementos en una lista o reasignar un elemento en una lista. Cuando el operador de corchetes aparece en el lado izquierdo de una tarea, identifica el elemento de la lista que se asignará.

In [5]:
numeros = [17, 123]
numeros[1] = 5
print(numeros)

[17, 5]


El segundo elemento de `numeros`, que solía ser `123`, ahora es `5`.

Puede pensar en una lista como una relación entre índices y elementos. Esta relación se llama mapeo; cada índice "se asigna a" uno de los elementos.

Los índices de lista funcionan del mismo modo que los índices de cadena:
* Cualquier expresión entera se puede usar como un índice.
* Si intenta leer o escribir un elemento que no existe, obtiene un IndexError.
* Si un índice tiene un valor negativo, cuenta hacia atrás desde el final de la lista.

El operador in también trabaja en listas.

In [6]:
quesos = ['Cheddar', 'Edam', 'Gouda']
'Edam' in quesos

True

In [7]:
'Brie' in quesos

False

## Recorriendo una lista

La forma más común de recorrer los elementos de una lista es con un bucle `for`. La sintaxis es la misma que para las cadenas:

In [8]:
for queso in quesos:
    print(queso)

Cheddar
Edam
Gouda


Esto funciona bien si solo necesita leer los elementos de la lista. Pero si desea escribir o actualizar los elementos, necesita los índices. Una forma común de hacerlo es combinar las funciones `range` y `len`:

In [9]:
for i in range(len(numeros)):
    numeros[i] = numeros[i] * 2

Este bucle atraviesa la lista y actualiza cada elemento. `len` devuelve la cantidad de elementos en la lista. `range` devuelve una lista de índices de `0` a `n - 1` , donde `n` es la longitud de la lista. Cada vez que `i` pasa el ciclo, obtiene el índice del siguiente elemento. La declaración de asignación en el cuerpo utiliza `i` para leer el valor anterior del elemento y para asignar el nuevo valor.

Un bucle `for` sobre una lista vacía nunca ejecuta el cuerpo:

In [10]:
for x in vacio:
    print('Esto nunca pasa.')

Aunque una lista puede contener otra lista, la lista anidada todavía cuenta como un elemento único. La longitud de esta lista es cuatro:

In [11]:
['spam', 1, ['Brie', 'Roquefort', 'Pol le Veq'], [1, 2, 3]]

['spam', 1, ['Brie', 'Roquefort', 'Pol le Veq'], [1, 2, 3]]

## Operaciones de listas

El operador `+` concatena listas:

In [12]:
a = [1, 2, 3]
b = [4, 5, 6]
c = a + b
print(c)

[1, 2, 3, 4, 5, 6]


Del mismo modo, el operador `*` repite una lista un número determinado de veces:

In [13]:
a * 4

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

## Listar Slides

El operador de slide también trabaja en listas:

In [14]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
print(t[1:3])
print(t[:4])
print(t[3:])

['b', 'c']
['a', 'b', 'c', 'd']
['d', 'e', 'f']


Si omite el primer índice, el corte comienza al principio. Si omite el segundo, la porción llega al final. Entonces, si omites ambos, la porción es una copia de toda la lista.

In [15]:
t[:]

['a', 'b', 'c', 'd', 'e', 'f']

Como las listas son mutables, a menudo es útil hacer una copia antes de realizar operaciones que pliegue, hile o mutile listas.

Un operador de slide o sector en el lado izquierdo de una tarea puede actualizar varios elementos:

In [16]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
t[1:3] = ['x', 'y']
print(t)

['a', 'x', 'y', 'd', 'e', 'f']


## Métodos de lista

Python proporciona métodos que operan en listas. Por ejemplo, `append` agrega un nuevo elemento al final de una lista:

In [17]:
t = ['a', 'b', 'c']
t.append('d')
print(t)

['a', 'b', 'c', 'd']


`extend` toma una lista como argumento y agrega todos los elementos:

In [18]:
t1 = ['a', 'b', 'c']
t2 = ['d', 'e']
t1.extend(t2)
print(t1)

['a', 'b', 'c', 'd', 'e']


Este ejemplo `t2` no se modifica.

`sort` organiza los elementos de la lista de menor a mayor:

In [19]:
t = ['d', 'c', 'e', 'b', 'a']

La mayoría de los métodos de lista son nulos; ellos modifican la lista y regresan `None`. Si escribe accidentalmente `t = t.sort()`, se sentirá decepcionado con el resultado.

## Eliminando elementos

Hay varias formas de eliminar elementos de una lista. Si conoce el índice del elemento que desea, puede usar pop:

In [20]:
t = ['a', 'b', 'c']

`pop` modifica la lista y devuelve el elemento que se eliminó. Si no proporciona un índice, elimina y devuelve el último elemento.

Si no necesita el valor eliminado, puede usar el operador `del`:

In [21]:
t = ['a', 'b', 'c']
del t[1]
print(t)

['a', 'c']


Si conoce el elemento que desea eliminar (pero no el índice), puede usar `remove`:

In [22]:
t = ['a', 'b', 'c']
t.remove('b')
print(t)

['a', 'c']


El valor de retorno de `remove` es `None`.

Para eliminar más de un elemento, puede usar del con un índice de sector:

In [23]:
t = ['a', 'b', 'c', 'd', 'e', 'f']
del t[1:5]
print(t)

['a', 'f']


Como de costumbre, el corte selecciona todos los elementos hasta, pero sin incluir, el segundo índice.

## Listas y funciones

Hay una serie de funciones integradas que se pueden usar en listas que le permiten mirar rápidamente una lista sin escribir sus propios bucles:

In [24]:
nums =  [3, 41, 12, 9, 74, 15]
print(len(nums))
print(max(nums))
print(min(nums))
print(sum(nums))
print(sum(nums)/len(nums))

6
74
3
154
25.666666666666668


La función `sum()` solo funciona cuando los elementos de la lista son números. Las otras funciones ( `max()`, `len()`, etc.) trabajan con listas de cadenas y otros tipos que pueden ser comparable.

Podríamos reescribir un programa anterior que calculó el promedio de una lista de números ingresados por el usuario usando una lista.

Primero, el programa para calcular un promedio sin una lista:

In [25]:
total = 0
count = 0
while (True):
    inp = input('Ingresa un numero: ')
    if inp == 'hecho': break
    value = float(inp)
    total = total + value
    count = count + 1

promedio = total / count
print('promedio:', promedio)

Ingresa un numero: 200
Ingresa un numero: 45
Ingresa un numero: 50
Ingresa un numero: hecho
promedio: 98.33333333333333


En este programa, tenemos las variables `count` y `total` para mantener el número y el total acumulado de los números del usuario, ya que repetidamente solicitamos un número al usuario. Simplemente podríamos recordar cada número cuando el usuario lo ingresó y usar funciones integradas para calcular la suma y el recuento al final.

In [26]:
numlist = list()
while (True):
    inp = input('Ingresa un numero: ')
    if inp == 'hecho': break
    valor = float(inp)
    numlist.append(valor)

promedio = sum(numlist) / len(numlist)
print('Promedio:', promedio)

Ingresa un numero: 200
Ingresa un numero: 45
Ingresa un numero: 50
Ingresa un numero: hecho
Promedio: 98.33333333333333


Hacemos una lista vacía antes de que comience el ciclo, y luego cada vez que tenemos un número, lo agregamos a la lista. Al final del programa, simplemente calculamos la suma de los números en la lista y lo dividimos por el recuento de los números en la lista para llegar al promedio.

## Listas y cadenas

Una cadena es una secuencia de caracteres y una lista es una secuencia de valores, pero una lista de caracteres no es lo mismo que una cadena. Para convertir de una cadena a una lista de caracteres, puede usar `list`:

In [27]:
s = 'spam'
t = list(s)
print(t)

['s', 'p', 'a', 'm']


Debido a que `list` es el nombre de una función incorporada, debe evitar usarlo como un nombre de variable. También evita la letra `l` porque se parece demasiado al número 1. Entonces es por eso que uso `t`.

La función `list` divide una cadena en letras individuales. Si quiere dividir una cadena en palabras, puede usar el método `split`:

In [28]:
s = 'pining for the fjords'
t = s.split()
print(t)
print(t[2])

['pining', 'for', 'the', 'fjords']
the


Una vez que ha utilizado `split` para dividir la cadena en una lista de palabras, puede usar el operador de índice `[]` (corchete) para ver una palabra determinada en la lista.

Puede llamar `split` con un argumento opcional llamado delimitador que especifica qué caracteres usar como límites de palabras. El siguiente ejemplo usa un guión como delimitador:

In [29]:
s = 'spam-spam-spam'
delimitador = '-'
s.split(delimitador)

['spam', 'spam', 'spam']

`join` es el inverso de `split`. Toma una lista de cadenas y concatena los elementos. `join` es un método de cadena, por lo que debe invocarlo en el delimitador y pasar la lista como parámetro:

In [30]:
t = ['pining', 'for', 'the', 'fjords']
delimitador = ' '
delimitador.join(t)

'pining for the fjords'

En este caso, el delimitador es un carácter de espacio, por lo que `join` pone un espacio entre las palabras. Para concatenar cadenas sin espacios, puede usar la cadena vacía, "", como delimitador.

## Análisis de cadenas

Por lo general, cuando estamos leyendo un archivo, queremos hacer algo en las líneas que no sea simplemente imprimir toda la línea. A menudo queremos encontrar las "líneas interesantes" y luego analizar la línea para encontrar alguna parte interesante de la línea. ¿Qué pasaría si quisiéramos imprimir el día de la semana desde esas líneas que comienzan con "From"?

    From stephen.marquard@uct.ac.zaSatJan 5 09:14:16 2008
    
El método `split` es muy efectivo cuando se enfrenta con este tipo de problema. Podemos escribir un pequeño programa que busque líneas donde la línea comienza con "From", `split` esas líneas, y luego imprimir la tercera palabra en la línea:

In [31]:
fhand = open('./codes/mbox-short.txt')
for linea in fhand:
    linea = linea.rstrip()
    if not linea.startswith('From '): continue
    palabras = linea.split()
    print(palabras[2])

Sat
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Thu
Thu
Thu
Thu
Thu
Thu


In [32]:
fhand = open('./codes/mbox-short.txt')
for linea in fhand:
    linea = linea.rstrip()
    if not linea.startswith('From '): continue
    palabras = linea.split()
    print(palabras[2])

Sat
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Thu
Thu
Thu
Thu
Thu
Thu


Aquí también usamos la forma contraída de la declaración `if` donde ponemos `continue` en la misma línea que el `if`. Esta forma contraída de las funciones `if` es la misma que si `continue` estuvieran en la línea siguiente y sangradas.

Más tarde, aprenderemos técnicas cada vez más sofisticadas para elegir las líneas y cómo separamos esas líneas para encontrar la cantidad exacta de información que estamos buscando.

## Objetos y valores

Si ejecutamos estas declaraciones de asignación:

In [33]:
a = 'banana'
b = 'banana'

Sabemos que `a` y `b` ambos se refieren a una cadena, pero no sabemos si se refieren a la misma cadena. Hay dos estados posibles:

![Figura 8.1](./figures/8.1.svg)
<center><i>Figura 8.1: Variables y objetos</i><center>
    
En un caso, `a` y se `b` refieren a dos objetos diferentes que tienen el mismo valor. En el segundo caso, se refieren al mismo objeto.

Para verificar si dos variables se refieren al mismo objeto, puede usar el operador `is`.

In [34]:
a = 'banana'
b = 'banana'
a is b

True

En este ejemplo, Python sólo creó un objeto de cadena, y ambos `a` y `b` se refieren a ella.

Pero cuando creas dos listas, obtienes dos objetos:

In [35]:
a = [1, 2, 3]
b = [1, 2, 3]
a is b

False

En este caso, diríamos que las dos listas son equivalentes, porque tienen los mismos elementos, pero no son idénticos, porque no son el mismo objeto. Si dos objetos son idénticos, también son equivalentes, pero si son equivalentes, no son necesariamente idénticos.

Hasta ahora, hemos usado "objeto" y "valor" de forma intercambiable, pero es más preciso decir que un objeto tiene un valor. Si ejecuta `a = [1,2,3]`, `a` se refiere a un objeto de lista cuyo valor es una secuencia particular de elementos. Si otra lista tiene los mismos elementos, diríamos que tiene el mismo valor.

## Aliasing

Si `a` se refiere a un objeto y lo asigna `b = a`, entonces ambas variables se refieren al mismo objeto:

In [36]:
a = [1, 2, 3]
b = a
b is a

True

La asociación de una variable con un objeto se llama referencia . En este ejemplo, hay dos referencias al mismo objeto.

Un objeto con más de una referencia tiene más de un nombre, por lo que decimos que el objeto tiene un alias.

Si el objeto con alias es mutable, los cambios realizados con un alias afectan al otro:

In [37]:
b[0] = 17
print(a)

[17, 2, 3]


Aunque este comportamiento puede ser útil, es propenso a errores. En general, es más seguro evitar el *aliasing* cuando se trabaja con objetos mutables.

Para objetos inmutables como cadenas, el aliasing no es un gran problema. En este ejemplo:

In [38]:
a = 'banana'
b = 'banana'

casi nunca hace una diferencia si `a` y `b` se refieren a la misma cadena o no.

##  Listas como argumentos

Cuando pasa una lista a una función, la función obtiene una referencia a la lista. Si la función modifica un parámetro de lista, la persona que llama ve el cambio. Por ejemplo, `eliminar_primero` elimina el primer elemento de una lista:

In [39]:
def eliminar_primero(t):
    del t[0]

Así es como se usa:

In [40]:
letras = ['a', 'b', 'c']
eliminar_primero(letras)
print(letras)

['b', 'c']


El parámetro `t` y la variable letras son alias para el mismo objeto.

Es importante distinguir entre las operaciones que modifican las listas y las operaciones que crean nuevas listas. Por ejemplo, el método `append` modifica una lista, pero el operador `+` crea una nueva lista:

In [41]:
t1 = [1, 2]
t2 = t1.append(3)
print(t1)
print(t2)
t3 = t1 + [3]
print(t3)
t2 is t3

[1, 2, 3]
None
[1, 2, 3, 3]


False

Esta diferencia es importante cuando escribe funciones que se supone que modifican listas. Por ejemplo, esta función no elimina el encabezado de una lista:

In [42]:
def incorrecto_eliminar_primero(t):
    t = t[1:] # INCORRECTO!

El operador de división crea una lista nueva y la asignación hace que se `t` refiera a ella, pero nada de eso tiene ningún efecto en la lista que se pasó como argumento.

Una alternativa es escribir una función que crea y devuelve una nueva lista. Por ejemplo, `tail` devuelve todo menos el primer elemento de una lista:

In [43]:
def tail(t):
    return t[1:]

Esta función deja la lista original sin modificaciones. Así es como se usa:

In [44]:
letras = ['a', 'b', 'c']
resto = tail(letras)
print(resto)

['b', 'c']


**Ejercicio 1:** Escribe una función llamada `chop` que toma una lista y la modifica, eliminando el primer y último elemento, y regresa `None`. Luego escriba una función llamada `middle` que toma una lista y devuelve una nueva lista que contiene todos menos el primer y último elemento.

## Depuración

El uso descuidado de listas (y otros objetos mutables) puede llevar a largas horas de depuración. Aquí hay algunos errores comunes y formas de evitarlos:

1. No olvide que la mayoría de los métodos de lista modifican el argumento y lo devuelven None. Esto es lo contrario de los métodos de cadena, que devuelven una nueva cadena y dejan el original solo.

Si está acostumbrado a escribir código de cadena como este:

    word = word.strip()

Es tentador escribir un código de lista como este: 
    
    t = t.sort () # ¡INCORRECTO!

Debido a que las `sort` devoluelve `None`, es probable que la siguiente operación con la que realice falle.

Antes de utilizar los métodos y operadores de lista, debe leer la documentación cuidadosamente y luego probarla en modo interactivo. Los métodos y operadores que las listas comparten con otras secuencias (como cadenas) están documentados en https://docs.python.org/2/library/stdtypes.html#string-methods. Los métodos y operadores que solo se aplican a secuencias mutables están documentados en
https://docs.python.org/2/library/stdtypes.html#mutable-sequence-types.

2. Elija una forma y quédese con esa.

Parte del problema con las listas es que hay demasiadas formas de hacer las cosas. Por ejemplo, para eliminar un elemento de una lista, puede utilizar `pop`, `remove`, `del`, o incluso una rebanada de asignación.

Para agregar un elemento, puede usar el método `append` o el operador `+`. Pero no olvides que estos son correctos:

    t.append(x)
    t = t + [x]

Y estos son incorrectos:

    t.append([x]) # INCORRECCTO!
    t = t.append(x) # INCORRECCTO!
    t + [x] # INCORRECCTO!
    t = t + x # INCORRECCTO!

Pruebe cada uno de estos ejemplos en modo interactivo para asegurarse de que entiende lo que hacen. Tenga en cuenta que solo el último causa un error de tiempo de ejecución; los otros tres son legales, pero hacen lo incorrecto.

3. Haga copias para evitar el aliasing.

Si desea utilizar un método como el `sort` que modifica el argumento, pero también necesita conservar la lista original, puede hacer una copia.

    orig = t[:]
    t.sort()
    
En este ejemplo, también podría usar la función incorporada `sorted`, que devuelve una nueva lista ordenada y deja solo el original. ¡Pero en ese caso debes evitar usar `sorted` como nombre de variable!

4. Listas split, y archivos

Cuando leemos y analizamos archivos, hay muchas oportunidades para encontrar información que puede bloquear nuestro programa, por lo que es una buena idea volver a visitar el patrón guardián cuando se trata de escribir programas que leen un archivo y buscan una "aguja en el pajar".

Revisemos nuestro programa que está buscando el día de la semana en las líneas de nuestro archivo:

    From stephen.marquard@uct.ac.zaSatJan 5 09:14:16 2008

Ya que estamos dividiendo esta línea en palabras, podemos prescindir del uso de `startswithy` simplemente mirar la primera palabra de la línea para determinar si estamos interesados en la línea en absoluto. Podemos usar `continue` para omitir las líneas que no tienen "From" como la primera palabra de la siguiente manera:

In [45]:
fhand = open('./codes/mbox-short.txt')
for linea in fhand:
    palabras = linea.split()
    if palabras[0] != 'From' : continue
    print(palabras[2])

Sat


IndexError: list index out of range

Esto parece mucho más simple y ni siquiera tenemos que hacer `rstrip` para eliminar la nueva línea al final del archivo. Pero es mejor?

Funciona y vemos el día desde la primera línea `Sat`, pero luego el programa falla con un IndexError. ¿Qué salió mal? ¿Qué datos desordenados causaron que fallara nuestro programa elegante, inteligente y muy Pythonic?

Puede mirarlo por un largo tiempo y resolverlo o pedir ayuda a alguien, pero el enfoque más rápido e inteligente es agregar una declaración `print`. El mejor lugar para agregar la declaración de impresión es justo antes de la línea donde falló el programa e imprimir los datos que parecen estar causando la falla.

Ahora bien, este enfoque puede generar muchas líneas de salida, pero al menos tendrá alguna pista sobre el problema en cuestión. Así que agregamos una impresión de la variable `palabas` justo antes de la línea cinco. Incluso agregamos un prefijo *"Debug:"* a la línea para que podamos mantener nuestra salida regular separada de nuestra salida de depuración.

In [46]:
fhand = open('./codes/mbox-short.txt')
for linea in fhand:
    palabras = linea.split()
    print('Debug:', palabras)
    if palabras[0] != 'From' : continue
    print(palabras[2])

Debug: ['From', 'stephen.marquard@uct.ac.za', 'Sat', 'Jan', '5', '09:14:16', '2008']
Sat
Debug: ['Return-Path:', '<postmaster@collab.sakaiproject.org>']
Debug: ['Received:', 'from', 'murder', '(mail.umich.edu', '[141.211.14.90])']
Debug: ['by', 'frankenstein.mail.umich.edu', '(Cyrus', 'v2.3.8)', 'with', 'LMTPA;']
Debug: ['Sat,', '05', 'Jan', '2008', '09:14:16', '-0500']
Debug: ['X-Sieve:', 'CMU', 'Sieve', '2.3']
Debug: ['Received:', 'from', 'murder', '([unix', 'socket])']
Debug: ['by', 'mail.umich.edu', '(Cyrus', 'v2.2.12)', 'with', 'LMTPA;']
Debug: ['Sat,', '05', 'Jan', '2008', '09:14:16', '-0500']
Debug: ['Received:', 'from', 'holes.mr.itd.umich.edu', '(holes.mr.itd.umich.edu', '[141.211.14.79])']
Debug: ['by', 'flawless.mail.umich.edu', '()', 'with', 'ESMTP', 'id', 'm05EEFR1013674;']
Debug: ['Sat,', '5', 'Jan', '2008', '09:14:15', '-0500']
Debug: ['Received:', 'FROM', 'paploo.uhi.ac.uk', '(app1.prod.collab.uhi.ac.uk', '[194.35.219.184])']
Debug: ['BY', 'holes.mr.itd.umich.edu', 'ID'

IndexError: list index out of range

Cuando ejecutamos el programa, una gran cantidad de resultados se desplaza fuera de la pantalla, pero al final, vemos nuestro resultado de depuración y el rastreo para que sepamos lo que sucedió justo antes del rastreo.

Cada línea de depuración imprime la lista de palabras que obtenemos cuando `split` convierte la línea en palabras. Cuando el programa falla, la lista de palabras está vacía []. Si abrimos el archivo en un editor de texto y miramos el archivo, en ese punto se ve así:

    X-DSPAM-Result: Innocent
    X-DSPAM-Processed: Sat Jan 5 09:14:16 2008
    X-DSPAM-Confidence: 0.8475
    X-DSPAM-Probability: 0.0000

    Details: http://source.sakaiproject.org/viewsvn/?view=rev&rev=39772

¡El error ocurre cuando nuestro programa encuentra una línea en blanco! Por supuesto, hay "cero palabras" en una línea en blanco. ¿Por qué no pensamos en eso cuando escribimos el código? Cuando el código busca la primera palabra `palabras[0]` para verificar si coincide con "From", obtenemos un error de "índice fuera de rango".

Por supuesto, este es el lugar perfecto para agregar un código de guardián para evitar verificar la primera palabra si la primera palabra no está allí. Hay muchas formas de proteger este código; elegiremos verificar el número de palabras que tenemos antes de mirar la primera palabra:

In [47]:
fhand = open('./codes/mbox-short.txt')
count = 0
for linea in fhand:
    palabras = linea.split()
    # print('Debug:', palabras)
    if len(palabras) == 0 : continue
    if palabras[0] != 'From' : continue
    print(palabras[2])

Sat
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Fri
Thu
Thu
Thu
Thu
Thu
Thu


Primero comentamos la declaración de impresión de depuración en lugar de eliminarla, en caso de que nuestra modificación falle y tengamos que volver a depurarla. Luego agregamos una declaración de guardián que verifica si tenemos cero palabras, y si es así, usamos `continue` para pasar a la siguiente línea del archivo.

Podemos pensar que las dos declaraciones `continue` nos ayudan a refinar el conjunto de líneas que son "interesantes" para nosotros y que queremos procesar un poco más. Una línea que no tiene palabras no es "interesante" para nosotros, así que saltamos a la siguiente línea. Una línea que no tiene "From" como su primera palabra no nos interesa, así que la omitimos.

El programa modificado se ejecuta correctamente, por lo que tal vez sea correcto. Nuestra declaración de guardián se asegura de que `palabras[0]` nunca fallará, pero tal vez no sea suficiente. Cuando estamos programando, siempre debemos pensar: "¿Qué podría salir mal?"

**Ejercicio 2:** averigüe qué línea del programa anterior aún no está protegida adecuadamente. Vea si puede construir un archivo de texto que haga que el programa falle y luego modifique el programa para que la línea esté debidamente protegida y pruébelo para asegurarse de que maneja su nuevo archivo de texto.

**Ejercicio 3:** Reescribe el código del guardián en el ejemplo anterior sin dos declaraciones if. En su lugar, use una expresión lógica compuesta utilizando el operador lógico `and` con una sola instrucción `if`.

## Glosario

* **aliasing:** Una circunstancia donde dos o más variables se refieren al mismo objeto.
* **delimitador:** Un caracter o cadena utilizada para indicar dónde se debe dividir una cadena.
* **elemento:** Uno de los valores en una lista (u otra secuencia); también llamados ítems.
* **equivalente:** Tienen el mismo valor
* **índice:** Un valor entero que indica un elemento en una lista.
* **idéntico:** Siendo el mismo objeto (lo que implica equivalencia).
* **lista:** Una secuencia de valores.
* **lista transversal:** El acceso secuencial de cada elemento en una lista.
* **lista anidada:** Una lista que es un elemento de otra lista.
* **objeto:** Algo a lo que una variable puede referirse. Un objeto tiene un tipo y un valor.
* **referencia:** La asociación entre una variable y su valor.

## Ejercicios

**Ejercicio 4:** descargue una copia del archivo de www.py4e.com/code3/romeo.txt. Escriba un programa para abrir el archivo `romeo.txt` y léalo línea por línea. Para cada línea, divide la línea en una lista de palabras usando la función `split`. Para cada palabra, verifique si la palabra ya está en una lista. Si la palabra no está en la lista, agréguela a la lista. Cuando el programa finalice, ordene e imprima las palabras resultantes en orden alfabético.

    Ingresa el nomre del archivo: romeo.txt
    ['Arise', 'But', 'It', 'Juliet', 'Who', 'already',
    'and', 'breaks', 'east', 'envious', 'fair', 'grief',
    'is', 'kill', 'light', 'moon', 'pale', 'sick', 'soft',
    'sun', 'the', 'through', 'what', 'window',
    'with', 'yonder']

**Ejercicio 5:** Escriba un programa para leer los datos del buzón y cuando encuentre una línea que comience con "From", dividirá la línea en palabras usando la función `split`. Estamos interesados en quién envió el mensaje, que es la segunda palabra en la línea From.

    From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008

Analizará la línea `From` e imprimirá la segunda palabra para cada línea `From`, luego también contará el número de líneas `From` (no de `From:`) e imprimirá un conteo al final.

Este es un buen resultado de muestra con algunas líneas eliminadas:

    python fromcount.py
    Enter a file name: mbox-short.txt
    stephen.marquard@uct.ac.za
    louis@media.berkeley.edu
    zqian@umich.edu
    
    [...some output removed...]
    
    ray@media.berkeley.edu
    cwen@iupui.edu
    cwen@iupui.edu
    cwen@iupui.edu
    There were 27 lines in the file with From as the first word

**Ejercicio 6:** vuelva a escribir el programa que solicita al usuario una lista de números e imprime el máximo y mínimo de los números al final cuando el usuario ingresa "hecho". Escriba el programa para almacenar los números que ingresa el usuario en una lista y use las funciones `max()` y `min()` para calcular los números máximos y mínimos una vez que se complete el ciclo.

    Ingrese un numero: 6
    Ingrese un numero: 2
    Ingrese un numero: 9
    Ingrese un numero: 3
    Ingrese un numero: 5
    Ingrese un numero: hecho
    Maximo: 9.0
    Minimo: 2.0

<!--NAVIGATION-->
| [Indice](indice.ipynb) | 

< [Capítulo 7 - Archivos](cap07.ipynb) | [Capítulo 9 - Diccionarios](cap09.ipynb) >