<h1 align="center">Programación &#8212; PRE2013A45</h1>
<h3 align="center">Docente: Andrés Quintero Zea, PhD.</h3>
<h3 align="center">e-mail: andres.quintero27@eia.edu.co</h3>
<h3 align="center">Semana 06: Listas y Tuplas</h3>

# Secuencias
Una secuencia es un objeto que contiene varios elementos de datos. Los elementos que están en una secuencia se almacenan uno tras otro. `Python` proporciona varias formas de realizar operaciones en los elementos que se almacenan en una secuencia.
Hay varios tipos diferentes de objetos de secuencia en `Python`. Esta semana veremos dos de los tipos de secuencias fundamentales: listas y tuplas. Tanto las listas como las tuplas son secuencias que pueden contener varios tipos de datos. La diferencia entre listas y tuplas es simple: una lista es mutable, lo que significa que un programa puede cambiar su contenido, pero una tupla es inmutable, lo que significa que una vez creada, su contenido no se puede cambiar. Exploraremos algunas de las operaciones que puede realizar en estas secuencias, incluidas las formas de acceder y manipular sus contenidos.

# 1. Listas
Una lista es un objeto que contiene varios elementos de datos. Las listas son estructuras de datos dinámicas, lo que significa que se les pueden agregar o quitar elementos. Puede usar la indexación, el corte y varios métodos para trabajar con listas en un programa.

Las listas se relacionan a arreglos (arrays) en lenguajes como `C`, `C++` o `Java`, pero en `Python` las listas son más fexibles y poderosas que los clásicos arreglos. Por ejemplo, los ítems en una lista no necesitan ser todos del mismo tipo, más aún, pueden crecer en la ejecución del programa, mientras que en `C` el tamaño de un arreglo es fijo.

Las principales propiedades de una lista son:

* Están ordenados
* Contienen una colección arbitraria de objetos (números, cadenas, booleanos, otras listas)
* Los elementos de una lista pueden ser accedidos por un índice
* Variable en tamaño
* Son mutables, es decir, los elementos en una lista pueden cambiar

Para definir una lista basta ubicar los diferentes elementos que la compondrán, separados por coma y entre corchetes

In [None]:
mi_lista = ['dato', 15, 2.8, "otro dato", True, "98456226", 27]
print(type(mi_lista))
print(mi_lista)

La numeración de los índices siempre empieza en cero (0) si se acceden desde el primer elemento a la izquierda y se recorren hacia la derecha. O desde -1, si se acceden desde el último elemento a la derecha y se recorre hacia la izquierda.

In [None]:
n = len(mi_lista)
print(mi_lista[0])
print(mi_lista[-n])

## 1.1 Operador de repetición
Vimos previamente que el símbolo `*` multiplica dos números. Sin embargo, cuando el operando del lado izquierdo del símbolo `*` es una secuencia (como una lista) y el operando del lado derecho es un número entero, se convierte en el **operador de repetición**. El operador de repetición hace múltiples copias de una lista y las une todas.

In [None]:
lista1 = [1, 2, 3]
lista2 = lista1 * 5
print(lista2)

## 1.2 Indexación
Una de las formas más sencillas de acceder a los elementos individuales de una lista es utilizar el bucle `for`. Este es el formato general:
```Python
for variable in lista:
    código
    código
    etc.
```

In [None]:
numbers = [1, 2, 3, 4]
for num in numbers:
    print(num)

Otra forma de acceder a los elementos individuales de una lista es con un índice. Cada elemento de una lista tiene un índice que especifica su posición en la lista. La indexación comienza en 0, por lo que el índice del primer elemento es 0, el índice del segundo elemento es 1 y así sucesivamente. El índice del último elemento de una lista es 1 menos que el número de elementos de la lista.

In [None]:
my_list = [10, 20, 30, 40]
index = 0
while index < 4:
    print(my_list[index])
    index += 1

También se pueden usar índices negativos con listas para identificar las posiciones de los elementos en relación con el final de la lista. El intérprete de `Python` agrega índices negativos a la longitud de la lista para determinar la posición del elemento. El índice -1 identifica el último elemento de una lista, -2 identifica el penúltimo elemento y así sucesivamente. El siguiente código muestra un ejemplo:

In [None]:
my_list = [10, 20, 30, 40]
print(my_list[-1], my_list[-2], my_list[-3], my_list[-4])

## 1.3 La función `len`
Python tiene una función integrada llamada `len` que devuelve la longitud de una secuencia, como una lista.

In [None]:
my_list = [10, 20, 30, 40]
print(len(my_list))

Puede usar la función len junto con la función range para obtener los índices de una lista. Por ejemplo, supongamos que tenemos la siguiente lista de cadenas:
```
names = ['Jenny', 'Kelly', 'Chloe', 'Aubrey']
```
La expresión `range(len(names))` nos dará los valores 0, 1, 2 y 3. Debido a que estos valores son los índices válidos para la lista, podemos usar la expresión en un bucle `for`, como se muestra en el siguiente código :

In [None]:
names = ['Jenny', 'Kelly', 'Chloe', 'Aubrey']
for index in range(len(names)):
    print(names[index])

## 1.4 Sobreescitura de valores de las listas
Como ya dijimos, las listas en `Python` son mutables, lo que significa que sus elementos se pueden cambiar. En consecuencia, una expresión en la forma `lista[índice]` puede aparecer en el lado izquierdo de un operador de asignación. Cuando se usa una expresión de indexación para asignar un valor a un elemento de lista, se debe usar un índice válido para un elemento existente. Si desea utilizar expresiones de indexación para llenar una lista con valores, primero debe crear la lista

In [None]:
def main():
    sales = [0] * NUM_DAYS

    index = 0

    print('Ingrese el total de ventas de cada día.')
    
    while index < NUM_DAYS:
        print('Día #', index + 1, ': ', sep='', end='')
        sales[index] = float(input())
        index += 1

    print('Los valores que ingresó fueron:')
    for value in sales:
        print(value)


NUM_DAYS = 5
main()

## 1.5 Concatenación de listas
Concatenar significa unir dos cosas. Se usa el operador `+` o `+=` para concatenar dos listas. 

In [None]:
list1 = [1, 2, 3, 4]
list2 = [5, 6, 7, 8]
list3 = list1 + list2
list1 += list2
print(list1)
print(list2)
print(list3)

## 1.5 Segmentación de listas
Hemos visto cómo la indexación permite seleccionar un elemento específico en una secuencia. A veces se desea seleccionar más de un elemento de una secuencia. En `Python` se pueden escribir expresiones que seleccionen subsecciones de una secuencia, conocidas como segmentos.
Un segmento es un intervalo de elementos que se toman de una secuencia. Cuando toma un segmento de una lista, obtiene una serie de elementos dentro de la lista. Para obtener una porción de una lista, escriba una expresión en el siguiente formato general:
```
list_name[start : end]
list_name[start : end : step]
```

In [None]:
days = ['Sunday', 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday']
mid_days = days[2:5]
print(mid_days)

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(numbers[1:3])
print(numbers[1:8:3])

## 1.6 Búsqueda de elementos en listas con el operador `in`

En `Python`, puede usar el operador `in` para determinar si un elemento está contenido en una lista. El formato general de una expresión escrita con el operador `in` para buscar un elemento en una lista es:
```python
item in list
```
En el formato general, `item` es el elemento que se está buscando y `list` es una lista. La expresión devuelve verdadero si el elemento se encuentra en la lista o falso en caso contrario.

In [None]:
ID_nums = ['526312','44546','55522','455555']

search = input('Ingrese el código de producto: ')

if search in ID_nums:
    print(search, 'está en la lista.')
else:
    print(search, 'no está en la lista.')

## 1.7 Métodos para listas
Las listas tienen numerosos métodos que permiten trabajar con los elementos que contienen. `Python` también proporciona algunas funciones integradas que son útiles para trabajar con listas.

|Método   |Descripción|
|:--------|:----------|
|append() |Añade un elemento al final de la lista.
|clear()  |Elimina todos los elementos de la lista.
|copy()   |Devuelve una copia de la lista.
|count()  |Devuelve el número de elementos con el valor especificado
|extend() |Agregue los elementos de una lista (o cualquier iterable), al final de la lista actual
|index()  |Devuelve el índice del primer elemento con el valor especificado
|insert() |Agrega un elemento en la posición especificada
|pop()    |Elimina el elemento en la posición especificada
|remove() |Elimina el primer elemento con el valor especificado
|reverse()|Invierte el orden de la lista
|sort()   |Ordena la lista

In [None]:
lista = [1,2,3,4,5,7]
lista.append(8)
print(lista)
lista2 = lista.copy()
print(lista2)
print(lista.count(6))
lista.extend(range(9,15))
print(lista)
print(lista.index(4))
lista.insert(5,6)
print(lista)
lista.pop()
print(lista)

# 2. Tuplas
Una tupla es una secuencia, muy parecida a una lista. La principal diferencia entre tuplas y listas es que las tuplas son inmutables. Eso significa que una vez que se crea una tupla, no se puede cambiar. Las tuplas se crean encerrando sus elementos entre paréntesis.

In [None]:
mi_tupla = ('Andrés','Camila','Simón')

for idx in mi_tupla:
    print(idx)

print('\n')

for idx in range(len(mi_tupla)):
    print(mi_tupla[idx])

De hecho, las tuplas admiten todas las mismas operaciones que las listas, excepto aquellas que cambian el contenido de la lista. Las tuplas admiten lo siguiente:

* Indexación de subíndices (solo para recuperar valores de elementos)
* Métodos como `index`
* Funciones integradas como `len`, `min` y `max`
* Segmentación
* El operador `in`
* Los operadores `+` y `*`

Las tuplas no admiten métodos como `append`, `remove`, `insert`, `reverse` y `sort`.

Si la única diferencia entre las listas y las tuplas es la inmutabilidad, quizás se pregunte por qué existen las tuplas. Una razón por la que existen las tuplas es el rendimiento. Procesar una tupla es más rápido que procesar una lista, por lo que las tuplas son buenas opciones cuando procesa muchos datos y esos datos no se modificarán. Otra razón es que las tuplas son seguras. Debido a que no se puede cambiar el contenido de una tupla, se pueden almacenar datos en una y estar seguro de que no será modificado (accidentalmente o de otra manera) por ningún código en su programa.
Además, hay ciertas operaciones en `Python` que requieren el uso de una tupla. A medida que aprenda más sobre `Python` encontrará tuplas con más frecuencia.

## 2.1 Conversión entre listas y tuplas
Se puede usar las funciones *built-in* `list()` para convertir una tupla en una lista y `tuple()` integrada para convertir una lista en una tupla.

In [None]:
number_tuple = (1, 2, 3) 
number_list = list(number_tuple) 
print(number_list) 
str_list = ['one', 'two', 'three'] 
str_tuple = tuple(str_list) 
print(str_tuple) 

# 3 Secuencias y archivos de texto
Algunas tareas pueden requerir guardar el contenido de una lista en un archivo, de modo que los datos se puedan usar más adelante. Así mismo, algunas situaciones pueden requerir leer los datos de un archivo en una lista. 
Guardar el contenido de una lista en un archivo es un procedimiento sencillo. De hecho, los objetos de archivo de `Python` tienen un método llamado `writelines` que escribe una lista completa en un archivo. Sin embargo, un inconveniente del método es que no escribe automáticamente una nueva línea (`'\n'`) al final de cada elemento. En consecuencia, cada elemento se escribe en una línea larga del archivo.

In [None]:
# Apertura de archivo para sobreescribir el contenido
outfile = open('Material/numeros.txt', 'w')

for item in range(1,16):
    outfile.write(str(item) + ',' + str(item**2) + '\n')

outfile.close()

In [None]:
# Apertura de archivo para agregar nuevo contenido al final del archivo
outfile = open('Material/numeros.txt', 'a')

for item in range(1,16):
    outfile.write(str(item) + ',' + str(item**2) + '\n')

outfile.close()

In [None]:
cities = ['New York', 'Boston', 'Atlanta', 'Dallas']

outfile = open('Material/ciudades.txt', 'w')

for item in cities:
    outfile.write(item + '\n')

outfile.close()

In [None]:
infile = open('Material/ciudades.txt', 'r')

cities = infile.readlines()

infile.close()

index = 0
while index < len(cities):
    cities[index] = cities[index].rstrip('\n')
    index += 1

print(cities)

In [None]:
import csv; 
lst = list(tuple(line) for line in csv.reader(open('Material/numeros.csv'))); 
print(lst)
print(type(lst))
print(type(lst[1]))

# 4. Graficos de datos con el paquete [`matplotlib`](https://matplotlib.org/)
El paquete `matplotlib` es una librería para crear cuadros y gráficos bidimensionales. No es parte de la librería estándar de `Python`, por lo que deberá instalarlo por separado, después de haber instalado `Python` usando `pip` o `conda`.

```
pip install matplotlib
conda install -n myenv matplotlib
```

El paquete `matplotlib` contiene un módulo llamado [`pyplot`](https://matplotlib.org/stable/api/pyplot_summary.html#module-matplotlib.pyplot) que se debe importar para crear todos los gráficos que realizaremos a continuación.

## 4.1 Gráficos de líneas

El gráfico de líneas se construye con el método [`plot`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html). Aunque en un *Notebook* de Jupyter la gráfica aparece al invocar el método, es una mejor práctica invocar el método `show()` cuando se desee mostrar la gráfica.

In [None]:
import matplotlib.pyplot as plt

x_coords = [0, 1, 2, 3, 4]
y_coords = [0, 3, 1, 5, 2]
plt.plot(x_coords, y_coords)
plt.show()

Por defecto, la gráfica se muestra en color azul, esto se puede cambiar manipulando la propiedad `color` al momento de invocar el método `plot`. Además, existen otro métodos que permiten personalizar las gráficas.

In [None]:
plt.plot(x_coords, y_coords, color = 'k')
plt.title('Primera gráfica')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.xlim(xmin = min(x_coords) - 0.1, xmax = max(x_coords) + 0.1)
plt.ylim(ymin = min(x_coords) - 0.1, ymax = max(y_coords) + 0.1)
plt.show()

La especificación de colores se puede hacer de difrentes formas. Estas se pueden consultar en la [documentación](https://matplotlib.org/stable/tutorials/colors/colors.html) de la librería.

In [None]:
x_coords = [0, 1, 2, 3, 4]
y_coords = [0, 3, 1, 5, 2]

plt.plot(x_coords, y_coords, marker = 'o', color = 'xkcd:navy blue')

plt.title('Ventas anuales')

plt.xlabel('Año')
plt.ylabel('Ventas')

plt.xticks([0, 1, 2, 3, 4], ['2016', '2017', '2018', '2019', '2020'])
plt.yticks([0, 1, 2, 3, 4, 5], ['$0m', '$1m', '$2m', '$3m', '$4m', '$5m'])

plt.grid(True)

plt.show()

## 4.2 Gráficos de barra
Puede usar la función `bar` en el módulo `pyplot` para crear un gráfico de barras. Un gráfico de barras tiene un eje $x$ horizontal, un eje $y$ vertical y una serie de barras que normalmente se originan en el eje $x$. Cada barra representa un valor y la altura de la barra es proporcional al valor que representa la barra.
Para crear un gráfico de barras, primero debe crear dos listas: una que contenga las coordenadas $x$ de cada barra y otra que contenga las alturas de cada barra a lo largo del eje $y$.

In [None]:
edges = [0, 10, 20, 30, 40]
heights = [100, 200, 300, 400, 500]
bar_width = 10
plt.bar(edges, heights, bar_width, color=('tab:blue','tab:orange','tab:green','tab:red','tab:purple',
                                          'tab:brown','tab:pink','tab:gray','tab:olive','tab:cyan'))
plt.title('Ventas anuales')
plt.xlabel('Año')
plt.ylabel('Ventas')
plt.xticks([0,10,20,30,40],
           ['2016', '2017', '2018', '2019', '2020'])
plt.yticks([0, 100, 200, 300, 400, 500],
           ['$0m', '$1m', '$2m', '$3m', '$4m', '$5m'])
plt.show()

## 4.3 Gráficos a partir de archivos `csv`
El módulo [`csv`](https://docs.python.org/3/library/csv.html) implementa clases para leer y escribir datos tabulares en formato **CSV**, sin conocer los detalles precisos del formato CSV utilizado por Excel. Es un poco engorroso la lectura de este tipo de archivo, pero más adelante veremos otras formas más adecuadas, usando arreglos de `Numpy` o *dataframes* de `Pandas`.

La estructura de apertura y lectura del archivo CSV es:
```Python
with open(filename, **fmtparams) as alias:
```

El método `reader` crea un iterable que permite leer datos del archivo CSV cuando este no tiene encabezados. Para que el uso sea exitoso, se debe conocer bien la estructura del archivo CSV y cuáles columnas son las de interés.

In [None]:
import csv
import matplotlib.pyplot as plt

color_list = ('#1f77b4', '#aec7e8', '#ff7f0e', '#ffbb78', '#2ca02c', 
              '#98df8a', '#d62728', '#ff9896', '#9467bd', '#c5b0d5', 
              '#8c564b', '#c49c94', '#e377c2', '#f7b6d2', '#7f7f7f', 
              '#c7c7c7', '#bcbd22', '#dbdb8d', '#17becf', '#9edae5')
x = []
y = []
err = []

with open('Material/medicine.csv','r') as csvfile:
    plots = csv.reader(csvfile, delimiter = ';')
      
    for row in plots:
        x.append(float(row[0]))
        y.append(float(row[2]))
        err.append(float(row[3]))

plt.bar(x, y, color=color_list,width = 0.85, label = "Edad promedio", yerr = err)
plt.xlabel('ID medicina')
plt.ylabel('Edad (M +/- SD)')
plt.title('Edades de usuarios de medicina')
plt.xticks(list(range(1,21)), [str(e) for e in list(range(1,21))])
plt.legend()
plt.show()

En caso de que el archivo CSV tenga encabezados de columnas y se vaya a usar el método `reader`, es necesario omitir esta fila del iterable mediante la función `next`. En el siguiente ejemplo, se hace uso además de la función `zip` que, en términos sencillos, transpone los datos adquiridos para así tener los datos por columna en una lista.

In [None]:
import csv
import matplotlib.pyplot as plt

fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(15, 5))
filename = 'Material/EEG_data.csv'

fields = []
data = []
 
with open(filename, 'r') as csvfile:
    csvreader = csv.reader(csvfile,delimiter = ';')
    fields = next(csvreader)
    for row in csvreader:
        data.append([float(x) for x in row])

all_data = list(zip(*data))

axs[0].violinplot(all_data,
                  showmeans=False,
                  showmedians=True)
axs[0].set_title('Violin plot')

axs[1].boxplot(all_data)
axs[1].set_title('Box plot')

for ax in axs:
    ax.yaxis.grid(True)
    ax.set_xticks([y + 1 for y in range(len(fields))],
                  labels=fields)

plt.show()

Otra forma de leer los datos de archivos CSV es usando el método `DictReader` que permite acceder a cada columna usando su identificador.

In [None]:
import csv
import matplotlib.pyplot as plt
import statistics

glucose = []
SpO2 = []

with open('Material/MOCK_DATA.csv') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        glucose.append(float(row['glucose']))
        SpO2.append(float(row['SpO2']))

meanG = statistics.mean(glucose)
meanS = statistics.mean(SpO2)
stdG = statistics.stdev(glucose,mean)
stdS = statistics.stdev(glucose,mean)
plt.bar(['Glucose','SpO2'], [meanG, meanS], color = ('#1f77b4', '#ff7f0e'), width = 0.55, 
        label = "Valor promedio de glucosa y SpO2", yerr = [stdG, stdS])
plt.show()

# Mini _challenge_ 6

1. En el archivo **client_data.csv** encontrará una base de datos de 1000 personas, separados por `;`. Deberá desarrollar un programa que lea la base de datos y luego pregunte por consola por un número de serie (columna *serial*), buscarlo en la base de datos e imprimir los datos personales de la persona con este ID, siguiendo la estrutura:

    <tt> {first_name} {last_name} with ID number {id} lives at {address_street}, {address_line}, works at {company} as {job_title}. You can reach {him/her/them -  depending on gender} at {email} writing in {mother_tongue}.</tt>

2. En el archivo **Monthlydata.csv** se registran los niveles mensuales promedio de radiación solar en la ciudad de Edimburgo, Escocia, desde el año 2005 al año 2020. Los nombes de las columnas indican lo siguiente (Source: PVGIS (c) European Union):
    - H(h)_m: Irradiation on horizontal plane (kWh/m2/mo) 
    - H(i_opt)_m: Irradiation on optimally inclined plane (kWh/m2/mo) 
    - Hb(n)_m: Monthly beam (direct) irradiation on a plane always normal to sun rays (kWh/m2/mo)
    - Kd: Ratio of diffuse to global irradiation (-)
    - T2m: 24 hour average of temperature (degree Celsius)
    
    Con estos datos, deberá crear una visualización adecuada para mostrar:
    + Evolución en el tiempo de cada variable (gráfica de líneas en diferentes ejes)
    + Comparativo de valores promedio por año (gráficos de caja y bigotes)
    + Comparativo de valores promedio por mes (gráfico de violín)

## Condiciones de entrega
Para este Mini *challenge* se debe hacer entrega, a través del aula digital, de un archivo RAR o ZIP con las soluciones a los problemas y que tenga la siguiente estructura:
```
. 
└── EntregaMC6
    ├── mini_challenge_6.ipynb 
    └── archivos_csv
        ├── client_data.csv
        └── Monthlydata.csv
```
El archivo IPYNB debe contar con lo siguiente:
- Un primer bloque en Markdown a manera de portada, con la siguiente información centrada:
    * Identificación del curso
    * Nombre del estudiante
    * Identificación del mini *challenge*
    * Fecha
- Presentación de cada ejercicio en celda Markdown
- Celdas ejecutables con los problemas desarrollados

<img src="Images/by_nc_sa.svg" style="float:left;width: 50px;"/> &nbsp; El material de este curso está bajo una licencia Creative Commons [Atribución-NoComercial-CompartirIgual 4.0 Internacional](LICENSE.MD) (CC BY-NC-SA 4.0)