# Introducción a Python

 <p xmlns:cc="http://creativecommons.org/ns#" xmlns:dct="http://purl.org/dc/terms/"><a property="dct:title" rel="cc:attributionURL" href="https://github.com/repomacti/introduccion_python">Introducción a Python</a> by <a rel="cc:attributionURL dct:creator" property="cc:attributionName" href="https://gmc.geofisica.unam.mx/luiggi">Luis Miguel de la Cruz Salas</a> is licensed under <a href="https://creativecommons.org/licenses/by-sa/4.0/?ref=chooser-v1" target="_blank" rel="license noopener noreferrer" style="display:inline-block;">CC BY-SA 4.0<img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" alt=""></a></p> 

# Introducción

Hay cuatro tipos de estructuras de datos, también conocidas como *colecciones*. Cuando se selecciona un tipo de colección, es importante conocer sus propiedades para incrementar la eficiencia y/o la seguridad de los datos. La siguiente tabla resume estos cuatro tipos:

|Tipo|Ordenada|Inmutable|Indexable|Duplicidad|
|-:|:-:|:-:|:-:|:-:|
|List |SI|NO|SI|SI|
|Tuple|SI|SI|SI|SI|
|Sets |NO|NO|NO|NO|
|Dict |NO|NO|SI|NO|

# Listas

* Consisten en una secuencia **ordenada** y **mutable** de elementos. 
    - **Ordenadas** significa que cada elemento dentro de la lista está indexado y mantiene su orden definido en su creación.
    - **Mutable** significa que los elementos de la lista se pueden modificar, y además que se pueden agregar o eliminar elementos.
* Las listas pueden tener elementos **duplicados**, es decir, **elementos del mismo tipo y con el mismo contenido**.
* Las listas se definen usando corchetes `[]` y `,` para separar sus elementos.

In [None]:
lista1 = [1,2,3,4,5,6,7,8,9]
lista2 = ["a", "b", "c"]
lista3 = [1, "a", [5,6,7], "python"]

In [None]:
print(lista1, lista2, lista3, sep="\n")

In [None]:
print(type(lista1), type(lista2), type(lista3), sep="\n")

Las listas se pueden indexar igual que las cadenas:

In [None]:
print(lista1[0])
print(lista1[-1])
print(lista1[::-1])
print(lista1[::2])
print(lista1[3:7])

In [None]:
print(type(lista1[0]), type(lista2[0]), type(lista3[0]), sep="\n")

<div class="alert alert-block alert-success">

## Ejemplo 1. 

Los primeros dos renglones del archivo `personal_data.csv` tienen la siguiente información:
```
Pa,S,E,Pe,A,IMC,Di,H,De,TS,TA
1,h,35,75,1.7,25.95,Si,Si,No,No,Si
```

* Leer la información de esos dos primeros renglones y almacenarla en forma de lista en las variables `encabezado` y `renglon1` de tal manera que contengan lo siguiente:

```
['Pa', 'S', 'E', 'Pe', 'A', 'IMC', 'Di', 'H', 'De', 'TS', 'TA\n']
['1', 'h', '35', '75', '1.7', '25.95', 'Si', 'Si', 'No', 'No', 'Si\n']
```

**Nota**. Toma en cuenta que el último elemento de ambas listas contiene un cambio de línea.
</div>

In [None]:
f = open("personal_data.csv", "r")

encabezado = f.readline().split(',')
renglon1 = f.readline().split(',')

print(encabezado)
print(renglon1)

f.close()

<div class="alert alert-block alert-success">

## Ejemplo 2. 
Crear una lista por cada una de las columnas del archivo `personal_data.csv` y almacenarlas en listas que lleven por nombre el que tiene cada columna en el encabezado.

**Nota**. Debido a que se usarán los datos numéricos para realizar algunas operaciones, es conveniente que te asegures que los estás almacenando con el tipo de número correcto (y no como cadenas).

</div>

In [None]:
f = open("personal_data.csv", "r")

encabezado = f.readline().split(',')

S = []
E = []

for renglon in f:
    datos = renglon.split(',')
    S.append(datos[1])
    E.append(datos[2])

print(S, E, sep='\n')

f.close()

<div class="alert alert-block alert-success">

## Ejemplo 3. 
* Para las listas que contienen datos categóricos, contar el total de cada categoría.
* Para las listas que contienen datos numéricos calcular:
    - La media.
    - La mediana.
    - La varianza.
    - La desviación estándar.
</div>

In [None]:
# Una manera de contar las variables categóricas
m = 0
h = 0

for s in S:
    if s == 'm':
        m += 1
    elif s == 'h':
        h += 1

print(f"Hombres = {h}")
print(f"Mujeres = {m}")

# Una mejor manera
print(f"Hombres = {S.count('h')}")
print(f"Mujeres = {S.count('m')}")

In [None]:
# La lista E contiene números representados por cadenas. 
# Necesitamos convertirlas a un tipo numérico

# 1.
media_E = 0
for e in E:
    media_E += int(e)
media_E /= len(E)

print(f"1. Media (Edad) = {media_E:8.2f}")

# 2.
media_E = sum(E) / len(E)
print(f"2. Media (Edad) = {media_E:8.2f}")

# 3. No inventar el hilo negro!!!
import statistics
print(f"3. Media (Edad) = {statistics.mean(E):8.2f}")
print(f"Mediana (Edad) = {statistics.median(E):8.2f}")
print(f"Varianza (Edad) = {statistics.variance(E):8.2f}")
print(f"Desv. Est. (Edad) = {statistics.stdev(E):8.2f}")

<div class="alert alert-block alert-success">

## Ejemplo 4. 
Presentar la información de cada columna con datos numéricos como sigue:

```
―――――――――――――――――――――――――――――――――――――――――――――
        Información estadística (Edad)       
―――――――――――――――――――――――――――――――――――――――――――――
          Media = 49.99   
        Mediana = 48.00   
       Varianza = 123.48  
     Desv. Est. = 11.11   
―――――――――――――――――――――――――――――――――――――――――――――
```
</div>

In [None]:
import statistics

print(45 * chr(0x2015))
print("Información estadística (Edad)".center(45))
print(45 * chr(0x2015))
print("{:>15s} = {:<8.2f}".format("Media", statistics.mean(E)))
print("{:>15s} = {:<8.2f}".format("Mediana", statistics.median(E)))
print("{:>15s} = {:<8.2f}".format("Varianza", statistics.variance(E)))
print("{:>15s} = {:<8.2f}".format("Desv. Est.", statistics.stdev(E)))
print(45 * chr(0x2015))

<div class="alert alert-block alert-success">

## Ejemplo 5. Copiando listas
Copiar el contenido de la lista `E` en otra lista de nombre `E_copia`.
</div>

In [None]:
E_copia = E

print(E, E_copia, sep = "\n")

In [None]:
print(id(E), id(E_copia), sep = "\n")

In [None]:
E_copia = E[:]

print(E, E_copia, sep = "\n")
print(id(E), id(E_copia), sep = "\n")

In [None]:
E_copia2 = E.copy()

print(E, E_copia2, sep = "\n")
print(id(E), id(E_copia2), sep = "\n")

# Tuplas

* Consisten en una secuencia **ordenada** e **inmutable** de elementos. 
    - **Ordenadas** significa que cada elemento dentro de la tupla está indexado y mantiene su orden definido en su creación.
    - **Inmutable** significa que los elementos de la tupla **NO se pueden modificar**, tampoco que se pueden agregar o eliminar elementos.
* Las tuplas pueden tener elementos **duplicados**, es decir, **elementos del mismo tipo y con el mismo contenido**.
* Las tuplas se definen usando paréntesis `()` y `,` para separar sus elementos.

In [None]:
t1 = ('a', 'b', 'c', 'd')

In [None]:
print(t1, type(t1), sep='\n')

## Enumerando listas y tuplas (`enumerate()`)

In [None]:
contador = 0
for e in E:
    print(contador, e)
    contador += 1

In [None]:
list(enumerate(E))

In [None]:
for i, e in enumerate(E):
    print(i, e)

## Juntando listas y/o tuplas (`zip()`)

In [None]:
list(zip(S, E))

In [None]:
for s, e in zip(S, E):
    print(s, e)

In [None]:
for i, (s, e) in enumerate(zip(S,E)):
    print(i, s, e)

# Conjuntos

* Consisten en una secuencia **NO ordenada** y **mutable**.
* **NO** permite miembros duplicados.
* Los elementos de los conjuntos **NO** se pueden indexar.
* Los conjuntos se definen usando llaves `{}` y `,` para separar sus elementos.

In [None]:
c1 = {4, 1, 8, 0, 4, 20}
c2 = {'z', 'x', 'g', 'a', 'k', 'x', 4, 3, 2, 1}

In [None]:
print(c1)
print(c2)

In [None]:
# Elementos en c1, pero no en c2
c1 - c2

In [None]:
# Elementos en c1 o en c2 o en ambos
c1 | c2

In [None]:
# Elementos en c1 o en c2, pero no en ambos
c1 ^ c2

In [None]:
# Elementos en ambos conjuntos
c1 & c2

# Diccionarios

* Consisten en una secuencia **NO ordenada** y **mutable**.
* **NO** permite miembros duplicados.
* Cada elemento de un diccionario contiene una clave y un valor.
* Los elementos de los diccionarios se pueden indexar a través de las claves.
* Los diccionarios se definen usando llaves `{}`, `:` para separar la clave del valor y `,` para separar sus elementos.

In [None]:
diccionario = {"Nombre": "Claudia", "Peso": 80, "Estatura": 1.78}
#diccionario = dict(Nombre = "Claudia", Peso = 80, Estatura = 1.78)

print(diccionario)
print(type(diccionario))

In [None]:
diccionario.items()

In [None]:
diccionario.keys()

In [None]:
diccionario.values()

In [None]:
diccionario['IMC'] = diccionario["Peso"] / diccionario["Estatura"]**2

print(diccionario)

<div class="alert alert-block alert-success">

## Ejemplo 6. 
Leer los primeros tres renglones del archivo `personal_data.csv` y con cada uno de ellos crear un diccionario de tal manera que la salida sea la siguiente:

```
{'Pa': '1', 'S': 'h', 'E': '35', 'Pe': '75', 'A': '1.7', 'IMC': '25.95', 'Di': 'Si', 'H': 'Si', 'De': 'No', 'TS': 'No', 'TA\n': 'Si\n'}
{'Pa': '2', 'S': 'm', 'E': '57', 'Pe': '88', 'A': '1.59', 'IMC': '34.81', 'Di': 'No', 'H': 'Si', 'De': 'No', 'TS': 'No', 'TA\n': 'No\n'}
{'Pa': '3', 'S': 'h', 'E': '40', 'Pe': '81', 'A': '1.66', 'IMC': '29.39', 'Di': 'No', 'H': 'No', 'De': 'No', 'TS': 'Si', 'TA\n': 'No\n'}
```

</div>

In [None]:
f = open("personal_data.csv", "r")

e = f.readline().split(',')

for i, r in enumerate(f):
    if i == 3:
        break
    dicc = {}
    for k, v in zip(e, r.split(',')):
        dicc[k] = v
    print(dicc)

f.close()

# Recorriendo las secuencias.

- En Python existen objetos que contienen secuencias de otros objetos.
- Estos objetos pueden ser cadenas, listas, tuplas, diccionarios, conjuntos, archivos, entre otros.
- Estos objetos se pueden recorrer usando ciclos `for` . <br>
- A estos objetos se les conoce también como **iterables** (objetos iterables, secuencias iterables, contenedores iterables, conjunto iterable).

In [None]:
mi_cadena = "str: pythonico"
mi_lista = ['list: ', 'p','y','t','h','o','n','i','c','o']
mi_tupla = ('tuple: ', 'p','y','t','h','o','n','i','c','o')
mi_dict = {'p':1,'y':2,'t':3,'h':4,'o':5,'n':6,'i':7,'c':8,'o':9}
mi_conj = {'p','y','t','h','o','n','i','c','o'}

for c in mi_cadena:
    print(c, end='')
print()

for e in mi_lista:
    print(e, end='')
print()

for e in mi_tupla:
    print(e, end='')
print()

for i in mi_dict.items():
    print(i, end='')
print()

for key in mi_dict.keys():
    print(key, end=' ')
print()

for v in mi_dict.values():
    print(v, end=' ')
print()

for s in mi_conj:
    print(s, end = ' ')


In [None]:
# También un archivo se trata como una secuencia
mi_archivo = open('gatos.txt','r')

for i in mi_archivo:
    print(i, end='')
    
mi_archivo.close()

<div class="alert alert-block alert-success">

## Ejemplo 7. 
Modifica el código del ejemplo 6 para que se obtenga una salida como la siguiente para cada paciente:

```
                      Paciente :   1  
                          Sexo :   h  
                          Edad :  35  
                          Peso :  75  
                      Estatura :  1.7 
                           IMC : 25.95
                      Diabetes :  Si  
                  Hipertensión :  Si  
                     Depresión :  No  
           Trastorno del sueño :  No  
  Trastorno de la alimentación :  Si
```
</div>



In [None]:
### BEGIN SOLUTION
f = open("personal_data.csv", "r")

e = f.readline().split(',')
e[-1] = e[-1][:-1]
lista_dicc = []

for i, r in enumerate(f):
    if i == 3:
        break
        
    dicc = {}
    for k, v in zip(e, r.split(',')):
        dicc[k] = v
        
    lista_dicc.append(dicc)

dicc_e = dict(Pa = "Paciente", 
              S = "Sexo",
              E = "Edad",
              Pe = "Peso",
              A = "Estatura",
              IMC = "IMC",
              Di = "Diabetes",
              H = "Hipertensión",
              De = "Depresión",
              TS = "Trastorno del sueño",
              TA = "Trastorno de la alimentación"
             )

for ld in lista_dicc:
    for k, v in ld.items():
        print("{:>30s} : {:^5s}".format(dicc_e[k], str(v)))
        
f.close()

### END SOLUTION