# **Sesión 1. Módulo 2.**  
# **Estructuras de Datos**  

## **2.1. Literales, variables, expresiones**  

Necesitaremos que nuestro programa contenga y maneje muchos datos. Por ejemplo, el tiempo de reacción registrado en un ensayo, la duración de la presentación de la imagen, o la serie temporal de voltajes medidos por un conjunto de electrodos.




Como punto de partida, distinguiremos entre tres tipos de valores útiles:

* Entero (**int**): números enteros, por ejemplo `5`  

* Flotante (**float**): números decimales, por ejemplo `5.3` (el separador decimal es el punto)  

* Booleanos (**bool**): números binarios, codificados como `True` o `False`  

Estas representaciones de valores se denominan **literales**, ya que se escribe literalmente en el programa el valor que se quiere.

Sin embargo, lo más habitual es que los valores estén implícitos en **expresiones** que se evalúan a un valor.   

Por ejemplo, `5 + 3` no representa literalmente el número _8_, pero si lo calculas, se evalúa a `8`.

Por tanto, una expresión es cualquier fragmento de código que representa un valor. En este ejemplo hemos visto cómo introducir cálculos artiméticos en nuestros programas python. 

Python incluye los operadores aritméticos básicos (+, -, *, /, \*\*), que pueden utilizarse sobre distintos tipos de datos con efectos distintos.

Puedes usar la siguiente celda para probar a introducir distintas expresiones. En este entorno, para obtener el resultado debemos pulsar [CONTROL] + [Enter] (en linea de comandos solo es necesario [Enter]):

In [76]:
True + True

2

Muchos valores cambian durante la ejecución de un programa, pero conservan el mismo significado; o bien, pueden repetirse tan a menudo a lo largo del programa que es más conveniente representarlos con un nombre simbólico. 

Para ello exiten las **variables**, que tienen un nombre fijo, y un valor que no es fijo. Para asignar un valor a una variable en python, utilizamos la siguiente sintaxis:

`nombre = valor`

Para ver entonces el valor contenido en una variable, haz:

`print(nombre)`

A diferencia de otros lenguajes de programación, Python no requiere que definas tú mismo el tipo de una variable; Python lo averiguará a partir de los valores que asignes. Es lo que se denomina **tipado dinámico**.  

Para inspeccionar el tipo de cualquier variable una vez que ha sido asignada, haz:

`print(type(nombre))`

**PRACTÍCALO**  
Practicad ahora en la celda de código de abajo a crear distintas variables de distintos tipos de datos, a través de literales o expresiones. Imprimid por pantalla el tipo de dato y el contenido utilizando la función print como se muestra en la transparencia anterior.

In [78]:
a = 4.
type(a)

float

## **2.2. Sentencias (Statements)**

Un programa suele consistir en una secuencia de líneas cortas, cada una de las cuales hace algo. Una línea de código que hace algo se llama sentencia.

Anteriormente, hemos utilizado sentencias de asignación para asignar valores a las variables, y sentencias print para imprimir los valores de las variables en la pantalla.

Pero, si queremos que nuestro programa sea algo más que una calculadora glorificada, necesitamos más tipos de sentencias. 

**Atendiendo a su contenido**, existen los siguientes tipos de sentencias de python (los iremos viendo a lo largo del curso a medida que sean necesarias):


* Sentencias con expresiones  
* Sentencias de asignación  
* Sentencias condicionales (if)  
* Sentencias iterativas (for, while)  
* Sentencias break
* Sentencias continue  
* Sentencias pass  
* Sentencias raise  
* Sentencias try y catch  
* Sentencias def  
* Sentencias return  
* Sentencias import  


* Sentencias class  
* Sentencias assert  
* Sentencias global  
* Sentencias nonlocal  
* Sentencias yield  
* Sentencias del  
* Sentencias with  

Si atendemos a la **manera de escribirlas**, existen tres tipos de sentencias:  
* Sentencias simples
* Múltiples sentencias en una sola línea
* Sentencias multilínea

**Sentencias simples**  
Las sentencias simples se utilizan para realizar las operaciones de una línea lógica, como Suma, Multiplicación, etc.

Las sentencias simples son el bloque de construcción básico del programa. Así que todas las asignaciones e impresión de variables pueden ser consideradas como sentencias simples.

In [84]:
# Este bloque de código contiene sentencias simples
pi = 3.14159
radio = 25
area = pi * radio ** 2
print("El area de un círculo de radio %f m es %f m2 %d " % (radio, area ))

El area de un círculo de radio 25.000000 m es 1963.493750 m2


**Múltiples sentencias en una sola línea**  
Podemos escribir varias sentencias en una sola línea utilizando el punto y coma ( ; ). A este tipo de sentencias las llamamos sentencias compuestas.

Si no especificamos punto y coma, python por defecto termina las sentencias con el carácter de nueva línea ( excepto cuando usamos los operadores de línea continua o llaves, etc)

Este es un ejemplo de sentencias múltiples en una sola línea.

In [86]:
a = 10; b = 20; c =30; d = a * b; print(d)

200


**Sentencias multilínea**  
Como hemos comentado anteriormente las sentencias python terminan con la nueva línea, si no queremos terminar la sentencia en una sola línea, podemos utilizar el carácter de continuación de línea (' \ ').

In [90]:
suma10 = 1 + 2 + 3  \
        + 4 + 5 + 6 \
       + 7 + 8 + 9 \
       +10

49

In [88]:
suma10

55

También podemos escribir sentencias multilínea utilizando los paréntesis ( ), corchetes [] y llaves {} en lugar de utilizar el carácter de continuación de línea barra inclinada \. Este método se denomina continuación de línea implícita.

In [None]:
suma10 = ( 1 + 2 + 3
         + 4 + 5 + 6
         + 7 + 8 + 9
         + 10 )

In [None]:
suma10

## **2.3. Tipos de datos básicos**  
Por ahora vamos a dejar las sentencias y a centrarnos en conocer los tipos de datos básicos.  

Como decíamos un tipo de dato es una abstracción que permite representar una serie de propiedades interesantes. 

Por ejemplo un tipo de dato **int** nos permite representar algunas de las propiedades de los números enteros.

Igualmente, el tipo de dato **float** nos permite representar algunas de las propiedades de los números reales (en realidad, sólo de los numeros racionales, ya que el número de decimales en un ordenador es finito, por lo que no puede representar números reales).  

Para la computación científica es muy frequente utilizar tipos de datos que representan propiedades de  distintos objetos matemáticos. 

A continuación veremos primero los tipos de datos básicos de python, que todo usuario del lenguaje debe conocer, y después presentaremos brevemente tres tipos de datos muy importante en computación científica.  

Los tipos de datos básicos están incluidos en el nucleo de python (built-in) y por ello están siempre presentes en toda instalación de python. Los tipos que veremos en este curso son los siguientes:

* **Booleanos**

* **Datos numéricos**: _int_, _float_ y _complex_

* **Secuencias**:  _list_ (colecciones mutables), _tuple_ (colecciones inmutables), _range_ (rangos numéricos para iterar), _str_ (cadenas de texto)

* **Mapas**: _dict_ (diccionarios)


A continuación vamos a ver distintas operaciones o propiedades que podemos utilizar con los tipos de dato básicos, aunque la semántica es ligeramente distinta en cada caso.

### **Valor de verdad**  
En python se puede comprobar el valor de verdad de cualquier objeto, para utilizarlo en una condición if o while o como operando de operaciones booleanas.  

Aquí están las condiciones en que los datos básicos se consideran falsos:  

* Constantes definidas como falsas: `None` y `False`.  

* Cero de cualquier tipo numérico: `0`, `0.0`, `0j`

* Secuencias y colecciones vacías: `''`, `()`, `[]`, `{}`,  `range(0)`  

### **Operaciones booleanas**  

Éstas son las operaciones booleanas, ordenadas por prioridad ascendente:


![operacionesbooleanas.png](attachment:dabbb36a-ba49-4c3d-9472-3b4109f39408.png)
1. Se trata de un operador de cortocircuito, por lo que sólo evalúa el segundo argumento si el primero es falso.  

2. Se trata de un operador de cortocircuito, por lo que sólo evalúa el segundo argumento si el primero es verdadero.  

3. not tiene una prioridad menor que los operadores no booleanos, por lo que `not a == b` se interpreta como `not (a == b)`, y `a == not b` es un error sintáctico.  

### **Comparaciones**
En Python existen ocho operaciones de comparación. Todas tienen la misma prioridad (que es mayor que la de las operaciones booleanas).  

Las comparaciones se pueden encadenar arbitrariamente; por ejemplo, `x < y <= z` es equivalente a `x < y and y <= z`, excepto que `y` se evalúa sólo una vez (pero en ambos casos `z` no se evalúa en absoluto cuando `x < y` resulta ser falso).  

Esta tabla resume las operaciones de comparación:  
![comparaciones.png](attachment:e977a54e-0d33-4667-be5f-b7e0be0c7d69.png)

Los objetos de tipos diferentes, excepto los de tipos numéricos diferentes, nunca se comparan igual.  

El operador == siempre está definido, pero para algunos tipos de objetos (por ejemplo, objetos de clase) es equivalente a is.

Los operadores <, <=, > y >= sólo están definidos cuando tienen sentido; por ejemplo, lanzan una excepción `TypeError` cuando uno de los argumentos es un número complejo.

### **Datos numéricos**
Los números se crean mediante literales numéricos o como resultado de expresiones que operan sobre literales y funciones.  

Python soporta la aritmética mixta: cuando un operador aritmético binario tiene operandos de diferentes tipos numéricos, el operando con el tipo "más estrecho" se ensancha al del otro, donde entero es más estrecho que punto flotante, que es más estrecho que complejo.  

Una comparación entre números de distintos tipos se comporta como si se estuvieran comparando los valores exactos de esos números.  

Los constructores `int()`, `float()` y `complex()` pueden utilizarse para producir números de un tipo específico.  

Todos los tipos numéricos (excepto complex) admiten las siguientes operaciones:
![operacionesaritmeticas_short.png](attachment:6230b1d1-c08b-4249-8521-b4708ee54b4c.png)
    

### **Secuencias**
Existen tres tipos básicos de secuencias: listas, tuplas y los rangos.  

Las cadenas de texto también son secuencias y soportan las mismas operaciones que las secuencias en general, pero dada su especificidad se describen en detalle en el siguiente punto.  

Cada secuencia se crea por medio de diferentes expresiones:

* listas: para crear una lista se puede usar el constructor _list_ o se puede utilizar corchetes. Ejemplos:  
    `a = list()`  
    `b = [1, 2, 'casa']`  

* tuplas: para crear una tupla se puede usar el contructtor _tuple_ o se pueden utilizar parentesis. Ejemplos:  
    `c = tuple()`  
    `d = (1, 2, 'casa')`

* rangos: para crear rangos se utiliza la función _range_, que toma parámetros el valor inicial, final y el tamaño de paso:  
    `e = range(0, 100, 5)`

#### **Operaciones comunes de secuencia**

Las operaciones de la siguiente tabla son soportadas por la mayoría de los tipos de secuencia, tanto mutables como inmutables. 

Esta tabla enumera las operaciones de secuencia ordenadas por prioridad ascendente. En la tabla, `s` y `t` son secuencias del mismo tipo, `n`, `i`, `j` y `k` son enteros y `x` es un objeto arbitrario que cumple las restricciones de tipo y valor impuestas por `s`.

![operacionessecuencias_short.png](attachment:4d8b0e74-5401-44b7-993a-2a2a480809ef.png)

#### **Operaciones sobre secuencias mutables**  
En la siguiente tabla, `s` es una instancia de un tipo de secuencia mutable, `t` es cualquier objeto iterable y `x` es un objeto arbitrario que cumple cualquier restricción de tipo y valor impuesta por `s`.

![operacionessecuenciasmutables.png](attachment:15caa9a7-dc01-417d-a699-0e64336f6624.png)

### **Cadenas de texto (str)**

Los datos textuales en Python se manejan con objetos `str`, o cadenas. Las cadenas son secuencias inmutables de caracteres (unicode). 

Las cadenas literales se escriben de varias maneras:  

* **Comillas simples**: 'permite comillas "dobles" incrustadas'  

* **Comillas dobles**: "permite comillas "simples" incrustadas"  

* **Comillas triples**: '''Tres comillas simples''', """Tres comillas dobles"""  

Las cadenas entre comillas triples pueden abarcar varias líneas: todos los espacios en blanco asociados se incluirán en el literal de cadena.  

Existe una gran cantidad de métodos para operar sobre cadenas de texto. A continuación presento los más relevantes, aunque todos ellos son útiles tarde o temprano.  

Para consultar una lista completa basta con buscar en google "python string methods", o usar la ayuda interactiva de python, o consultar el enlace https://docs.python.org/3/library/stdtypes.html

**s.lower(), s.upper()** -- devuelve la versión en minúsculas o mayúsculas de la cadena  

**s.strip()** -- devuelve una cadena sin espacios en blanco al principio y al final  

**s.isalpha()/s.isdigit()/s.isspace()...** -- comprueba si todos los caracteres de la cadena pertenecen a las distintas clases de caracteres  

**s.startswith('other'), s.endswith('other')** -- comprueba si la cadena empieza o termina con la otra cadena dada  

**s.find('other')** -- busca la otra cadena dada (no una expresión regular) dentro de s, y devuelve el primer índice donde comienza o -1 si no se encuentra  

**s.replace('old', 'new')** -- devuelve una cadena en la que todas las apariciones de 'old' se han sustituido por 'new'.  

**s.split('delim')** -- devuelve una lista de subcadenas separadas por el delimitador dado. El delimitador no es una expresión regular, es sólo texto. `'aaa,bbb,ccc'.split(',')` -> `['aaa', 'bbb', 'ccc']`. Como caso especial, s.split() (sin argumentos) divide todos los espacios en blanco.  

**s.join(list)** -- opuesto a split(), une los elementos de la lista dada usando la cadena como delimitador. p.ej. `'---'.join(['aaa', 'bbb', 'ccc'])` -> `aaa---bbb---ccc`  


### **EJERCICIOS CON SECUENCIAS**  
A continuación practicaremos el uso de secuencias en tres ejercicios. Para ello vamos a partir de una lista de nombres llamada, apropiadamente, nombres: 

In [None]:
nombres = ['casa','coche','computa','amanecer']

1. Calcula cuantos elementos tiene la lista

2. Calcula cuantas veces aparece la cadena 'computa' en la lista

3. Calcula la longitud de la primera cadena de texto de la lista

4. Calcula la longitud de la última cadena de texto de la lista

5. Calcula la longitud de la cadena de texto que está en el índice número 2

6. Calcula cuantas veces aparece el caracter 'a' en el primer elemento de la lista

7. Añade el nombre 'mesa' al final de la lista

8. Inserta el nombre 'telefono' entre los nombres 'coche' y 'computa'

9. Elimina el nombre 'coche' de la lista

10. Extiende la lista con la siguiente lista:

In [None]:
otralista = ['raton', 'ventana']

11. Comprueba usando expresiones booleanas si las cadenas de texto 'telefono' y 'cometa' están en la lista.

12. Comprueba usando expresiones booleanas si el tercer elemento de la lista contiene las sílabas 'ca', 'le' y 'no'.

13. Cuenta cuantas veces aparece el carácter 'e' en el tercer elemento de la lista.

### **Mapas (diccionarios)**  

Un diccionario es un mapa que asocia claves inmutables a valores arbitrarios.  

Los diccionarios pueden crearse de varias formas:  

* Utilizar una lista separada por comas de pares clave: valor entre llaves: `{'María': 4098, 'José': 4127}` o `{4098: 'María', 4127: 'José'}`  

* Utilice el constructor de tipo: `dict()`, `dict([('foo', 100), ('bar', 200)])`, `dict(foo=100, bar=200)`  

In [107]:
testdict1 = {'María': 4098, 'José': 4127} 
testdict1

{'María': 4098, 'José': 4127}

In [108]:
testdict2 = {4098: 'María', 4127: 'José'} 
testdict2

{4098: 'María', 4127: 'José'}

In [109]:
testdict1['María']

4098

In [111]:
testdict2[4127]

'José'

In [112]:
testdict1['Marta'] = 9989

In [None]:
testdict1.keys()

In [None]:
testdict1.values()

Los métodos para trabajar con diccionarios son:  

* **clear()** Elimina todos los elementos del diccionario  
* **copy()** Devuelve una copia del diccionario  
* **fromkeys()** Devuelve un diccionario con las claves y el valor especificados  
* **get()** Devuelve el valor de la clave especificada  
* **items()** Devuelve una lista que contiene una tupla por cada par clave-valor  
* **keys()** Devuelve una lista con las claves del diccionario  
* **pop()** Elimina el elemento con la clave especificada  
* **popitem()** Elimina el último par clave-valor insertado  
* **setdefault()** Devuelve el valor de la clave especificada. Si la clave no existe: inserta la clave, con el valor especificado  
* **update()** Actualiza el diccionario con los pares clave-valor especificados  
* **values()** Devuelve una lista de todos los valores del diccionario  

### **EJERCICIOS CON DICCIONARIOS**  
Ahora vamos a poner en práctica los diccionarios para crear representaciones de un diseño experimental que Python pueda "entender".

1. Supongamos que vas a analizar los resultados de un experimento con un diseño es factorial. Los factores within son la valencia del estímulo (neutra, positiva, negativa), y la duración de la presentación del estímulo (100ms, que llamaremos corta, o 500 ms, que llamaremos larga). Elabora en la celda siguiente una estructura de datos que pueda contener parsimoniosamente este diseño experimental. El orden de los niveles y factores no es relevante por que llevaremos a cabo una presenteción totalmente aleatorizada. 

In [131]:
design = dict()
design['valencia'] = ['neutra', 'positiva', 'negativa']
design['duracion'] = ['corta', 'larga']
design 

{'valencia': ['neutra', 'positiva', 'negativa'],
 'duracion': ['corta', 'larga']}

2. Ahora diseña la misma estructura pero teniendo en cuenta que la duración de la presentación del estímulo está anidado dentro del factor valencia. Esto quiere que para cada nivel del factor valencia debes generar todos los niveles del factor duración.

In [135]:
design = dict()
design['valencia'] = dict()
design['valencia']['neutra'] = ['corta', 'larga']
design['valencia']['positiva'] = ['corta', 'larga']
design['valencia']['negativa'] = ['corta', 'larga']
design 

{'valencia': {'neutra': ['corta', 'larga'],
  'positiva': ['corta', 'larga'],
  'negativa': ['corta', 'larga']}}

3. Ahora resulta que nos llama nuestro director de tesis y nos dice que va a añadir un nuevos nivel al factor duración de la presentación (se llamará media y durará 300 ms), y va a cambiar la duración larga para ser de 600ms. Utilizando la estructura de datos que creaste en el ejercicio anterior, modificala para que represente el nuevo diseño en la celda siguiente.

In [136]:
design['valencia']['neutra'].insert(1,'media')
design['valencia']['positiva'].insert(1,'media')
design['valencia']['negativa'].insert(1,'media')
design

{'valencia': {'neutra': ['corta', 'media', 'larga'],
  'positiva': ['corta', 'media', 'larga'],
  'negativa': ['corta', 'media', 'larga']}}