# Tipos de datos y Variables

Alejandro E. Martínez Castro

_Departamento de Mecánica de Estructuras e Ingeniería Hidráulica. 
Universidad de Granada_

## Introducción

Aunque pueda pensar que tiene amplios conocimientos sobre tipos de datos y variables, se recomienda la lectura de esta sección, puesto que Python tiene sus propios tipos da datos y variables.

Existen enteros, números de punto flotante, cadenas de caracteres, y más, pero su uso no es igual que en C o en FORTRAN. Si se desean usar listas en C, por ejemplo, es necesario construirlas. Python tiene un tipo de dato específico para el manejo de listas, que optimiza diversos aspectos (como el acceso a memoria) y que cuenta con procedimientos propios. 


## Variables

Como su nombre indica, una variable es algo que puede cambiar. Una variable es una forma de referirse a una localización en memoria utilizada por un programa de ordenador. Una variable tiene un nombre simbólico que "apunta" a una dirección de memoria física. Esta dirección de memoria contiene valores, como números, o bien texto u otros datos. 

Una variable puede verse como un contenedor para almacenar determinados valores. 

Cuando un programa está corriendo accede a las variables y a veces cambia sus valores (e.g. se asigna un nuevo valor a una variable). 

Una de las principales diferencias entre Python y otros lenguajes fuertemente tipados, como C, C++ o Java es la forma en la que maneja los tipos. En lenguajes fuertemente tipados, cada variable debe tener un único tipo de dato. Por ejemplo, si una variable es de tipo "entero" (integer), se le pueden asignar únicamente enteros. En Java, Fortran o C, cada variable tiene que ser declarada antes de ser usada. 

La declaración de una variable la asocia con un tipo de dato. Por ejemplo

    int i
    
Indica que "i" va a ser un número de tipo entero. Posteriormente, se puede hacer una asignación del tipo: 

    i = 10
    
Pero si se intenta hacer la asignación sin haber declarado de qué tipo es "i", el compilador dará un error. 

En Python no se requiere una declaración de variables. Si se necesita una variable, se debe elegir un nombre y se le asignan directamente los valores. El tipo de variable que se asigna puede controlarse y cambiarse durante la ejecución del programa. Obsérvelo con el siguiente ejemplo, en el cual se usa la orden 
    type()
Para indicar el tipo de dato. 

In [1]:
i = 10
print "El valor de i es", i
print "El tipo de i es", type(i)

El valor de i es 10
El tipo de i es <type 'int'>


In [2]:
i = 10.1
print "El valor de i es", i
print "El tipo de i es", type(i)

El valor de i es 10.1
El tipo de i es <type 'float'>


In [3]:
i = "Hola, mundo"
print "El valor de i es", i
print "El tipo de i es", type(i)

El valor de i es Hola, mundo
El tipo de i es <type 'str'>


El signo "=" no debe ser visto como "igual a", sino como "asignado a"

In [4]:
i = 10
i = i+1
print i

11


## Variables frente a Identificadores

Las variables y los identificadores son, a menudo, tomados como sinónimos. El nombre de una variable es un identifiador. Pero una variable es "más que un nombre". Una variable tiene un nombre, un tipo, un contexto y sobre todo, un valor. Un identificador se utiliza no sólo para variables, sino para otras entidades, como etiquetas, subrutinas, funciones, paquetes, etc. 


## Reglas para nombres de identificadores de variables

Cada lenguaje tiene sus reglas para identificadores. Las reglas en Python son las siguientes: 

Un identificador válido es una secuencia de caracterers no vacía de cualquier longitud, tal que: 

+ El carácter inicial puede ser el guión bajo, o una letra mayúscula o minúscula. 
+ Las letras que siguen al carácter inicial puede ser cualquiera de entre las que puede ser el inicial, y los dígitos. 
+ Aviso para los usuarios de Windows: los identificadores son sensibles a mayúsculas o minúsculas. 
+ Las palabras reservadas de Python no pueden ser utilizadas como identificadores. Así, no pueden usarse como identificadores palabras como _and, as, assert, break, class, continue, def, del, elif, else, except, exec, finally, for, from, global, if, import, in, is, lambda, not, or, pass, print, raise, return, try, while, with, yield_

## Cambiando tipos de datos y localización de almacenamiento en memoria

El tipo de una variable cambia en ejecución. Python automáticamente tiene cuidado de la representación física para los diferentes tipos de datos, y de su almacenamiento y localización en memoria. 

¿Qué ocurre cuando se hacen asignaciones?. Veámoslo con un ejemplo: 


In [5]:
x = 3
y = x
y = 2

La primera asignación no tiene problema: Python elige una localización en memoria para la "x" y asigna el valor entero 3 a esta variable. 

La segunda asignación es menos intuitiva. De forma intuitiva, parece que Python genera un nuevo nombre de variable para la "y", y le asigna el contenido de la "x", pero en un lugar diferente de la memoria, creando una copia del valor "3". 

Pero esto no es así. 

Como ambas variables tienen el mismo valor tras asignarlas, Python permite que "y" apunte hacia la localización de memoria de la "x". Python genera un enlace "por referencia", y no "por valor", cuando las variables son iguales. 

La cuestión crítica viene en la siguiente línea de código. La variable "y" es asignada ahora a otro valor, el "2". Pero se vio que la "y" simplemente estaba apuntando al valor que tenía la "x". Ahora se está asignando un valor que es diferente del que tenía para "x=2". 

¿Qué valor tendrá entonces la "x" tras la asignación?. 

Tras asignar "y=2", los valores de "x" e "y" ya no serán iguales. Python asigna una dirección de memoria para "y=2" y destruye el "enlace" que había con la dirección de memoria donde estaba el "2". 

In [6]:
print "x = ", x
print "y = ", y

x =  3
y =  2


Podemos usar la orden "id()" para ver el identificador de las variables. El identificador es un número que identifica cada objeto o variable que se ejecuta dentro de un programa. 

In [7]:
x = 3
print "Identificador de la x", id(x)
y = x
print "Identificador de la y", id(y)

print "Tras asignar y = 2"
y = 2
print "Nuevo identificador de la y", id(y)
print "Identificador de la x", id(x)

Identificador de la x 35224776
Identificador de la y 35224776
Tras asignar y = 2
Nuevo identificador de la y 35224800
Identificador de la x 35224776


Lo que ha ocurrido puede visualizarse como sigue: 

<img class="imgright" src="images/variable_memory.gif" alt="Variables and memory locations" />

Observe ahora el efecto que tiene la siguiente asignación: 

In [8]:
x = 3
y = x
x = 2

¿Qué valor toma la variable "y"?. Puesto que la "y" está apuntando a la dirección de la x, y ahora se ha cambiado...

In [9]:
print "Nuevo valor de y =", y

Nuevo valor de y = 3


Se observa que la asignación respeta lo que intuitivamente se puede pensar. 

Es interesante entender que este comportamiento ocurre únicamente con variables de la librería standard, y no tiene porqué ocurrir con variables de otras librerías. 

En cálculo científico y técnico es habitual utilizar objetos de la librería Numpy. 

En el siguiente ejemplo crearemos un vector de tipo "array de Numpy", y le vamos a asignar un vector de 3 componentes, todas iguales, de valor 1. 

In [10]:
import numpy as np # Le decimos a Python "Importa la librería numpy con el alias "np" "
x = np.ones(3)
y = x

print "vector x", x
print "vector y", y

vector x [ 1.  1.  1.]
vector y [ 1.  1.  1.]


A continuación cambiaremos una posición del vector x. ¿Cambiará el vector "y"?

In [11]:
x[1] = 2 # Segunda posición. Python indexa los vectores comenzando por el 0
print "vector x", x
print "vector y", y

vector x [ 1.  2.  1.]
vector y [ 1.  2.  1.]


Al cambiar una posición del vector x, ha cambiado también esa misma posición del vector y. 

Esto no ocurre cuando la asignación no es a una parte del vector x, sino a todo el vector. Observe ahora. 

In [12]:
x = np.ones(3)
y = x

print "vector x", x
print "vector y", y

x = np.array([1.,2.,3.]) # Con esta asignación cambiamos TODO el vector completo, y no una parte. 
print "vector x", x
print "vector y", y

vector x [ 1.  1.  1.]
vector y [ 1.  1.  1.]
vector x [ 1.  2.  3.]
vector y [ 1.  1.  1.]


## Números

Python incluye un conjunto de números (objetos) dentro de su librería standard. 

### Números enteros

Pueden ser de tres tipos: normales, octales, o hexadecimales.

In [13]:
a = 2
type (a)

int

Un número entero precedido de un 0 (cero) se interpreta como número octal (base 8)

In [14]:
a = 010 
print a 
type(a)

8


int

Un número entero precedido de "0x" o "0X" se considera en representación hexadecimal (base 16)

In [15]:
hex_number = 0xA0F
print hex_number

2575


### Enteros largos (long integers)

Son números enteros no acotados superiormente o inferiormente.

In [16]:
a = 42000000000000000000L
type(a)

long

### Números de punto flotante

In [17]:
x = 12.2
y = 3E-2
print "x es de tipo", type(x)
print "y es de tipo", type(y)

x es de tipo <type 'float'>
y es de tipo <type 'float'>


### Números complejos

Los números complejos se escriben indicando la parte real y con la letra "j" la parte imaginaria

In [18]:
c = 3.2 + 5j
type(c)

complex

In [19]:
print c

(3.2+5j)


Cada tipo de número creado es un objeto, y pueden hacerse determinadas funciones. Pruebe escribir un punto junto al nombre de una de las variables creadas, y pulse el tabulador (dentro del cuaderno de Jupyter Notebook, en Spyder o en Ipython) y observará un listado de las posibles funciones y procedimientos. 

In [20]:
c.imag # Escrito con c. y el tabulador, y elegido "imag". Muestra la parte imaginaria. Pruebe otras funciones aquí.

5.0

## Cadenas de caracteres

Las cadenas de caracteres son otro tipo de dato importante en Python. Las cadenas se indican mediante comilla simple, doble o triple. 

+ Mediante comilla simple ( ' ).
+ Mediante doble comilla ( " ).
+ Mediante triple comilla (''' o """). 
  

In [21]:
texto1 = 'Esto es una cadena simple'
texto2 = "Con doble comilla funciona igual que con comilla simple"
texto3 = """ 

La triple comilla:

permite extenderse con múltiples líneas y saltos de página, y puede 
contener comillas 'simples' o 'dobles' """

In [22]:
print texto1

Esto es una cadena simple


In [23]:
print texto2

Con doble comilla funciona igual que con comilla simple


In [24]:
print texto3

 

La triple comilla:

permite extenderse con múltiples líneas y saltos de página, y puede 
contener comillas 'simples' o 'dobles' 


Una cadena de caracteres en Python es una secuencia indexada de caracteres. Python comienza sus índices en 0, y consecutivamente continúa con el 1, 2, 3, etc (números enteros)

In [25]:
s = "Esto es una cadena de caracteres"
s[1] # Se accede a la primera letra, la E en este caso

's'

El comando "len" se utiliza para indicar el número de caracteres que hay en una cadena

In [26]:
len(s)

32

En Python no existe el tipo "caracter". Un caracter es una cadena de dimensión 1. 

Los índices pueden ser negativos. En ese caso, el acceso es desde el último caracter.

In [27]:
cadena = "Python"

En este ejemplo, 

<img class="img" src="images/string_indices.gif" alt="String Indexing or subscripting" width="200"> 


In [28]:
cadena[1]

'y'

Si los índices son negativos, el acceso se realiza desde el último caracter, hacia atrás. 

<img class="img" src="images/string_indices_negative.png" alt="Negative String indices from the right" width="200"> 

In [29]:
cadena[-1]

'n'

A continuación se indican otras operaciones con cadenas de caracteres: 

- Concatenación: Las cadenas se "pegan" en el orden definido con el signo +

In [30]:
cadena1 = "Hola"
cadena2 = "Mundo"
cadena3 = cadena1 + cadena2
print cadena3

HolaMundo


- Repetición: Las cadenas pueden concatenarse de forma repetida, utilizando el asterisco como operador: 

In [31]:
cadena4 = cadena1 * 3
print cadena4

HolaHolaHola


- Extracción: Se pueden extraer subcadenas dentro de una cadena, indicando las posiciones inicial (inclusiva) y final (exclusiva) entre corchetes. Observe el ejemplo. 

In [32]:
cadena = "Python"
subcadena = cadena[1:4] # Recuerde: Python comienza a indexar en 0; el 3 es exclusivo, es decir, no se toma
print subcadena

yth


### Inmutabilidad de las cadenas

Como ocurre en C o en Java, las cadenas en Python son inmutables. Es decir, que no se pueden cambiar mediante accesos a sus posiciones. Si se intenta hacer, causará un error. Véase. 

In [33]:
cadena = "Python"
cadena[0] = "V"

TypeError: 'str' object does not support item assignment

## Secuencias de escape

La barra inclinada (\) es un caracter especial que se utiliza como secuencia de escape. Se utiliza para los saltos de línea, por ejemplo. A continuación se muestran algunas secuencias de caracteres que son especiales: 

<table  cellpadding="6" cellspacing="0" border="1" bgcolor="#F5F5F5">
<th>Secuencia de escape</th><th>Significado</td></th>
<tr></tr>
<tr><td>\newline</td><td>Ignorado </td></tr>	 
<tr><td>\\</td><td> 	Barra inclinada (\) 	</td></tr> 
<tr><td>\'</td><td> 	Comilla simple (') 	</td></tr> 
<tr><td>\"</td><td> 	Comilla doble (") 	</td></tr> 
<tr><td>\a </td><td>	ASCII Bell (BEL) 	 </td></tr>
<tr><td>\b </td><td>	ASCII Backspace (BS) </td></tr>	 
<tr><td>\f </td><td>	ASCII Formfeed (FF) 	</td></tr> 
<tr><td>\n </td><td>	ASCII Linefeed (LF) 	</td></tr> 
<tr><td>\N{name} </td><td>	Character named name in the Unicode database (Unicode only)</td></tr> 	 
<tr><td>\r </td><td>	ASCII Carriage Return (CR) 	</td></tr> 
<tr><td>\t </td><td>	ASCII Horizontal Tab (TAB) 	</td></tr> 
<tr><td>\uxxxx </td><td>	Character with 16-bit hex value xxxx (Unicode only)</td></tr>
<tr><td>\Uxxxxxxxx </td><td>	Character with 32-bit hex value xxxxxxxx (Unicode only)</td></tr>
<tr><td>\v </td><td>	ASCII Vertical Tab (VT) 	</td></tr> 
<tr><td>\ooo </td><td>	Character with octal value ooo </td></tr>
<tr><td>\xhh </td><td>	Character with hex value hh</td></tr>
</table>