# Built-in Data Structures, Functions

Analizaremos las capacidades integradas en el lenguaje Python que se utilizarán de manera ubicua en todo este libro. Si bien las bibliotecas de complementos como pandas y NumPy agregan funcionalidad computacional avanzada para conjuntos de datos más grandes, están diseñadas para usarse junto con las **herramientas de manipulación de datos integradas** de Python.

Comenzaremos con las estructuras básicas de Python: tuplas, listas, dictados y conjuntos. Luego, discutiremos la creación de propias funciones Python reutilizables. Finalmente, veremos la mecánica de los objetos de archivo Python e interactuaremos con el disco duro local.

## Data Structures and Sequences

### Tuple

- Una tupla es una secuencia **inmutable** de **longitud fija**. La forma más fácil de crear una es con una secuencia de valores separados por comas.

In [1]:
tup = 4, 5, 6
tup

(4, 5, 6)

- Cuando defines tuplas en expresiones más complicadas, a menudo es necesario encerrar los valores entre paréntesis, como en este ejemplo donde se crea una tupla de tuplas:

In [3]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

- Puedes convertir cualquier **secuencia** o **iterator** en una tupla invocando **tuple**.

In [5]:
tuple([4, 0, 2])

(4, 0, 2)

In [6]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

- Los elementos pueden ser accedidos con corchetes **[]**, como la mayoría de los otros tipos de secuencia. Como en C, C++, Java y muchos otros lenguajes, las secuencias están indexadas desde 0 en Python. 
- Si bien los objetos almacenados en una tupla pueden ser **mutables**, una vez creada la tupla no es posible modificar ninguno de los objetos almacenados en cada ranura.

In [8]:
tup = tuple(['foo', [1, 2], True])
print(tup[0])
tup[2] = False

foo


TypeError: 'tuple' object does not support item assignment

- Si un objeto dentro de una tupla es **mutable**, como una **lista**, puede ser modificado in-situ:

In [9]:
print(tup)
tup[1].append(3)
tup

('foo', [1, 2], True)


('foo', [1, 2, 3], True)

- Puedes concatenar tuplas usando el operador + y producir tuplas más largas.

In [11]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

- Multiplicar una tupla por un número entero, como con las **listas**, tiene el efecto de concatenar ese número de veces las copias de la tupla. 
    - Tenga en cuenta que los objetos en sí no se copian, sino solo las referencias a ellos.

In [12]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

#### Unpacking tuples

- Si intenta _asignar_ a una expresión de variables similar a una tupla, Python intentará _desempaquetar_ el valor en el lado derecho del signo igual:

In [13]:
tup = (4, 5, 6)
a, b, c = tup
b

5

- Incluso las secuencias con tuplas anidadas se pueden _desempaquetar_.

In [15]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

7

- Con esta funcionalidad, puedes intercambiar nombres de variables fácilmente, una tarea que en muchos idiomas podría verse: 

In [None]:
tmp = a
a = b
b = tmp

In [None]:
a, b = 1, 2
print(a)
print(b)
b, a = a, b
print(a)
print(b)

- Un uso común del _desempaquetado_ de variables es iterar sobre secuencias de tuplas o listas.

In [17]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print('a={0}, b={1}, c={2}'.format(a, b, c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


- Otro uso común es devolver múltiples valores de una función. El lenguaje Python adquirió recientemente un _desempaquetado_ de tuplas más avanzado para ayudar con situaciones en las que es posible que se desee "extraer" algunos elementos desde el comienzo de una tupla. Esto usa la sintaxis especial **\*rest**, que también se usa en firmas de funciones para capturar una lista arbitrariamente larga de argumentos posicionales:

#### Tuple methods