# Datos con Python

## Conceptos

* `La información computada se convierte en datos. Ejemplo, la temperatura no medida es información, pero cuándo se mide se vuelve un dato`.
* `Los datos se almacenan finalmente en forma de bits dentro de una computadora, por lo que tienen asociado un formato de conversión. Ejemplo, una imagen es la representación de pixeles, es decir, puntos en el espacio de colores distintos. Básicamente una imagen aproxima la realidad estampada en un plano momentáneamente, pero la computadora entiende cada pixel de color como el nivel de rojo, verde y azúl para mezclar o componer el color. Así, una imagen será para la computadora una matriz de pixeles y cada pixel será una tupla de 3 colores, por lo que tenemos una representación binaria de la información. Esta representación se basa en estándares.`

In [1]:
a = 123

In [2]:
gradosFarenheit = 34

## Colecciones

* `Listas` - Es un conjunto ordenado (indexado) de datos que puede cambiar en el tiempo. Sirven para retener información compleja. Ejemplo, las edades de un grupo de personas.
* `Tuplas` - Es un conjunto ordenado (indexado) de datos que no pueden cambiar con el tiempo. Sirven como paquetes de transporte de información. Ejemplo, para retener los valores asociados a un punto espacial y pasarlo de una función a otra.
* `Diccionarios` - Es un conjunto no ordenado (basado en clave) de datos que pueden cambiar con el tiempo. Sirven para retener datos tabulares o asociados a claves personalizadas. Ejemplo, un diccionario que retiene los datos de una persona (con diferentes tipos y sentidos).

## Listas

Sintaxis: `[ <elemento 0>, <elemento 1>, <elemento 2>, ..., <elemento I> ]`

Índices: 0, 1, ..., N - 2, N - 1

Al revés: -N, -N + 1, -N + 2, ..., -3, -2, -1

In [3]:
edades = [23, 17, 45, 67, 85, 54]

In [4]:
edades[0] # 0 -> 23

23

In [5]:
edades[2] # 2 -> 45

45

In [6]:
edades[5] # 5 -> 54

54

In [7]:
edades[-1] # -1 (5) -> 54

54

In [8]:
edades[-3] # -3 (4° => 3) -> 67

67

Lo índices negativos sirven sobre todo para obtener rápidamente las colas de la lista, es decir, los últimos elementos. Por ejemplo, imagina que ordenamos una lista de edades y queremos saber quiénes son los tres más chicos (índices 0, 1, 2) y los más grandes (índices -3, -2, -1). Con esto los índices negativos nos dan los últimos elementos sin importar el tamaño de la lista, evitando que nosotros tengamos que especificar los índices `N - 1`, `N - 2`, `N - 3`, etc. Así nos ahorramos el cálculo.

In [9]:
# edades[6] # Error: El índices está fuera del rango

#---------------------------------------------------------------------------
#IndexError                                Traceback (most recent call last)
#<ipython-input-7-fb77f3a860f9> in <module>
#----> 1 edades[6] # Error: El índices está fuera del rango

#IndexError: list index out of range

In [10]:
edades_ordenadas = sorted(edades) # edades_ordenadas es una nueva lista con los valores ya ordenados

edades_ordenadas # Debemos ordenar manualmente nuestras listas

[17, 23, 45, 54, 67, 85]

In [11]:
edades # La lista generalmente contiene valores en un orden no específicado

[23, 17, 45, 67, 85, 54]

In [12]:
edades_ordenadas_al_reves = sorted(edades, reverse=True) # Paramétros opcinales

edades_ordenadas_al_reves

[85, 67, 54, 45, 23, 17]

### Sublistas

Sintaxis: `<lista>[<inicial>:<final>] -> <inicial>, <inicial + 1>, ..., <final - 1>`

Alternativa: `<lista>[<inicial>:<final>:<salto>] -> <inicial>, <inicial + salto>, ..., <final - 1>`

Omitir inicial: `<lista>[:<final>] -> 0, 1, ..., <final - 1>`

Omitir final: `<lista>[<inicial>:] -> <inicial>, <inicial + 1>, ..., N - 1`

Omitir ambos: `<lista>[:] -> 0, 1, ..., N - 1`

In [13]:
edades[2:4] # Índices: 2, 3

[45, 67]

In [14]:
edades[1:5] # Índices: 1, 2, 3, 4

[17, 45, 67, 85]

In [15]:
edades[:4] # Índices: 0, 1, 2, 3

[23, 17, 45, 67]

In [16]:
edades[2:] # Índices: 2, 3, 4, ...

[45, 67, 85, 54]

In [17]:
edades[:] # Índices: 0, 1, 2, ... (LISTA COPIA)

[23, 17, 45, 67, 85, 54]

In [18]:
edades_copia = edades[:]

edades_copia.sort() # Ordena la lista actual (¡cuídado!)

edades_copia

[17, 23, 45, 54, 67, 85]

In [19]:
edades[-3:] # Últimos 3 elementos

[67, 85, 54]

In [20]:
edades[:3] # Primeros 3 elementos

[23, 17, 45]

In [21]:
edades[2:-2] # Los elementos quitando los primeros 2 y los últimos 2

[45, 67]

In [22]:
edades_copia

[17, 23, 45, 54, 67, 85]

In [23]:
sum(edades_copia[:2]) / 2 # (23 + 17) / 2

20.0

In [24]:
sum(edades_copia[-2:]) / 2 # (67 + 85) / 2

76.0

In [25]:
sum(edades_copia[2:-2]) / len(edades_copia[2:-2]) # (45 + 54) / 2

49.5

In [26]:
numeros = list(range(1, 21))

numeros

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]

In [27]:
numeros[3:14]

[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]

In [28]:
numeros[3:14:2]

[4, 6, 8, 10, 12, 14]

In [29]:
numeros[3:14:3]

[4, 7, 10, 13]

In [30]:
numeros[13:2:-1]

[14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4]

In [31]:
numeros[13:2:-3]

[14, 11, 8, 5]

In [32]:
edades_copia

[17, 23, 45, 54, 67, 85]

In [33]:
edades_bajas = edades_copia[::2]

edades_bajas

[17, 45, 67]

In [34]:
edades_altas = edades_copia[1::2]

edades_altas

[23, 54, 85]

In [35]:
sum(edades_bajas) / len(edades_bajas)

43.0

In [36]:
sum(edades_altas) / len(edades_altas)

54.0

### Suma de elementos en una lista

In [37]:
pesos = [69, 34, 86, 32, 45, 90]

# suma_pesos = sum(pesos)

s = 0 # Acumulador de la suma de los pesos

for peso in pesos:
    s = s + peso # La suma es igual a la suma retenida (acumulada) más el peso iterado
    
print(s)

356


In [38]:
sum(pesos)

356

In [39]:
# total_pesos = len(pesos)

i = 0 # Acumulador del total de pesos (elementos)

for peso in pesos:
    i = i + 1 # Cuenta uno más cada iteración
    
print(i)

6


In [40]:
for i in range(len(pesos)):
    if i % 2 == 0:
        print(pesos[i])

69
86
45


In [41]:
print("\n".join(map(str, pesos[::2]))) # ??? Enigma

69
86
45


## Las retienen elementos

In [42]:
frutas = ["manzana", "pera", "mango", "piña"]

for fruta in frutas:
    print("La fruta es {}".format(fruta))

La fruta es manzana
La fruta es pera
La fruta es mango
La fruta es piña


In [43]:
frecuencias = [1 + 2j, 3 - 4j, 6 + 3j, 0.5 - 0.5j]

for frecuencia in frecuencias:
    print(frecuencia, type(frecuencia), frecuencia.real, frecuencia.imag, (frecuencia.real ** 2 + frecuencia.imag ** 2) ** 0.5)

(1+2j) <class 'complex'> 1.0 2.0 2.23606797749979
(3-4j) <class 'complex'> 3.0 -4.0 5.0
(6+3j) <class 'complex'> 6.0 3.0 6.708203932499369
(0.5-0.5j) <class 'complex'> 0.5 -0.5 0.7071067811865476


In [44]:
historial_frutas = [
    ["manzana", "pera"],
    ["mango"],
    ["manzana", "mango"],
    ["pera"]
]

for frutas in historial_frutas:
    print(frutas)
    print("manzanas: {}".format(frutas.count("manzana")))
    print("pera: {}".format(frutas.count("pera")))
    print("mango: {}".format(frutas.count("mango")))
    mango_filia = frutas.count("mango") / (frutas.count("manzana") + frutas.count("pera") + 0.0000001)
    print("mango filia: {}".format(mango_filia))
    print("-" * 80)

['manzana', 'pera']
manzanas: 1
pera: 1
mango: 0
mango filia: 0.0
--------------------------------------------------------------------------------
['mango']
manzanas: 0
pera: 0
mango: 1
mango filia: 10000000.0
--------------------------------------------------------------------------------
['manzana', 'mango']
manzanas: 1
pera: 0
mango: 1
mango filia: 0.9999999000000099
--------------------------------------------------------------------------------
['pera']
manzanas: 0
pera: 1
mango: 0
mango filia: 0.0
--------------------------------------------------------------------------------


In [45]:
historial_frutas[2] # Cuál es la lista de frutas del historial en la tercera posición

['manzana', 'mango']

In [46]:
historial_frutas[-1] # Cuál es la lista de frutas del historial en la última posición

['pera']

In [47]:
historial_frutas[-2][0] # Cuál es la primer fruta de la lista en la penúltima posición en el historial

'manzana'

In [48]:
historial_frutas[1][-1] # Cuál es la última fruta de la lista de la segunda posición en el historial

'mango'

## Métodos de alteración de listas (agregar y quitar)

* `append(<elemento>)` - Agrega el `<elemento>` a la última posición
* `insert(<índice>, <elemento>)` - Agrega el `<elemento>` en la posición de `<índice>` y recorre los demás elementos
* `remove(<elemento>)` - Quita el primer `<elemento>` encontrado (¡Error si el elemento no está en la lista!)
* `pop()` - Quita el último elemento
* `pop(<índice>)` - Quita el elemento bajo el `<índice>` y recorre los demás

In [49]:
frutas = []

frutas.append("manzana") # [] -> ["manzana"]
frutas.append("pera") # ["manzana"] -> ["manzana", "pera"]
frutas.append("mango") # ["manzana", "pera"] -> ["manzana", "pera", "mango"]

frutas

['manzana', 'pera', 'mango']

In [50]:
frutas.insert(1, "melón") # ["manzana", "melón", "pera", "mango"]

frutas

['manzana', 'melón', 'pera', 'mango']

In [51]:
frutas.remove("manzana")

frutas

['melón', 'pera', 'mango']

In [52]:
# frutas.remove("manzana") # Error el elemento no existe

#---------------------------------------------------------------------------
#ValueError                                Traceback (most recent call last)
#<ipython-input-80-e986a489ade3> in <module>
#----> 1 frutas.remove("manzana")

#ValueError: list.remove(x): x not in list

In [53]:
ultima_fruta = frutas.pop() # Quita y devuelve

frutas

['melón', 'pera']

In [54]:
primer_fruta = frutas.pop(0) # Quita y devuelve

frutas

['pera']