## Programación para Análisis de Datos

### Colecciones en Python

Recapitulación de Algoritmos y Programación:

+ Creación de una lista. Eliminación y adición de elementos: la lista es un arreglo dinámico
+ Nombre (de la variable que hace referencia), tipo  con type(), identidad con id(), y tamaño de un objeto en Python con getsizeof()
+ Cómo listar propiedades de un objeto con dir()
+ Iterables e iteradores
+ Tipos mutables e inmutables
+ Secuencias y mapping
+ Cortes (slices) con el operador : en secuencias como cadenas, listas y tuplas.
+ Manejo de índices en estructuras compuestas como listas de listas
+ Cómo obtener ayuda sobre funciones. Creación de un docstring para módulos y funciones

### Mtra. Gisel Hernández Chávez

In [12]:
# Para visualizar más de una salida de una celda
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [13]:
# Creación de una lista
Lista = list()
Lista

[]

In [14]:
from sys import getsizeof
# El tamaño y el diseño de un objeto son puramente específicos de la implementación.
getsizeof(Lista)

56

In [15]:
# Tipo de una variable
type(Lista)

list

In [16]:
# Creación de una lista de dos elementos
L = [1,2]
getsizeof(L)

72

In [17]:
# Eliminar segundo elemento de la lista
del L[1]

In [18]:
# Visualizar contenido de la lista
L

[1]

In [19]:
# Adicionar al final
L.append(33)

In [20]:
# Conocer el elemento de una posición dada
L[0]

1

In [21]:
# Modificar valor en una posición
L[0] = 44

In [22]:
# Visualizar contenido de la lista
L

[44, 33]

In [23]:
L.insert(1,77)

In [24]:
# Visualizar contenido de la lista
L

[44, 77, 33]

In [25]:
# Operador de corte : (slice)
L[2:4]

[33]

In [26]:
L[1:4]

[77, 33]

In [27]:
L[:]

[44, 77, 33]

In [28]:
L[:4]

[44, 77, 33]

In [29]:
L[1:]

[77, 33]

In [None]:
# Copia superficial de una lista
# Las dos variables hacen referencia al mismo objeto
L2 = L

In [None]:
# Operación relacional de igualdad de objetos
L2 == L

In [None]:
# Comprobar la identidad de ambas listas
id(L2), id(L)

In [None]:
# Conocer todos los atributos y métodos de un objeto
dir(L)

In [None]:
# Concatenar dos listas
L3 =[1,2]
L4 = [3,4]
L3 + L4

In [None]:
# Operación no válida capturada y manipulada en bloque de excepción
try:
    L4 = L3 + 4
except Exception as e:
    print(e)


In [None]:
# Creación de lista vacía
L5 = []

In [None]:
# Modo 1 de ayuda para visualizar docstring de una función
help(print)

In [None]:
# Modo 2 de ayuda para visualizar docstring de una función
print?

In [None]:
# No encuentra la ayuda de este método porque requiere que se le indique de qué clase u objeto es
writelines?

In [None]:
# Modo 1 de abrir archivo usando doble back slash en Windows
with open("C:\\Users\\ghernand\\OneDrive - ITESO\\Documentos\\ProgramacionAnaliticaDatos\\alum_prepa_muestra.csv") as f:
    pass

In [None]:
# Modo 2 de abrir archivo usando r antes de la cadena de caracteres y back slash
with open(r"C:\Users\ghernand\OneDrive - ITESO\Documentos\ProgramacionAnaliticaDatos\alum_prepa_muestra.csv") as f:
    pass

In [None]:
# Modo 3 de abrir archivo usando slash
with open("C:/Users/ghernand/OneDrive - ITESO/Documentos/ProgramacionAnaliticaDatos/alum_prepa_muestra.csv") as f:
    print(type(f))

In [None]:
# Observe que writelines es un método del objeto f
dir(f)

In [None]:
help(f.writelines)

In [None]:
import os
os.getcwd() # Se obtiene ruta de directorio de trabajo actual

In [None]:
# Abre archivo para escritura. Si existe lo sobreescribe
# Se pierde contenido existente
# Al salir del bloque with el archivo se cierra automáticamente
with open("elementos_lista.txt",'w') as f1:  # Escribe en directorio actual
    for i in 'ITESO':
        f1.writelines(i +'\n')
        #f1.writelines(i)

In [None]:
# Abre el archivo para solo lectura
with open("elementos_lista") as f1:
    elemento = f1.readlines()
    print(elemento)

### Cadenas de caracteres y listas

In [None]:
# repetir n veces la cadena con el operador *
list1 = ['text']*2
list1

In [None]:
try:
    list1 = list1 + 'end'
except Exception as e:
    print(e)

In [None]:
list1 = list1 + ['end']
list1

In [None]:
values = [2] * 5 # Repite el número 5 veces en la lista
values

### Tupla

La tupla también es una secuencia, pero a diferencia de la lista es inmutable: no permite modificar un elemento, eliminar uno existente ni adicionar.

In [None]:
# tupla1 es una estructura de datos anidada: es una tupla de cadenas
# doble corche para acceder a un elemento de alguna de las cadenas de list1
tupla1 = list1[0][3], list1[1][1],list1[2][1]
tupla1

## list.append()

+ La función append() de Python inserta __un solo elemento__ en una lista existente. 
+ El elemento se agregará al final de la lista anterior en lugar de devolverse a una lista nueva. 
+ Agrega su argumento como un solo elemento al final de una lista. 
+ La longitud de la lista aumenta en uno.

In [None]:
list1 =[1,2,3]
list1 = list1.append(list1)  # El método devuelve None
print(list1)

In [None]:
#list.append?

In [None]:
list1 =[1,2,3]
print(list1)
list1.append(list1)
print(list1) # note que el nuevo elemento lo muestra con el objeto Ellipsis ...

In [None]:
list1 =[1,2,3]
print(list1)
list1.append(list1)
list1[3][0]

In [None]:
list1[0],list1[1],list1[2],list1[3]

In [None]:
t = 8
getsizeof(t) # en bytes

In [None]:
fa = 3.3
getsizeof(fa)

In [None]:
x=2**1000
len(repr(x))

In [None]:
len(list1)

In [None]:
list1[3][1]

In [None]:
for i in list1:
    print(i)

## list.extend()

Itera sobre su argumento y agrega cada elemento a la lista y extiende la lista. La longitud de la lista aumenta en un número de elementos en su argumento.

In [1]:
list1 =[1,2,3]

list1.extend(list1)
print(list1)

[1, 2, 3, 1, 2, 3]


In [12]:
a = [1, 2, 7, 8]
a[2:2]=[3,4,5,6]
a

[1, 2, 3, 4, 5, 6, 7, 8]

In [8]:
t = ('foo', 'bar', 'baz')
t(1)='qux'
t

SyntaxError: cannot assign to function call (Temp/ipykernel_12940/3078352728.py, line 2)

In [9]:
a, b, c = (1, 2, 3, 4, 5, 6, 7, 8, 9)[1::3]
b

5

## Complejidad de tiempo

+ append tiene una complejidad de tiempo constante, es decir, O (1). 
+ extend tiene una complejidad de O(k). Donde k es la longitud de la lista que debe agregarse.

In [None]:
# Recordar sintaxis del for
iniciales = []
for i in ['Galileo', 'Oliver','Ostwald','Descartes']:
          iniciales.append(i[0])
iniciales

In [None]:
# Alternativa por comprensión

print([i[0] for i in ['Galileo', 'Oliver','Ostwald','Descartes']])

In [None]:
list1 = [40,50,60]
list2 = [10,20,30]
list3 = list1 + list2
print(list3)