## Estructuras de datos: Cadenas(String), sets(Conjuntos), list(Listas), tuples(Tuplas) y dicts(Diccionarios).

### Métodos aplicables a cadenas
- Creación: Se utilizan comillas simples o comillas dobles.
- Secuencias de escape: `Primera linea \n Segunda linea, \t Introduce un tab`.
- Convertir datos en cadenas: `str(0.5)`.
- Concatenar cadenas: `cadena1 + cadena2`.
- Multiplicar cadenas: `cadena * numero_repeticiones`.
- Recuperar un elemento de una cadena: `cadena[indice_posicion]` (comienza en 0).
- Rebanar (slicing) una porción de una cadena: `cadena[pi:pf:paso]`.
- Encuentra el índice donde empieza una subcadena de la cadena: `cadena.find(subcadena)`.
- Remplaza una cadena con otra cadena: `cadena.replace(cadena1, cadena2)`.
- Prueba de pertenencia: `cadena in otraCadena`.
- Métodos varios: `capitalize(), lower(), count(), strip(), zfill(), join(), split()`.

### Métodos aplicables a conjuntos
No tienen orden, no puede acceder a sus elementos por indice posicional.
- Creación: `conjunto = {1, 2, 3}, conjuntoVacio = set()`.
- Unión: `A | B`.
- Intersección: `A & B`.
- Diferencia: `A - B`.
- Prueba de pertenencia: `elemento en conjunto`.
- Añadir un elemento: `conjunto.add(nuevoElemento)`.
- Eliminar un elemento de un conjunto: `conjunto.remove(elemento)`.
- Eliminar todos los elementos de un conjunto: `conjunto.creal()`.
- Tamaño (cardinalidad) de un conjunto: `len(conjunto)`.
- Copia de un conjunto: `otroConjunto = conjunto.copy()`

### Métodos aplicables a tuplas - INMUTABLES
- Creación de una tupla: `tupla = (1, 2, 3, 4), tupla = 1, 2, 3, 4, tupla = ()`.
- Tupla con un solo elemento: `tupla = (elemento, )`.
- Recuperar un elemento de una tupla: `tupla[indice_posicion]`. (comienza en 0)
- Recuperar (slicing) una porción de una tupla:
`tupla[pi(cerrado):pf(abierto):paso]`.
- Longitud de una tupla: `len(tupla)`.
- Prueba de pretenencia: `elemento in tupla`.

### Métodos aplicables a listas - MUTABLES
El orden importa, se puede acceder a los elementos por índice posicional.
Admite elementos repetidos, admite distintos tipos de datos
- Creación: `lista = [1, 2, 3, 4], listaVacia = []`.
- Añadir un elemento al final de una lista: `lista.append(item)`.
- Añadir una lista al final de otra lista: `lista.extend(otraLista)`.
- Recuperar un elemento de una lista: `lista[indice_posicion]`. (comienza en 0)
- Recuperar (slicing) una porción de una cadena: `lista[pi:pf:paso]`.
- Eliminar un elemento en función de su valor: `lista.remove(valor)` (esto elimina al primer elemento que se encuentre de izquierda a derecha igual `valor`).
- Eliminar un elemento en función de su índice posicional: `del.lista[indice_posicion]` (también se puede aplicar con porciones de una lista).
- Muestra el índice del primer elemento de izquierda a derecha que tenga un determinado valor: `lista.index(valor)`.
- Cuenta el número de veces que aparece un valor determinado en una lista: `lista.count(valor)`.
- Ordena los elementos de una lista: `lista.sort()`. (ascendente), `lista.sort(reverse = TRUE)`
- Invierte los elementos de una lista: `lista.reverse(), lista[::-1] (me permite reversar porciones de una lista, lista[pf(cerrado):pi(abierto):-1])`
- Copia de una lista: `otroLista = lista.copy()` SÚPER IMPORTANTE.
- Longitud de una lista: `len(lista)`.
- Prueba de pertenencia: `elemento de lista`.
- Lisa de tuplas de parejas índice - elemento: `list(enumerate(lista))`.
- Métodos varios: `zip()`

### Métodos aplicables a diccionarios - MUTABLE
- Creación: `diccionario = {clave: valor, otraClave: otroValor}`.
- Recuperar un 'valor' de un diccionario: `diccionario[]`.
- Borrar un elemento en función de la clave: `del diccionario[clave], diccionario.pop(clave)`
- Lista todas las claves del diccionario: `list(diccionario)`.
- Prueba de pertenencia: `clave in diccionario`.
- Actualizar/crear una pareja clave - valor: `diccionario[clave] = valor`.
- Eliminar todos los elementos de un diccionario: `diccionario.clear()`.
- Copiar un diccionario: `diccionario.copy()`.
- Longitud de diccionario: `len(diccionario)`.
- Métodos varios: `items(), keys(), value(), popitem()(elimina la última pareja clave:valor del diccionario), update()`.


In [4]:
lista = [] #Así se declara una lista vacía
lista = ['a', 'b', 'c']
##Iguala la lista y siguen siendo iguales por siempre
otraLista = lista
otraLista.append('otro')
print(lista, id(lista))
print(otraLista, id(otraLista))

['a', 'b', 'c', 'otro'] 140155286301376
['a', 'b', 'c', 'otro'] 140155286301376


In [7]:
lista = []
for i in range(10):
    lista.append(i)

lista

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [16]:
##capitalize() Mayúscula a la primera letra

lista = ['jose', 'alfredo', 'rojas', 'mendez']
otraLista = []
for i in lista:
    otraLista.append(i.capitalize())
otraLista

['Jose', 'Alfredo', 'Rojas', 'Mendez']

In [17]:
##lower() Todo a minúsculas

lista = ['JOSE', 'ALFREDO', 'ROJAS', 'MENDEZ']
otraLista = []
for i in lista:
    otraLista.append(i.lower())
otraLista

['jose', 'alfredo', 'rojas', 'mendez']

In [29]:
##strip() Elimina los espacios en blanco

lista = ['  Jose ', '   Alfredo    ', '   Rojas   ', '   Mendez   ']
otraLista = []
for i in lista:
    otraLista.append(i.strip())
otraLista

lista = ['--Jose--', '--Alfredo---', '--Rojas---', '---Mendez--']
otraLista = []
for i in lista:
    otraLista.append(i.strip('-'))
otraLista

['Jose', 'Alfredo', 'Rojas', 'Mendez']

In [32]:
##replace

lista = ['-  -J ___os e- -',
         '- -..A lf.red o---',
         '-.-  R oj.as -- -',
         '-..-  - M-endez--']
otraLista = []
for i in lista:
    otraLista.append(i.replace(" ", "").replace("-","").replace("_","").replace(".",""))
otraLista

['Jose', 'Alfredo', 'Rojas', 'Mendez']

In [40]:
texto = "Si estás progresando en el curso de latín desde cero, ¡estás en el lugar correcto para seguir practicando! A lo largo del curso tienes prácticas de análisis y traducción graduadas y adaptadas a los contenidos teóricos, pero nunca está de más seguir practicando el análisis, la traducción, la lectura… Poco a poco iré publicando vídeos, más o menos detallados, de análisis y traducción de textos latinos fáciles u originales. También iremos haciendo lo mismo con textos para trabajar la lectura directa. Solo si estás bastante avanzado deberías ir a las obras completas sin adaptar."
texto = texto.replace("á", "a").replace("é", "e").replace("í", "i").replace("ó", "o").replace("ú", "u").replace(",","").replace(".", "")
texto

'Si estas progresando en el curso de latin desde cero ¡estas en el lugar correcto para seguir practicando! A lo largo del curso tienes practicas de analisis y traduccion graduadas y adaptadas a los contenidos teoricos pero nunca esta de mas seguir practicando el analisis la traduccion la lectura… Poco a poco ire publicando videos mas o menos detallados de analisis y traduccion de textos latinos faciles u originales Tambien iremos haciendo lo mismo con textos para trabajar la lectura directa Solo si estas bastante avanzado deberias ir a las obras completas sin adaptar'

In [41]:
import kagglehub
from kagglehub import KaggleDatasetAdapter

file_path = "Data_sucia.csv"

# Cargar data y almacenar en df
df = kagglehub.load_dataset(KaggleDatasetAdapter.PANDAS, "williamrrubio/dada-siniestros-bogot-2021", file_path)
df.info()

  df = kagglehub.load_dataset(KaggleDatasetAdapter.PANDAS, "williamrrubio/dada-siniestros-bogot-2021", file_path)


Downloading from https://www.kaggle.com/api/v1/datasets/download/williamrrubio/dada-siniestros-bogot-2021?dataset_version_number=1&file_name=Data_sucia.csv...


100%|██████████| 165M/165M [00:03<00:00, 47.5MB/s]


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1001821 entries, 0 to 1001820
Data columns (total 14 columns):
 #   Column          Non-Null Count    Dtype 
---  ------          --------------    ----- 
 0   Fecha           1001821 non-null  object
 1   Hora            1001821 non-null  object
 2   Gravedad        1001821 non-null  object
 3   Clase           1001821 non-null  object
 4   Choque          923659 non-null   object
 5   Localidad       1001821 non-null  object
 6   Diseno_lugar    1001821 non-null  object
 7   Estado          1001821 non-null  object
 8   Condicion       1001821 non-null  object
 9   Servicio        954977 non-null   object
 10  Modalidad       384405 non-null   object
 11  Clase_vehiculo  992340 non-null   object
 12  Servicio.1      954977 non-null   object
 13  Causa           1001821 non-null  object
dtypes: object(14)
memory usage: 107.0+ MB


In [42]:
df.head()

Unnamed: 0,Fecha,Hora,Gravedad,Clase,Choque,Localidad,Diseno_lugar,Estado,Condicion,Servicio,Modalidad,Clase_vehiculo,Servicio.1,Causa
0,2015-07-20,08:00:00,Solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros - Masivo,Bus,Publico,No respetar prelacion (conductor en general)
1,2015-07-20,08:00:00,Solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
2,2015-07-20,08:00:00,Solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros - Masivo,Bus,Publico,No respetar prelacion (conductor en general)
3,2015-07-20,08:00:00,Solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
4,2015-07-21,08:15:00,Solo danos,Choque,Vehiculo,Engativa,Tramo de via,Ileso,Conductor,Publico,Pasajeros - Individual,Automovil,Publico,No mantener distancia de seguridad (conductor ...


In [47]:
df['Gravedad'] = df['Gravedad'].str.lower()
df['Clase'] = df['Clase'].str.lower()
df.head()

Unnamed: 0,Fecha,Hora,Gravedad,Clase,Choque,Localidad,Diseno_lugar,Estado,Condicion,Servicio,Modalidad,Clase_vehiculo,Servicio.1,Causa
0,2015-07-20,08:00:00,solo danos,choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros Masivo,Bus,Publico,No respetar prelacion (conductor en general)
1,2015-07-20,08:00:00,solo danos,choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
2,2015-07-20,08:00:00,solo danos,choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros Masivo,Bus,Publico,No respetar prelacion (conductor en general)
3,2015-07-20,08:00:00,solo danos,choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
4,2015-07-21,08:15:00,solo danos,choque,Vehiculo,Engativa,Tramo de via,Ileso,Conductor,Publico,Pasajeros Individual,Automovil,Publico,No mantener distancia de seguridad (conductor ...


In [46]:
df['Modalidad'] = df['Modalidad'].str.replace("-","")
df.head()

Unnamed: 0,Fecha,Hora,Gravedad,Clase,Choque,Localidad,Diseno_lugar,Estado,Condicion,Servicio,Modalidad,Clase_vehiculo,Servicio.1,Causa
0,2015-07-20,08:00:00,solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros Masivo,Bus,Publico,No respetar prelacion (conductor en general)
1,2015-07-20,08:00:00,solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
2,2015-07-20,08:00:00,solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Publico,Pasajeros Masivo,Bus,Publico,No respetar prelacion (conductor en general)
3,2015-07-20,08:00:00,solo danos,Choque,Vehiculo,Suba,Tramo de via,Ileso,Conductor,Particular,,Automovil,Particular,No respetar prelacion (conductor en general)
4,2015-07-21,08:15:00,solo danos,Choque,Vehiculo,Engativa,Tramo de via,Ileso,Conductor,Publico,Pasajeros Individual,Automovil,Publico,No mantener distancia de seguridad (conductor ...


In [22]:
##count Cuenta la cantidad de elementos en la lista

lista = ['Jose', 'Alfredo', 'Rojas', 'Mendez']
otraLista = []
for i in lista:
    otraLista.append(i.count('s'))
otraLista

[1, 0, 1, 0]

In [5]:
lista = ['a', 'b', 'c']
##Copia la lista y se modifica únicamente la nueva lista
otraLista = lista.copy()
otraLista.append('otro')
print(lista, id(lista))
print(otraLista, id(otraLista))

['a', 'b', 'c'] 140154802153984
['a', 'b', 'c', 'otro'] 140154802151040


In [50]:
#zfill() Rellena cadena de la longitud que necesito

numero = "4A"
numeroRelleno = numero.zfill(5)
numeroRelleno

'0004A'

In [56]:
##Join une elementos de una lista y convierte a cadena de texto

palabras = ["Jose", "Alfredo", "Rojas", "Mendez"]
frase = " ".join(palabras)
frase

'Jose Alfredo Rojas Mendez'

In [64]:
##split()

frase = "Jose Alfredo Rojas Mendez"
palabras = frase.split()
palabras

['Jose', 'Alfredo', 'Rojas', 'Mendez']

In [75]:
texto = "Si estás progresando en el curso de latín desde cero, ¡estás en el lugar correcto para seguir practicando! A lo largo del curso tienes prácticas de análisis y traducción graduadas y adaptadas a los contenidos teóricos, pero nunca está de más seguir practicando el análisis, la traducción, la lectura… Poco a poco iré publicando vídeos, más o menos detallados, de análisis y traducción de textos latinos fáciles u originales. También iremos haciendo lo mismo con textos para trabajar la lectura directa. Solo si estás bastante avanzado deberías ir a las obras completas sin adaptar."
buscar = "en"
palabras = texto.split() ##Separo mi texto mediante el espacio, convierte todo en un lista
cuenta = 0 ##Variable donde va a almacenar la cantidad de palabras encontradas
for i in palabras:
    if i == buscar: ##Si la palabra buscada es igual a cada palabra de la lista
        cuenta += 1 ##Suma 1 al encontrar la palabra
print(f"En el texto hay {cuenta} palabras {buscar}") ##Muestra cuántas palabras encontró

En el texto hay 1 palabras Si


In [86]:
texto = "Si estás progresando en el curso de latín desde cero, ¡estás en el lugar correcto para seguir practicando! A lo largo del curso tienes prácticas de análisis y traducción graduadas y adaptadas a los contenidos teóricos, pero nunca está de más seguir practicando el análisis, la traducción, la lectura… Poco a poco iré publicando vídeos, más o menos detallados, de análisis y traducción de textos latinos fáciles u originales. También iremos haciendo lo mismo con textos para trabajar la lectura directa. Solo si estás bastante avanzado deberías ir a las obras completas sin adaptar."
buscar = "a"
palabras = texto.split()
print(palabras.count(buscar)) ##Cuenta "en" como palabra
print(texto.count(buscar)) ##Cuenta "en" en cada segmento del texto

3
58


In [93]:
x = 5
y = x
y += 1
print(x)
print(y)

5
6


In [111]:
## Ejemplo de unión de números y letras
y = []
x = [5, 'z', '6', 6]
for i in x:
    if isinstance(i, int):
        y.append(str(i))
    else:
        y.append(i)
y = "".join(y)

y

'5z66'

In [None]:
a = 3
b = 3

In [None]:
id(a)

3101937658224

In [None]:
id(b)

3101937658224

In [None]:
lista = 'a', 'b', 'c'
otraLista = lista
otraLista = lista + ('otro',)
print(lista, id(lista))
print(otraLista, id(otraLista))

('a', 'b', 'c') 139425364315648
('a', 'b', 'c', 'otro') 139425365304928


In [112]:
# lista de comprehension
## Eleva al cuadrado todos los números de la lista "numeros"
numeros = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
pares = [x ** 2 for x in numeros]
pares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [113]:
## Compara cada valor de la lista "numeros" y muestra solo los que son pares
numeros = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
pares = [n for n in numeros if n%2 == 0]
pares

[0, 2, 4, 6, 8]

In [None]:
numeros = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
pares = ['par' if n%2 == 0 else 'impar' for n in numeros]
pares

In [None]:
# ejercicio
numeros

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
# lista de comprehension
dicc = {'Carlos' : 30, 'Stefa' : 26, 'Camila' : 28, 'Mona' : 27}
geriatrico = {nombre : edad for nombre, edad in dicc.items() if edad >= 27}
geriatrico


{'Carlos': 30, 'Camila': 28, 'Mona': 27}

### Directorio

In [120]:
aleja = {'viajar', 'leer', 'cine', 'python'}
oswal = {'videojuegos', 'leer', 'python', 'deportes'}
dania = {'puzzles', 'viajar', 'python', 'R'}
danni = {'python', 'fotografía', 'cocina', 'viajar'}

In [115]:
aleja & oswal ## intersección

{'leer', 'python'}

In [116]:
aleja | oswal ## unión (+)

{'cine', 'deportes', 'leer', 'python', 'viajar', 'videojuegos'}

In [117]:
danni - dania ## diferencia, qué tiene danni que no tiene dania

{'cocina', 'fotografía'}

In [118]:
dania - danni ## diferencia, qué tiene dania que no tiene danni

{'R', 'puzzles'}

In [121]:
dania ^ danni ## que hay en ambos sacando los comúnes

{'R', 'cocina', 'fotografía', 'puzzles'}

In [123]:
## teléfonos
aleja_tel = ['300 123 4567', '601 555 0001']
oswal_tel = ['301 123 4567', '601 555 0002']
dania_tel = ['302 123 4567', '601 555 0003']
danni_tel = ['303 123 4567', '601 555 0004']

## email
aleja_correo = ['aleja@uncentral.edu.co', 'aleja@yopmail.com']
oswal_correo = ['owsal@uncentral.edu.co', 'oswal@yopmail.com']
dania_correo = ['dania@uncentral.edu.co', 'dania@yopmail.com']
danni_correo = ['danni@uncentral.edu.co', 'danni@yopmail.com']

In [125]:
alejandra = [aleja_tel, aleja_correo, aleja]
oswaldo = [oswal_tel, oswal_correo, oswal]
daniana = [dania_tel, dania_correo, dania]
danniel = [danni_tel, danni_correo, danni]

In [126]:
directorio = [alejandra, oswaldo, daniana, danniel]
directorio

[[['300 123 4567', '601 555 0001'],
  ['aleja@uncentral.edu.co', 'aleja@yopmail.com'],
  {'cine', 'leer', 'python', 'viajar'}],
 [['301 123 4567', '601 555 0002'],
  ['owsal@uncentral.edu.co', 'oswal@yopmail.com'],
  {'deportes', 'leer', 'python', 'videojuegos'}],
 [['302 123 4567', '601 555 0003'],
  ['dania@uncentral.edu.co', 'dania@yopmail.com'],
  {'R', 'puzzles', 'python', 'viajar'}],
 [['303 123 4567', '601 555 0004'],
  ['danni@uncentral.edu.co', 'danni@yopmail.com'],
  {'cocina', 'fotografía', 'python', 'viajar'}]]

In [127]:
directorio[0]

[['300 123 4567', '601 555 0001'],
 ['aleja@uncentral.edu.co', 'aleja@yopmail.com'],
 {'cine', 'leer', 'python', 'viajar'}]

In [130]:
directorio[0][0]

['300 123 4567', '601 555 0001']

In [137]:
directorio[1][1][0]

'owsal@uncentral.edu.co'

In [None]:
directorio[1][1][1]

'oswal@yopmail.com'

In [141]:
directorio[0][2]

{'cine', 'leer', 'python', 'viajar'}

In [147]:
directorio[0][2].add('carros')

In [148]:
directorio[0][2]

{'carros', 'cine', 'leer', 'python', 'viajar'}

In [157]:
directorio[0][2].remove('carros')

In [159]:
directorio[0][2].remove('python')

In [160]:
directorio[0][2]

{'cine', 'leer', 'viajar'}

In [161]:
directorio[0][2].add('python')

In [162]:
directorio[0][2]

{'cine', 'leer', 'python', 'viajar'}