# Guía de Python para Ingeniería de Datos 🐍
Esta guía busca detallar los temas mas importantes que necesitas aprender de Python para convertirte en un ingeniero de datos.

Es un lenguaje de programación sencillo de aprender, pero lo suficientemente poderoso para manejar tareas complejas: desde limpiar archivos enormes, automatizar procesos repetitivos, hasta construir modelos de machine learning e IA.

**¿Por qué deberías Aprender Python?**
- Acceso mayoritario a oportunidades: Segun algunas encuestas, si el ~74% de las vacantes en ingenieria de datos requiere Python, no saberlo te deja fuera de la mayoría de los puestos disponibles.

- Alta demanda y crecimiento sostenido: La ingeniería de datos es uno de los campos tecnológicos más dinámicos, con empleabilidad en alza y remuneración competitiva, donde Python es clave.

- Relevancia específica en el ecosistema: Si aspiras a trabajar en pipelines, ETL, infraestructuras, Airflow, PySpark, etc., Python es la herramienta número uno.


### Variables
Piensa en una caja con etiqueta donde guardas información. La etiqueta es el nombre de la variable y el contenido puede cambiar (números, texto, etc.). Dicho contenido tiene un tipo que puede ser uno de los siguientes:

- `int` : Enteros e.g. `edad = 30`
- `float` : Decimales e.g. `precio = 19.99 `
- `str` : Cadenas de texto e.g. `nombre = "Alejandro"`
- `bool`: Booleano e.g. `True or False`

In [13]:
# Esto es un comentario y no será ejecutado o procesado por Python
# ayuda a explicar el código y hacerlo más legible

# Creemos variables de diferentes tipos
numero = 5
decimal = 3.14
texto = "Hola, soy un texto"
booleano = True # También puede ser False

# Podemos imprimir el valor de la variable
print("Valor de la variable texto:", texto)

# Podemos averiguar incluso el tipo de dato de la variable
print("Tipo de dato de la variable numero:", type(numero))
print("Tipo de dato de la variable decimal:", type(decimal))


Valor de la variable texto: Hola, soy un texto
Tipo de dato de la variable numero: <class 'int'>
Tipo de dato de la variable decimal: <class 'float'>


### Operaciones
Son acciones que podemos ejecutar con diferentes tipos de datos. Segun el tipo de dato que tengamos podremos ejecutar una acción específica.

In [14]:
# Podemos ejecutar operaciones aritméticas
print( "Suma: ", numero + 3)  # Suma 3 al valor actual de la variable 
print( "Resta: ", numero - 2) # Resta 2 al valor actual de la variable
print( "Multiplicación: ", numero * 4) # Multiplica el valor actual de la variable por 4
print( "División: ", numero / 2) # Divide el valor actual de la variable por 2
print( "Exponente: ", numero ** 2) # Eleva el valor actual de la variable al cuadrado
print( "Módulo: ", numero % 2) # Devuelve el rest o restante de la división del valor actual de la variable entre 3

# Hasta ahora no hemos cambiado el valor de la variable
print("\nValor original de la variable numero:", numero)

# Podemos actualizar el valor de la variable con cualquiera de las operaciones anteriores
numero = numero + 10  # Suma 10 al valor actual de la variable y lo asigna de nuevo a la variable
print("Nuevo valor de la variable numero después de sumar: ", numero)

# También podemos usar una variable nueva para almacenar el resultado de una operación
nuevo_numero = numero * 2  # Multiplica el valor actual de la variable por 2 y lo asigna a una nueva variable
print("Valor de la nueva variable nuevo_numero: ", nuevo_numero)

# Finalmente podemos usar ambas variables en una operación
resultado_final = numero + nuevo_numero  # Suma los valores de ambas variables y lo asigna a una nueva variable
print("Resultado final de la suma de numero y nuevo_numero: ", resultado_final)

# O sobre-escribir la variable original con otro tipo de dato
numero = "Ahora soy un texto"
print("Valor de la variable numero después de cambiar su tipo de dato: ", numero)
print("Tipo de dato de la variable numero después de cambiar su tipo de dato:", type(numero))

Suma:  8
Resta:  3
Multiplicación:  20
División:  2.5
Exponente:  25
Módulo:  1

Valor original de la variable numero: 5
Nuevo valor de la variable numero después de sumar:  15
Valor de la nueva variable nuevo_numero:  30
Resultado final de la suma de numero y nuevo_numero:  45
Valor de la variable numero después de cambiar su tipo de dato:  Ahora soy un texto
Tipo de dato de la variable numero después de cambiar su tipo de dato: <class 'str'>


In [27]:
# Las operaciones con texto nos permiten manipular cadenas de caracteres
texto_1 = "ingeniería de datos"
texto_2 = "Daverse Academy"

print("\nConcatenación de texto:", texto_1 + " en " + texto_2)  # Une dos cadenas de texto

# minúsculas y mayúsculas
print("Texto en minúsculas:", texto_2.lower())  # Convierte el texto a minúsculas
print("Texto en mayúsculas:", texto_2.upper())  # Convierte el texto a mayúsculas

# dividir  y unir textos  
palabras = texto_2.split(" ") # Divide el texto por espacios y devuelve una lista de palabras
print("Dividir texto en palabras:", palabras)  
print("Unir palabras en un texto:", " - ".join(palabras))  # Une una lista de palabras en un texto separadas por " - "

# indexation y slicing
print("\nPrimer carácter del texto:", texto_2[0])  # Primer carácter del texto
print("Desde el segundo carácter hasta el final:", texto_2[1:])  # Desde el segundo carácter hasta el final
print("Primera palabra del texto:", texto_2[:7])  # Primera palabra del texto

# operaciones logicas con cadenas de texto
print("\nEl texto contiene 'Daverse'?", "Daverse" in texto_2)  # Devuelve True si 'Daverse' está en el texto, de lo contrario False
print("El texto contiene 'Academy'?", "Academy" in texto_1)  # Devuelve True si 'Academy' está en el texto, de lo contrario False
print("El text comienza con 'Daverse'?", texto_2.startswith("Daverse"))  # Devuelve True si el texto comienza con 'Daverse', de lo contrario False
print("El text termina con 'Academy'?", texto_1.endswith("Academy"))


Concatenación de texto: ingeniería de datos en Daverse Academy
Texto en minúsculas: daverse academy
Texto en mayúsculas: DAVERSE ACADEMY
Dividir texto en palabras: ['Daverse', 'Academy']
Unir palabras en un texto: Daverse - Academy

Primer carácter del texto: D
Desde el segundo carácter hasta el final: averse Academy
Primera palabra del texto: Daverse

El texto contiene 'Daverse'? True
El texto contiene 'Academy'? False
El text comienza con 'Daverse'? True
El text termina con 'Academy'? False


### Resultados de Operaciones Logicas con Booleanos

| A (bool) | B (bool) | A **and** B | A **or** B |
| -------- | -------- | ----------- | ---------- |
| True     | True     | True        | True       |
| True     | False    | False       | True       |
| False    | True     | False       | True       |
| False    | False    | False       | False      |


In [29]:
# Operaciones logicas con booleanos
a = True
b = False

print("A y B: ", a and b)  # False
print("A o B: ", a or b)   # True
print("Negación: ", not a)  # False
print("Negación: ", not b)  # True


# Operaciones que se transforman en booleanos
print("\n5 es mayor que 3?", 5 > 3)  # True
print("5 es menor que 3?", 5 < 3)  # False
print(texto_2.startswith("Daverse") and 5 > 3)  # True and True -> True


A y B:  False
A o B:  True
Negación:  False
Negación:  True

5 es mayor que 3? True
5 es menor que 3? False
True
