## ¿Qué es Python para ingeniería de datos?

- Python es un lenguaje de programación de alto nivel y de fácil lectura, lo que lo hace muy popular entre estudiantes y profesionales.

![image.png](attachment:image.png)

## Ventajas

- Es fácil de aprender.
- Gran ecosistema de librerías. Cuenta con herramientas poderosas para tecnologías modernas como Airflow, ETL, APIs REST y Big Data con Spark.
- Cuenta con una gran comunidad.

## Casos de uso

- Extración de datos.
- Limpieza y transformación.
- Carga de datos.
- Orquestación de flujos.
- Procesamiento distribuido.
- Automatización de tareas.

## Instalar el Kernel en Codespaces

Primero seleccionar el Kernel y seguir los demás pasos.

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

![image-3.png](attachment:image-3.png)

![image-4.png](attachment:image-4.png)

![image-5.png](attachment:image-5.png)

## Indentación en Python

- La indentación es el uso de espacios o tabulaciones para agrupar bloques de código. A diferencia de otros lenguajes, en Python no es opcional, sino una regla fundamental de la sintaxis.

- El uso de los dos puntos : al final de una línea (como en def, if, for, etc.) es el indicador de que comienza un nuevo bloque de código y que las líneas siguientes deben estar indentadas.

- Hay identación con 4 espacios lo más recomendable, pero se puede trabajar con 2 espacios.

In [1]:
edad = 15

if edad >= 18:
    print("Eres mayor de edad.")

print("Fin del programa.")

Fin del programa.


## Comentarios

- Sirve para explicar el código de python.

In [2]:
"""
Esto es una cadena de texto.
Si la imprimes, aparecerá en pantalla.
"""

print("¡Hola!")

# Si asignas el texto de comillas triples a una variable...
msm = """
Este es el mensaje de la variable.
"""
print(msm)

¡Hola!

Este es el mensaje de la variable.



## Código Limpio

Escribe tu código como si estuvieras escribiendo para otro ser humano.

1. Nombra tus cosas de forma clara: Si una variable se llama dias_laborales, no necesitas un comentario para explicarlo.

2. Las funciones deben ser pequeñas: Una función debe hacer una sola cosa y hacerla bien. Si hace más de una, divídela.

3. No uses comentarios para explicar el código: Si tu código es claro, no necesita comentarios. Los comentarios solo deben usarse para explicar el "por qué" de una decisión compleja, no el "qué" hace el código.

4. Deja el código más limpio de lo que lo encontraste: Cada vez que toques una parte del código, haz una pequeña mejora.

## Variables

Imagina que una variable es como una caja con una etiqueta.Puedes guardar diferentes tipos de cosas en las cajas, como números enteros, números decimales, texto. Además puedes cambiar el valor ya que no le decimos que tipo de dato es.

In [3]:
a = 5
a = "Hola"
print(a)
print("El tipo de datos es:", type(a))


Hola
El tipo de datos es: <class 'str'>


In [4]:
caja1, caja2, caja3 = "Platano", "Manzana", "Pera"

print(caja2)

Manzana


## Tipos de Datos

### String Data Type

- Es una secuencia de caracteres que se representa en una comilla simple o doble. La cadena es inmutable cada vez que se realiza un cambio se crea una cadena nueva.

In [5]:
frase = "Hola"
frase_nueva = frase.upper()
print(frase)
print(frase_nueva)

Hola
HOLA


### Como funciona los índices en la cádena

![image.png](attachment:image.png)

In [6]:
print(frase[0])
print(frase[0:4])
print(frase[-1])

H
Hola
a


### Numbers Data Type

In [7]:
int_num = 10
float_num = 10.2
complex_num = 3.4j

## Tipos de datos Lista

- Permite trabajar con multiples elementos. Se crea una lista colocando elementos dentro del corchete [1, 2, ..]

In [8]:
lista_entero = [1, 2, 3]
lisa_vacia = []
lista_mixta = [3, "hola", 44.4]
lista_anidad = [[1,2,3], [1,2,3]]

print(lista_anidad)

type(lista_anidad)

[[1, 2, 3], [1, 2, 3]]


list

### Acceder a los elementos de una lista

- Cabe señalar que la listas comienzan desde el índice 0.

![image.png](attachment:image.png)

In [9]:
list = ["Hola", [1, 2, 3]]

print(list[0])
print(list[1][2])

Hola
3


### Correción de valores en una lista

In [10]:
list = [1, 2, 3]
list[1:3] = [4, 2]
print(list)

[1, 4, 2]


### Agregar Elementos a una lista

- ```append```: Permite agregar elemento por elemento.
- ```extend```: Paso una lista y va a agregando cada elemento. 

In [11]:
list = [1, 2, 3]
list.append(7)
list.append([1, 2])
list.extend([9, 2])
print(list)

[1, 2, 3, 7, [1, 2], 9, 2]


### Iteración de una lista


In [12]:
list = []
for fruit in ["Pera", "Manzana"]:
    list.append(fruit)

print(list)

['Pera', 'Manzana']


## Tuplas

- Una tupla es similar a una lista, la diferencia entre los dos es que no podemos cambiar los elementos de una tupla una vez asignada, en cambio en una lista si se puede realizar.

In [13]:
tuples = (1, [2, 3], 3)
string = ("Hola")
print(string)
print(type(string))

tuple = ("Hola",)
print(tuple)
print(type(tuple))

print("primer elemento: ", tuples[0])

Hola
<class 'str'>
('Hola',)
<class 'tuple'>
primer elemento:  1


## Diccionario en Python

- Es una colección desordenada de elementos, cada uno tiene un ```clave:valor```.
- Se crear utilizando llaves {} y separados por coma, es como JSON.

![image.png](attachment:image.png)

### Formas de crear un diccionario

In [14]:
dict1 = {
    'name': 'Miguel',
    'apellido': 'Mallqui'
}
print(dict1)
print(type(dict1))

{'name': 'Miguel', 'apellido': 'Mallqui'}
<class 'dict'>


In [15]:
dict2 = dict(
    {
        "name": "Juan",
        2: [1, 2]
    }
)
print(dict2)

{'name': 'Juan', 2: [1, 2]}


### Acceder al valor

In [2]:
my_dict = {'name': 'miguel'}
print(my_dict['name'])

miguel


- El método .get() te permite especificar un valor por defecto. Si la clave no existe, no se lanza un error; en su lugar, se devuelve el valor que definiste. En cambio utilizar sin get si devuelve un error.

In [15]:
print(my_dict.get('juan', 'No existe'))

No existe


In [14]:
# Obtener ayuda en la documentación de Python, como funciona algún método
help(my_dict.get)

Help on built-in function get:

get(key, default=None, /) method of builtins.dict instance
    Return the value for key if key is in the dictionary, else default.



### Agregar elementos a un diccionario

In [17]:
my_dict['last_name'] = 'Sanchez'
print(my_dict)

{'name': 'Juanito', 'last_name': 'Sanchez'}


### Interando con diccionario

In [27]:
my_dict = {'name': 'Juan', 'age': 50}

print(my_dict.items())
print(type(my_dict.items()))

for key, value in my_dict.items():
	print(f'La clave es {key} y el valor es {value}')

dict_items([('name', 'Juan'), ('age', 50)])
<class 'dict_items'>
La clave es name y el valor es Juan
La clave es age y el valor es 50


## Control de flujo

### IF

- Es una estructura de control que te permite tomar decisiones en tu código. Imagina que es como una pregunta de "sí o no". Si la condición que pones es verdadera (True), el código que está dentro del if se ejecuta. Si la condición es falsa (False), el código se salta.

In [28]:
num = 10

if num > 9:
    print(f'{num} es mayor')


10 es mayor


### For

-  Es una estructura de control que se usa para repetir un bloque de código un número determinado de veces.

Cuando utilizarlo:

- Cuando ya sabes cuantas veces quiere repetir algo.

In [29]:
numbers = [1, 2, 3, 4, 5]

for number in numbers:
	print(number)

1
2
3
4
5


### While

- Es una estructura de control que te permite ejecutar un bloque de código de forma repetida mientras una condición sea verdadera.
- Tenemos ```break``` para salir de un bucle.
- Tenemos ```continue``` rompe el bucle y vuelver a iniciar.
- Tenemos ```pass``` se utiliza para cuando definimos funciones que no se va a  implementar ahora y no nos de un error.

In [34]:
n = 10
sum = 0
i = 1

while i <= n:
	print(i)
	sum += i
	i += 1

print(f'La suma es: {sum}')

1
2
3
4
5
6
7
8
9
10
La suma es: 55


In [37]:
numbers = [1, 2, 3, 4, 5]
for n in numbers:
	if n == 4:
		print(f"Econtre el 4 en la posición {numbers.index(n)}")
		break

print("Fin del bucle")

Econtre el 4 en la posición 3
Fin del bucle


In [43]:
numbers = [1, -2, -3, -4, 5]
for n in numbers:
	if n < 0:
		continue
	print(f"{n}")	


1
5


In [44]:
def funcion_ejemplo():
	pass

funcion_ejemplo()

## Funciones

- Las funciones son bloques de código reutilizables. Imagínalas como una receta a la que le das un nombre. Cuando quieres preparar esa receta, solo tienes que "llamar" a su nombre en lugar de escribir todos los pasos una y otra vez.

In [45]:
def calcular_area_rectangulo(base, altura):
    area = base * altura
    return area

area1 = calcular_area_rectangulo(5, 10)
area2 = calcular_area_rectangulo(8, 4)
print(f"Área del rectángulo 1: {area1}")
print(f"Área del rectángulo 2: {area2}")

Área del rectángulo 1: 50
Área del rectángulo 2: 32


## La función lambda

- Se utiliza para crear funciones anónimas de una sola línea que son ideales para tareas pequeñas y puntuales

In [51]:
nombres = ["Juan", "Pedro", "Ana"]
obtener_nombres = lambda: nombres

dict = {
	"nombres": obtener_nombres()
}

print(dict)


{'nombres': ['Juan', 'Pedro', 'Ana']}


## Operadores de naturaleza númerica

In [52]:
t = 7
w = 31
y = 8.8
u = 0
c = 1+1j

sigma = (t+ 0.5*y)*(12.8/(y+w))
sigma

3.6663316582914582

In [53]:
# Operardor de exponenciación: **

#Algoritmo de Euclides: D(Dividiendo) = d(divisor) * q (Cociente) + r (residuo)

# Cociente de 2 números enteros: q = D//d
# Residuo de la división r = D % d

tau = (sigma ** 2.7) / (2025//7) ** (2025 % 30)
tau

4.073409582447874e-36

##  El modelulo matematico

Vamos a aprender como acceder a las funciones (caracteristicas) que provee de manera muy natural y sencilla el modulo math de python.

In [56]:
import math as m # importar el modulo

In [None]:
help(m) # Acceder a la documentación utilizando ese alias

In [57]:
m.pi # El modulo contienen una constante pi

3.141592653589793

In [58]:
import random as rnd # Aprendamos a utilizar el modulo random

In [59]:
dir(rnd)

['BPF',
 'LOG4',
 'NV_MAGICCONST',
 'RECIP_BPF',
 'Random',
 'SG_MAGICCONST',
 'SystemRandom',
 'TWOPI',
 '_ONE',
 '_Sequence',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_accumulate',
 '_acos',
 '_bisect',
 '_ceil',
 '_cos',
 '_e',
 '_exp',
 '_fabs',
 '_floor',
 '_index',
 '_inst',
 '_isfinite',
 '_lgamma',
 '_log',
 '_log2',
 '_os',
 '_pi',
 '_random',
 '_repeat',
 '_sha512',
 '_sin',
 '_sqrt',
 '_test',
 '_test_generator',
 '_urandom',
 '_warn',
 'betavariate',
 'binomialvariate',
 'choice',
 'choices',
 'expovariate',
 'gammavariate',
 'gauss',
 'getrandbits',
 'getstate',
 'lognormvariate',
 'normalvariate',
 'paretovariate',
 'randbytes',
 'randint',
 'random',
 'randrange',
 'sample',
 'seed',
 'setstate',
 'shuffle',
 'triangular',
 'uniform',
 'vonmisesvariate',
 'weibullvariate']

In [60]:
help(rnd.randint)

Help on method randint in module random:

randint(a, b) method of random.Random instance
    Return random integer in range [a, b], including both end points.



In [62]:
f = rnd.randint(0,20)
f

18

In [63]:
help(rnd.random)

Help on built-in function random:

random() method of random.Random instance
    random() -> x in the interval [0, 1).



In [64]:
h = rnd.random()
h

0.8860691784669728