<a href="https://colab.research.google.com/github/isra-bWk4/upsrj-machine-learning/blob/main/python_basics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Configuración del entorno de trabajo

En este bloque inicial preparamos las librerías esenciales que utilizaremos a lo largo del proyecto:

- **NumPy (numpy)**
- **Time (time)**
- **Pandas (pandas)**
Estas herramientas nos permitirán realizar experimentos, medir eficiencia y organizar resultados de manera clara y estructurada.

In [40]:
import numpy as np
import time
import pandas as pd

# Medición de tiempos en bucles grandes

En este bloque creamos una lista con **100 millones de elementos** y hacemos un ciclo for que acumula su valor dos veces por iteración.  
El objetivo es **medir el tiempo de ejecución** y observar cómo afecta el tamaño de los datos y la forma en que se realizan las operaciones dentro del bucle.


In [41]:
datos = list(range(100_000_000))

inicio = time.perf_counter()

suma = 0
for i in datos:
  suma += i
  suma += i
  pass

final = time.perf_counter()

tiempo = final - inicio

print(f"Tiempo de ejecución: {tiempo:.6f} sec")


Tiempo de ejecución: 20.632385 sec


# Suma con NumPy en arreglos grandes

En este bloque utilizamos **NumPy** para generar un arreglo con mil millones de números enteros y calcular su suma.  
El objetivo es comparar el rendimiento frente a bucles en Python puro y observar cómo las operaciones vectorizadas de NumPy son mucho más rápidas.

In [19]:
np_lista = np.arange(1_000_000_000)

inicio = time.perf_counter()

suma_np = np.sum(np_lista)

final = time.perf_counter()

tiempo = final - inicio

print(f"Tiempo de ejecución: {tiempo:.6f} sec")

Tiempo de ejecución: 0.983159 sec


# Consulta en base de datos simulada

En este bloque trabajamos con una **base de datos representada como lista de listas**.  
Cada fila corresponde a una persona y cada columna a un atributo (Nombre, Edad, Animal).  
Para facilitar el acceso, definimos dos diccionarios:

- **columnas**  
- **filas**
De esta forma podemos consultar rápidamente cualquier dato combinando ambos diccionarios.
En el ejemplo, buscamos el **animal favorito de Kevin**.

In [42]:
base_de_datos = [
    ["Oscar", 21, "Gatos"],
    ["Paula", 21, "Tiburones"],
    ["Jonatan", 24, "Hurones"],
    ["Kevin", 22, "Periquitos"],
    ["Lucero", 21, "Perros"],
    ["Israel", 21, "Lobos"],
    ["Sergio", 21, "Perros"],
    ["Yahir", 21, "Leones"],
    ["Diego", 21, "Pinguinos"],

]

columnas = {"Nombre":0, "Edad":1, "Animal":2}
filas = {"Oscar":0, "Paula":1, "Jonatan":2, "Kevin":3, "Lucero":4, "Israel":5, "Sergio":6, "Yahir":7, "Diego":8}

print(base_de_datos[filas["Kevin"]][columnas["Animal"]])

Periquitos


# Consultas con Pandas DataFrame

En este bloque convertimos nuestra base de datos en un **DataFrame de Pandas**.  
Esto nos permite realizar consultas más claras y potentes, accediendo directamente por nombre de columna.  
Ejemplo: buscar el **animal favorito de Kevin**.

In [37]:
df = pd.DataFrame(base_de_datos, columns=["Nombre", "Edad", "Animal"], index =range(1,10))
print(df.Animal[df["Nombre"] == "Kevin"])




4    Periquitos
Name: Animal, dtype: object
