<a href="https://colab.research.google.com/github/UEES-IA-Grupo1/UEES-IA-GRUPO1-SEMANA-1/blob/main/01_Fundamentos_NumPy_Pandas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# Verificar GPU
import tensorflow as tf
print("GPU disponible:", tf.config.list_physical_devices('GPU'))

# Instalar librerías adicionales
!pip install seaborn plotly -q

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")


GPU disponible: []
Entorno configurado correctamente en Google Colab


# 01 - Fundamentos de NumPy y Pandas

## 1. Introducción
Breve explicación de qué vas a trabajar en el notebook.

## 2. Fundamentos de NumPy
- Creación de arrays  
- Operaciones básicas  
- Indexación y slicing  

## 3. Fundamentos de Pandas
- Series y DataFrames  
- Carga de datos  
- Filtrado, selección y agrupación  

## 4. Ejercicios prácticos

## 5. Conclusiones


## 2.1 Creación y manipulación de arrays con NumPy


In [7]:
import numpy as np

# Crear un array simple
a = np.array([1, 2, 3, 4, 5])
print("Array a:", a)
print("Tipo:", type(a))
print("Dimensiones (ndim):", a.ndim)
print("Shape (filas, columnas):", a.shape)

# Operaciones básicas
print("\na * 2:", a * 2)
print("a + 10:", a + 10)
print("a ** 2:", a ** 2)

# Matriz 2D
b = np.array([[1, 2, 3],
              [4, 5, 6]])

print("\nMatriz b:\n", b)
print("Dimensiones:", b.ndim)
print("Shape:", b.shape)

# Operaciones en matrices
print("\nSuma por filas:", b.sum(axis=1))
print("Suma por columnas:", b.sum(axis=0))


Array a: [1 2 3 4 5]
Tipo: <class 'numpy.ndarray'>
Dimensiones (ndim): 1
Shape (filas, columnas): (5,)

a * 2: [ 2  4  6  8 10]
a + 10: [11 12 13 14 15]
a ** 2: [ 1  4  9 16 25]

Matriz b:
 [[1 2 3]
 [4 5 6]]
Dimensiones: 2
Shape: (2, 3)

Suma por filas: [ 6 15]
Suma por columnas: [5 7 9]


Este bloque demuestra las operaciones básicas con arrays NumPy:
- Creación de arrays 1D y 2D  
- Inspección de atributos (`ndim`, `shape`)  
- Operaciones matemáticas vectorizadas  
- Sumas por filas y columnas  


## 3.1 Carga y exploración del dataset Iris con Pandas


In [8]:
import seaborn as sns
import pandas as pd

# Cargar dataset Iris desde Seaborn
iris = sns.load_dataset('iris')

# Primeras filas
iris.head()


Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


El dataset **Iris** contiene mediciones de sépalos y pétalos para tres especies de flores.  
Se usa frecuentemente para practicar clasificación y análisis exploratorio.


In [9]:
print("Información general del dataset:\n")
print(iris.info())

print("\nEstadísticas descriptivas:\n")
iris.describe()


Información general del dataset:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   sepal_length  150 non-null    float64
 1   sepal_width   150 non-null    float64
 2   petal_length  150 non-null    float64
 3   petal_width   150 non-null    float64
 4   species       150 non-null    object 
dtypes: float64(4), object(1)
memory usage: 6.0+ KB
None

Estadísticas descriptivas:



Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width
count,150.0,150.0,150.0,150.0
mean,5.843333,3.057333,3.758,1.199333
std,0.828066,0.435866,1.765298,0.762238
min,4.3,2.0,1.0,0.1
25%,5.1,2.8,1.6,0.3
50%,5.8,3.0,4.35,1.3
75%,6.4,3.3,5.1,1.8
max,7.9,4.4,6.9,2.5


La función `info()` permite inspeccionar:
- Tipos de datos  
- Valores nulos  
- Número de filas y columnas  

`describe()` resume medidas estadísticas básicas en columnas numéricas.


In [10]:
# Filtrar solo la especie setosa
setosa = iris[iris['species'] == 'setosa']
setosa.head()


Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


Este ejemplo filtra el DataFrame usando una condición booleana:  
`iris['species'] == 'setosa'`  


In [11]:
# Agrupación por especie
iris_grouped = iris.groupby('species').mean(numeric_only=True)
iris_grouped


Unnamed: 0_level_0,sepal_length,sepal_width,petal_length,petal_width
species,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
setosa,5.006,3.428,1.462,0.246
versicolor,5.936,2.77,4.26,1.326
virginica,6.588,2.974,5.552,2.026


La operación `groupby()` permite agregar datos por categorías.  
Aquí calculamos el promedio de cada variable numérica por especie.
