In [1]:
#==============================
#CONFIGURACIÓN INICIAL
#==============================
# Verificar si estamos en Google Colab
try:
    import google.colab
    IN_COLAB = True
    print(" Ejecutándose en Google Colab")
except ImportError:
    IN_COLAB = False
    print(" No está en Google Colab")

# Importaciones necesarias
import sys
print("Versión de Python:", sys.version)

import tensorflow as tf
print("GPU disponible:", tf.config.list_physical_devices('GPU'))

# Instalar librerías adicionales si es necesario
!pip install seaborn plotly

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")


 Ejecutándose en Google Colab
Versión de Python: 3.12.12 (main, Oct 10 2025, 08:52:57) [GCC 11.4.0]
GPU disponible: []
Entorno configurado correctamente en Google Colab


# **Notebook 1: Fundamentos de NumPy y Pandas**

*   Ejercicios de manipulación de arrays con Numpy
*   Análisis de datos con Pandas Usando Datasets de ejemplo
*   Documentar cada celda con markdown explicativo

**DATASET EMPLEADA:** *Titanic: Análisis de Supervivencia*

In [44]:
#==============================================
#CARGA DE DATOS EN COLAB
#==============================================
#Cargar Dataset Titanic
titanic = sns.load_dataset('titanic')

print("Información del Dataset:")
print(f"Dimensión del Dataset: {titanic.shape}")
print(f"Detalle Columnas: {list(titanic.columns)}")
print("\nPrimeras 10 filas:")
titanic.head(10)

Información del Dataset:
Dimensión del Dataset: (891, 15)
Detalle Columnas: ['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town', 'alive', 'alone']

Primeras 10 filas:


Unnamed: 0,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone
0,0,3,male,22.0,1,0,7.25,S,Third,man,True,,Southampton,no,False
1,1,1,female,38.0,1,0,71.2833,C,First,woman,False,C,Cherbourg,yes,False
2,1,3,female,26.0,0,0,7.925,S,Third,woman,False,,Southampton,yes,True
3,1,1,female,35.0,1,0,53.1,S,First,woman,False,C,Southampton,yes,False
4,0,3,male,35.0,0,0,8.05,S,Third,man,True,,Southampton,no,True
5,0,3,male,,0,0,8.4583,Q,Third,man,True,,Queenstown,no,True
6,0,1,male,54.0,0,0,51.8625,S,First,man,True,E,Southampton,no,True
7,0,3,male,2.0,3,1,21.075,S,Third,child,False,,Southampton,no,False
8,1,3,female,27.0,0,2,11.1333,S,Third,woman,False,,Southampton,yes,False
9,1,2,female,14.0,1,0,30.0708,C,Second,child,False,,Cherbourg,yes,False


In [43]:
#===============================================
#EJERCICIOS DE MANIPULACIÓN DE ARRAYS CON NUMPY
#===============================================

edad = np.array(titanic['age'].dropna())
tarifa = np.array(titanic['fare'].dropna())
sobreviviente = np.array(titanic['survived'].dropna())
sexo = np.array(titanic['sex'].dropna())

print("=" * 40)
print("Estadística Básica con Numpy:")
print("=" * 40)
print(f"Edad Promedio: {np.mean(edad):.0f}")
print(f"Edad Mediana: {np.median(edad):.0f}")
print(f"Edad Desviación Estándar: {np.std(edad):.2f}")

print(f"\nTarifa Promedio: ${np.mean(tarifa):.2f}")
print(f"Tarifa Máxima: ${np.max(tarifa):.2f}")
print(f"Tarifa Mínima: ${np.min(tarifa):.2f}")
print(f"Tarifa Total: ${np.sum(tarifa):.2f}")

print("=" * 40)
print("Operaciones con Numpy")
print("=" * 40)
menores = edad[edad < 18]
print(f"Menores de Edad: {len(menores)}")
sobrevivieron= np.sum(sobreviviente == 1)
print(f"Sobrevivientes: {sobrevivieron}")
no_sobrevivieron = np.sum(sobreviviente == 0)
print(f"No Sobrevivientes: {no_sobrevivieron}")
mujer_sobrev = np.sum((sexo == 'female') & (sobreviviente == 1))
print(f"Mujeres Sobrevivientes: {mujer_sobrev}")
hombre_sobrev = np.sum((sexo == 'male') & (sobreviviente == 1))
print(f"Hombres Sobrevivientes: {hombre_sobrev}")

z_fares = (tarifa - np.mean(tarifa)) / np.std(tarifa)
print(f"\nTarifas normalizadas:\n {z_fares[:10]}")


Estadística Básica con Numpy:
Edad Promedio: 30
Edad Mediana: 28
Edad Desviación Estándar: 14.52

Tarifa Promedio: $32.20
Tarifa Máxima: $512.33
Tarifa Mínima: $0.00
Tarifa Total: $28693.95
Operaciones con Numpy
Menores de Edad: 113
Sobrevivientes: 342
No Sobrevivientes: 549
Mujeres Sobrevivientes: 233
Hombres Sobrevivientes: 109

Tarifas normalizadas:
 [-0.50244517  0.78684529 -0.48885426  0.42073024 -0.48633742 -0.47811643
  0.39581356 -0.22408312 -0.42425614 -0.0429555 ]


In [81]:
#===============================================
#ANÁLISIS DE DATOS CON PANDAS (TITANIC)
#===============================================
print("=" * 40)
print("Limpieza y transformación de datos:")
print("=" * 40)

#Información del dataset
print("**Información general:")
print(titanic.info())

print("\n**Valores nulos por columna:")
print(titanic.isnull().sum())

# Estadísticas descriptivas
print("=" * 40)
print("Estadísticas descriptivas:")
print("=" * 40)
print(titanic.describe())

print("=" * 40)
print("ANÁLISIS POR GÉNERO:")
print("=" * 40)
tabla_genero = titanic.groupby('sex')['survived'].agg(['count', 'sum', 'mean'])
tabla_genero.columns = ['Total', 'Sobrevivientes', 'Tasa de Sobrevivencia']
tabla_genero.index.name = "GÉNERO"
tabla_genero.index = tabla_genero.index.str.upper()
print(tabla_genero)

print("=" * 40)
print("ANÁLISIS POR CLASE:")
print("=" * 40)
tabla_clase = titanic.groupby('class')['survived'].agg(['count', 'sum', 'mean'])
tabla_clase.columns = ['Total', 'Sobrevivientes', 'Tasa de Sobrevivencia']
tabla_clase.index = tabla_clase.index.str.upper()
tabla_clase.index.name = "CLASE"
print(tabla_clase)

print("=" * 40)
print("ANÁLISIS POR GRUPO DE EDAD:")
print("=" * 40)
grupo = [0, 12, 18, 60, 100]
labels = ['Niño', 'Adolescente', 'Adulto', 'Adulto Mayor']
titanic['grupo_edad'] = pd.cut(titanic['age'], bins=grupo, labels=labels)
tabla_edad = titanic.groupby('grupo_edad')['survived'].agg(['count', 'sum', 'mean'])
tabla_edad.columns = ['Total', 'Sobrevivientes', 'Tasa de Sobrevivencia']
tabla_edad.index.name = "GRUPO_EDAD"
print(tabla_edad)

Limpieza y transformación de datos:
**Información general:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 16 columns):
 #   Column       Non-Null Count  Dtype   
---  ------       --------------  -----   
 0   survived     891 non-null    int64   
 1   pclass       891 non-null    int64   
 2   sex          891 non-null    object  
 3   age          714 non-null    float64 
 4   sibsp        891 non-null    int64   
 5   parch        891 non-null    int64   
 6   fare         891 non-null    float64 
 7   embarked     889 non-null    object  
 8   class        891 non-null    category
 9   who          891 non-null    object  
 10  adult_male   891 non-null    bool    
 11  deck         203 non-null    category
 12  embark_town  889 non-null    object  
 13  alive        891 non-null    object  
 14  alone        891 non-null    bool    
 15  grupo_edad   714 non-null    category
dtypes: bool(2), category(3), float64(2), int64(4), object(5)


In [99]:
from google.colab import drive
drive.mount('/content/drive')
!find /content/drive -name "*.ipynb"


Mounted at /content/drive
/content/drive/MyDrive/contenido/IA_semana1_2025.ipynb
/content/drive/MyDrive/contenido/Notebook_1_Fundamentos_de_NumPy_y_Pandas.ipynb


In [121]:
# ================================================
#   GUARDAR NOTEBOOK EN GITHUB DESDE COLAB
#   Andrea Ordoñez
# ================================================

# 1. Montar Drive (si no está montado)
from google.colab import drive
drive.mount('/content/drive')

# 2. Configurar Git
!git config --global user.email "andrea.ordonezr@uees.edu.ec"
!git config --global user.name "Andrea Ordoñez"

# 3. Limpiar clonaciones anteriores
!rm -rf /content/repos

# 4. Crear carpeta de trabajo y clonar repo
!mkdir /content/repos
%cd /content/repos

!git clone https://github.com/akordone22/UEES-IA-Semana1-OrdonezAndrea.git
%cd UEES-IA-Semana1-OrdonezAndrea

# 5. Crear ruta si no existe
!mkdir -p 02_Laboratorio/notebooks

# 6. Copiar notebook al repositorio
# ⚠️ CAMBIA SOLO ESTE NOMBRE por tu notebook actual
!cp /content/drive/MyDrive/contenido/Notebook_1_Fundamentos_de_NumPy_y_Pandas.ipynb 02_Laboratorio/notebooks/

# 7. Commit
!git add .
!git commit -m "Subir notebook desde Colab"

# 8. Push usando token
import getpass
usuario = "akordone22"
token = getpass.getpass("Pega tu token de GitHub:")

!git push https://$usuario:$token@github.com/akordone22/UEES-IA-Semana1-OrdonezAndrea.git main


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
shell-init: error retrieving current directory: getcwd: cannot access parent directories: No such file or directory
/content/repos
Cloning into 'UEES-IA-Semana1-OrdonezAndrea'...
remote: Enumerating objects: 4, done.[K
remote: Counting objects: 100% (4/4), done.[K
remote: Compressing objects: 100% (3/3), done.[K
remote: Total 4 (delta 0), reused 0 (delta 0), pack-reused 0 (from 0)[K
Receiving objects: 100% (4/4), done.
/content/repos/UEES-IA-Semana1-OrdonezAndrea
[main 2f3f3f0] Subir notebook desde Colab
 1 file changed, 1 insertion(+)
 create mode 100644 02_Laboratorio/notebooks/Notebook_1_Fundamentos_de_NumPy_y_Pandas.ipynb
Pega tu token de GitHub:··········
Enumerating objects: 6, done.
Counting objects: 100% (6/6), done.
Delta compression using up to 2 threads
Compressing objects: 100% (4/4), done.
Writing objects: 100% (5/5), 8.86 KiB | 4.43 MiB/s, d