### Configuración inicial

In [None]:

import tensorflow as tf
print("GPU disponible:", tf.config.list_physical_devices('GPU'))

# Instalar librerías adicionales si es necesario
!pip install seaborn plotly

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")

### En cada notebook, añadir celda final para guardar en GitHub

In [15]:
# 1. Conectar Colab con GitHub
from google.colab import auth
auth.authenticate_user()

### Configurar acceso a Git

In [56]:

# @markdown Correo y username de git
# 2. Configurar Git
!git config --global user.email "andres.florencia@uees.edu.ec"
!git config --global user.name "Andrés Florencia"
!git config --global credential.helper store

### Ingreso de token para GitHub

In [60]:

from getpass import getpass

# Pedir credenciales de forma segura (no se muestran en pantalla)
github_token = getpass('Ingresa tu token de GitHub: ')
github_username = "andresflorencia-uees"  # tu username sin espacios
repo_name = "UEES-IA-Semana1-FlorenciaAndres"  # nombre exacto del repo

# Configurar el remote con el token (solo para esta sesión)
!git remote set-url origin https://{github_username}:{github_token}@github.com/{github_username}/{repo_name}.git

Ingresa tu token de GitHub: ··········


### Clonar el repositorio

In [6]:
!git clone https://github.com/andresflorencia-uees/UEES-IA-Semana1-FlorenciaAndres.git


Cloning into 'UEES-IA-Semana1-FlorenciaAndres'...


### Establecer carpeta

In [54]:
%cd /content/UEES-IA-Semana1-FlorenciaAndres/

/content/UEES-IA-Semana1-FlorenciaAndres


### Función para envío de cambios a GitHub

In [67]:
def save_to_github(notebook_name, commit_message="Actualizar notebook"):
  #!cp /content/drive/MyDrive/Colab\ Notebooks/01_Fundamentos_NumPy_Pandas.ipynb ./notebooks/
  !cp /content/drive/MyDrive/Colab\ Notebooks/{notebook_name} ./notebooks/

  !git add .
  !git commit -m "{commit_message}"
  !git push origin main
  print(f" {notebook_name} actualizado en GitHub")

### Llamado a función para envío de cambios

In [None]:
save_to_github("01_Fundamentos_NumPy_Pandas.ipynb", "Prueba de cambios")

### **EJERCIOS PRÁCTICOS DEL NOTEBOOK**





### 1. Selección del dataset


In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

### 2. Extracción de columnas a arrays

In [71]:
import numpy as np

# Convertir las columnas 'age', 'fare', 'survived' y 'pclass' a arrays de NumPy
# Eliminamos los valores NaN en 'age' y 'fare' para algunas operaciones

age_np = titanic['age'].dropna().to_numpy()
fare_np = titanic['fare'].to_numpy()
survived_np = titanic['survived'].to_numpy()
pclass_np = titanic['pclass'].to_numpy()

print("Array de edades (sin NaN):", age_np[:5])
print("Tipo de datos de edades:", age_np.dtype)
print("Forma del array de edades:", age_np.shape)
print("\nArray de tarifas:", fare_np[:5])
print("Tipo de datos de tarifas:", fare_np.dtype)
print("Forma del array de tarifas:", fare_np.shape)

Array de edades (sin NaN): [22. 38. 26. 35. 35.]
Tipo de datos de edades: float64
Forma del array de edades: (714,)

Array de tarifas: [ 7.25   71.2833  7.925  53.1     8.05  ]
Tipo de datos de tarifas: float64
Forma del array de tarifas: (891,)


### 3. Acceso a elementos (Indexación y Slicing)

In [72]:
# Primer elemento del array de edades
print("Primera edad:", age_np[0])

# Los primeros 5 elementos del array de tarifas
print("Las primeras 5 tarifas:", fare_np[:5])

# Edades de la posición 10 a la 15 (exclusiva)
print("Edades de 10 a 14:", age_np[10:15])

Primera edad: 22.0
Las primeras 5 tarifas: [ 7.25   71.2833  7.925  53.1     8.05  ]
Edades de 10 a 14: [58. 20. 39. 14. 55.]


### 4. Filtrado condicional (Indexación Booleana)

In [73]:
# Seleccionar todas las tarifas mayores a 50
fare_over_50 = fare_np[fare_np > 50]
print("Tarifas mayores a 50 (primeros 5):", fare_over_50[:5])
print("Cantidad de tarifas mayores a 50:", len(fare_over_50))

# Edades de pasajeros que sobrevivieron (filtrando el array 'survived_np')
# Primero, aseguramos que 'age' y 'survived' tengan la misma longitud si filtramos por NaN
# Para este ejemplo, usaremos el DataFrame original para un filtrado más directo si hay NaNs

# Edades de sobrevivientes (filtrando el DataFrame original y luego a NumPy)
survived_ages = titanic.loc[titanic['survived'] == 1, 'age'].dropna().to_numpy()
print("\nEdades de sobrevivientes (primeros 5):", survived_ages[:5])
print("Número de sobrevivientes con edad registrada:", len(survived_ages))

Tarifas mayores a 50 (primeros 5): [ 71.2833  53.1     51.8625 263.     146.5208]
Cantidad de tarifas mayores a 50: 160

Edades de sobrevivientes (primeros 5): [38. 26. 35. 27. 14.]
Número de sobrevivientes con edad registrada: 290


### 5. Operaciones matemáticas y estadísticas básicas

In [74]:
# Media de la edad y la tarifa
print("Edad promedio:", np.mean(age_np))
print("Tarifa promedio:", np.mean(fare_np))

# Mediana de la edad y la tarifa
print("Mediana de la edad:", np.median(age_np))
print("Mediana de la tarifa:", np.median(fare_np))

# Desviación estándar de la edad y la tarifa
print("Desviación estándar de la edad:", np.std(age_np))
print("Desviación estándar de la tarifa:", np.std(fare_np))

# Valor máximo y mínimo de la edad
print("Edad máxima:", np.max(age_np))
print("Edad mínima:", np.min(age_np))

Edad promedio: 29.69911764705882
Tarifa promedio: 32.204207968574636
Mediana de la edad: 28.0
Mediana de la tarifa: 14.4542
Desviación estándar de la edad: 14.516321150817316
Desviación estándar de la tarifa: 49.6655344447741
Edad máxima: 80.0
Edad mínima: 0.42


### 6. Contar valores únicos y sus frecuencias

In [75]:
# Valores únicos en la columna 'pclass' (clase de pasajero)
unique_pclass, counts_pclass = np.unique(pclass_np, return_counts=True)
print("Clases de pasajeros únicas:", unique_pclass)
print("Conteo por clase:", counts_pclass)

# Valores únicos en la columna 'survived' (0: No, 1: Sí)
unique_survived, counts_survived = np.unique(survived_np, return_counts=True)
print("\nValores de sobrevivientes (0=No, 1=Sí):", unique_survived)
print("Conteo de sobrevivientes (No, Sí):", counts_survived)

Clases de pasajeros únicas: [1 2 3]
Conteo por clase: [216 184 491]

Valores de sobrevivientes (0=No, 1=Sí): [0 1]
Conteo de sobrevivientes (No, Sí): [549 342]
