### 1. Configuración Estándar del Entorno (Standard Stack):

Se ejecuta la configuración inicial requerida, que incluye la instalación y carga de todas las librerías esenciales para Ciencia de Datos y Machine Learning (NumPy, Pandas, Scikit-learn, TensorFlow) y la configuración de parámetros gráficos para Matplotlib y Seaborn.

In [85]:
# 01_Fundamentos_NumPy_Pandas

import tensorflow as tf
print("GPU disponible:", tf.config.list_physical_devices('GPU'))

# Instalar librerías adicionales si es necesario
!pip install seaborn plotly

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")

GPU disponible: []
Entorno configurado correctamente en Google Colab


### 2. Ejercicios de Manipulación de Arrays con Numpy

NumPy es la librería base para la computación numérica. Sus **Arrays N-dimensionales** son la forma más eficiente de almacenar y manipular grandes volúmenes de datos numéricos. Demostramos la creación de arrays 1D (vector) y 2D (matriz) y su manipulación.

In [87]:
# 1. Creación de Arrays
# Array 1D (Vector de calificaciones)
calificaciones = np.array([75, 88, 92, 65, 70, 95])
print("Vector de Calificaciones:", calificaciones)
print("Forma (shape):", calificaciones.shape)

# Array 2D (Matriz de costos y unidades vendidas)
costos_unidades = np.array([
    [100, 250],  # Costo y Unidades Producto A
    [150, 180],  # Costo y Unidades Producto B
    [90, 300]    # Costo y Unidades Producto C
])
print("\nMatriz de Costos y Unidades:\n", costos_unidades)
print("Forma (shape):", costos_unidades.shape)

# 2. Operaciones Vectorizadas (Manipulación)
# Sumar 5 puntos extra a todas las calificaciones
calificaciones_ajustadas = calificaciones + 5
print("\nCalificaciones Ajustadas:", calificaciones_ajustadas)

# 3. Subsetting (Selección de datos)
# Seleccionar solo las calificaciones mayores a 80
calificaciones_altas = calificaciones[calificaciones > 80]
print("Calificaciones mayores a 80:", calificaciones_altas)

# 4. Cálculo estadístico rápido
print("Media de las calificaciones:", np.mean(calificaciones))

Vector de Calificaciones: [75 88 92 65 70 95]
Forma (shape): (6,)

Matriz de Costos y Unidades:
 [[100 250]
 [150 180]
 [ 90 300]]
Forma (shape): (3, 2)

Calificaciones Ajustadas: [ 80  93  97  70  75 100]
Calificaciones mayores a 80: [88 92 95]
Media de las calificaciones: 80.83333333333333


### 3. Análisis de datos con Pandas usando  el Dataset 'Titanic'

La librería `Pandas` utiliza la estructura **DataFrame** para manipular datos tabulares. En este caso, cargamos el dataset integrado `titanic` de la librería `Seaborn`. Este dataset nos permite practicar:

1.  **Carga de datos** desde una fuente externa (en este caso, integrado).
2.  **Inspección** de la estructura y tipos de datos.
3.  **Manipulación** (filtrado y agrupación) de datos reales.

In [None]:
# Carga del dataset Titanic (Opción 1 de carga de la profesora)
# sns ya está importado gracias a la celda de configuración inicial
df_titanic = sns.load_dataset('titanic')

# 1. Inspección inicial
print("Primeras 5 filas del DataFrame Titanic:")
print(df_titanic.head())

# 2. Resumen de la estructura: ¿Cuántos valores faltan y qué tipos de datos hay?
print("\nInformación de Tipos de Datos y Valores No Nulos:")
df_titanic.info()

# 3. Ingeniería de Features: Crear una columna booleana (True/False)
# Clasificamos a los pasajeros como "Joven" si su edad es menor a 18 (si el valor de 'age' no es nulo)
df_titanic['Es_Joven'] = np.where(df_titanic['age'] < 18, True, False)
print("\nDistribución de pasajeros jóvenes (Nulos excluidos):\n", df_titanic['Es_Joven'].value_counts())

# 4. Filtrado de datos (Análisis)
# Seleccionar solo a las mujeres que sobrevivieron
mujeres_sobrevivientes = df_titanic[(df_titanic['sex'] == 'female') & (df_titanic['survived'] == 1)]
print("\nNúmero de mujeres que sobrevivieron:", len(mujeres_sobrevivientes))

# 5. Agrupación (Análisis)
# Calcular la tasa de supervivencia (media de la columna 'survived') por clase de pasajero ('pclass')
tasa_supervivencia_por_clase = df_titanic.groupby('pclass')['survived'].mean().sort_values(ascending=False)
print("\nTasa de Supervivencia por Clase de Pasajero (1=Primera, 3=Tercera):\n", tasa_supervivencia_por_clase)

Primeras 5 filas del DataFrame Titanic:
   survived  pclass     sex   age  sibsp  parch     fare embarked  class  \
0         0       3    male  22.0      1      0   7.2500        S  Third   
1         1       1  female  38.0      1      0  71.2833        C  First   
2         1       3  female  26.0      0      0   7.9250        S  Third   
3         1       1  female  35.0      1      0  53.1000        S  First   
4         0       3    male  35.0      0      0   8.0500        S  Third   

     who  adult_male deck  embark_town alive  alone  
0    man        True  NaN  Southampton    no  False  
1  woman       False    C    Cherbourg   yes  False  
2  woman       False  NaN  Southampton   yes   True  
3  woman       False    C  Southampton   yes  False  
4    man        True  NaN  Southampton    no   True  

Información de Tipos de Datos y Valores No Nulos:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 15 columns):
 #   Column       Non-N

### 4. Integración con GitHub
Guardar notebooks en GitHub desde Colab:

Clonar el reporsitorio usando token

In [None]:
%cd /content

/content


In [None]:
from getpass import getpass
from google.colab import drive
from google.colab import auth
import subprocess  # Ayudante para sustituir el token en Git

# Pide el token de forma segura (pégalo aquí – no se ve)
token = getpass("Pega tu token de GitHub aquí (no se verá): ")

# Conecta Drive y auth
drive.mount('/content/drive', force_remount=True)
auth.authenticate_user()

!git config --global user.email "defloresa@uees.edu.ec"
!git config --global user.name "Flores Denisse"

# Limpieza y clon
!rm -rf /content/UEES-IA-Semana1-FloresDenisse
!git clone https://github.com/defloresa-uees/UEES-IA-Semana1-FloresDenisse.git /content/UEES-IA-Semana1-FloresDenisse
%cd /content/UEES-IA-Semana1-FloresDenisse

# Carpetas
!mkdir -p ./02_Laboratorio/notebooks/

# Copia desde Drive
!cp "/content/drive/MyDrive/Colab Notebooks/01_Fundamentos_NumPy_Pandas.ipynb" ./02_Laboratorio/notebooks/

# Commit
!git add .
!git commit -m "Añadir notebook de fundamentos"

# TRUCO: Sustituye el token correctamente en el comando de Git (sin "{token}")
subprocess.run(["git", "remote", "set-url", "origin", f"https://{token}@github.com/defloresa-uees/UEES-IA-Semana1-FloresDenisse.git"])

# Push (ahora con el token sustituido, no falla)
!git push origin main

print("¡Subido! Ve a github.com/defloresa-uees/UEES-IA-Semana1-FloresDenisse para ver el notebook.")

Pega tu token de GitHub aquí (no se verá): ··········
Mounted at /content/drive
Cloning into '/content/UEES-IA-Semana1-FloresDenisse'...
remote: Enumerating objects: 32, done.[K
remote: Counting objects: 100% (32/32), done.[K
remote: Compressing objects: 100% (25/25), done.[K
remote: Total 32 (delta 5), reused 17 (delta 2), pack-reused 0 (from 0)[K
Receiving objects: 100% (32/32), 15.65 KiB | 457.00 KiB/s, done.
Resolving deltas: 100% (5/5), done.
/content/UEES-IA-Semana1-FloresDenisse
[main d7a4659] Añadir notebook de fundamentos
 1 file changed, 1 insertion(+), 1 deletion(-)
Enumerating objects: 9, done.
Counting objects: 100% (9/9), done.
Delta compression using up to 2 threads
Compressing objects: 100% (4/4), done.
Writing objects: 100% (5/5), 771 bytes | 771.00 KiB/s, done.
Total 5 (delta 1), reused 0 (delta 0), pack-reused 0
remote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/defloresa-uees/UEES-IA-Semana1-FloresDenisse.git
   8c279dc

In [None]:
from google.colab import drive

# Conecta Drive (para encontrar el notebook)
drive.mount('/content/drive', force_remount=True)

# Asegúrate de estar en el repo (carpetas ya existen)
%cd /content/UEES-IA-Semana1-FloresDenisse

# Función para guardar automáticamente en GitHub (corregida para Drive)
def save_to_github(notebook_name, commit_message="Actualizar notebook"):
    """
    Guarda el notebook actual en GitHub
    """
    # Copia DESDE DRIVE (el lugar correcto, con f-string para sustituir el nombre)
    !cp "/content/drive/MyDrive/Colab Notebooks/{notebook_name}" ./02_Laboratorio/notebooks/
    !git add .
    !git commit -m "{commit_message}"
    !git push origin main
    print(f" {notebook_name} guardado en GitHub")

# Usar al final de cada sesión de trabajo
save_to_github("01_Fundamentos_NumPy_Pandas.ipynb", "Completar ejercicios de NumPy y Pandas")


Mounted at /content/drive
/content/UEES-IA-Semana1-FloresDenisse
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
Everything up-to-date
 01_Fundamentos_NumPy_Pandas.ipynb guardado en GitHub
