In [1]:
import pandas as pd
import numpy as np

# Paso 1: Crear un DataFrame de 20x20 con valores aleatorios
np.random.seed(0)  # Para reproducibilidad
data = np.random.randint(1, 500, size=(20, 20))  # Valores aleatorios entre 1 y 500
columns = [f'Col_{i+1}' for i in range(20)]  # Nombres de columnas Col_1, Col_2, ..., Col_20
df = pd.DataFrame(data, columns=columns)

# Paso 2: Mostrar el DataFrame
print("DataFrame original:")
print(df)

# Paso 3: Aleatoriamente eliminar 5 datos de toda la data
# Vamos a eliminar 5 valores aleatorios del DataFrame.
np.random.seed(1)  # Cambiar la semilla para obtener una eliminación diferente
for _ in range(5):
    row = np.random.randint(0, 20)
    col = np.random.randint(0, 20)
    df.iloc[row, col] = np.nan  # Asignar NaN a una posición aleatoria

print("\nDataFrame después de eliminar 5 datos aleatorios (NaN):")
print(df)

# Paso 4: Eliminar las filas con valores nulos
df_cleaned = df.dropna()  # Elimina filas con cualquier NaN
print("\nDataFrame después de eliminar filas con valores nulos:")
print(df_cleaned)

# Paso 5: Agrupar los datos por la columna 'Col_1' y calcular el promedio
# Para esto vamos a crear una columna 'Col_1' con valores aleatorios para simular un agrupamiento.
df['Col_1'] = np.random.randint(1, 6, size=(20))  # Añadimos 'Col_1' con valores entre 1 y 5

grouped = df.groupby('Col_1').mean()  # Agrupar por 'Col_1' y calcular el promedio
print("\nPromedio por grupo de 'Col_1':")
print(grouped)

# Paso 6: Crear una nueva columna 'New_Column' con el producto de 'Col_2' y 'Col_3'
df['New_Column'] = df['Col_2'] * df['Col_3']
print("\nDataFrame con la nueva columna 'New_Column' (producto de 'Col_2' y 'Col_3'):")
print(df)

# Paso 7: Filtrar las filas donde 'New_Column' > 300
df_filtered = df[df['New_Column'] > 300]
print("\nDataFrame después de filtrar las filas donde 'New_Column' > 300:")
print(df_filtered)

# Paso 8: Normalizar las columnas del DataFrame (escala de 0 a 1)
df_normalized = (df - df.min()) / (df.max() - df.min())  # Normalización Min-Max
print("\nDataFrame normalizado:")
print(df_normalized)

# Paso 9: Usar pivot_table para reorganizar y aplicar 5 funciones agregadas
# Para el ejemplo, usaremos 'Col_1' como índice, 'Col_2' como columna y 'New_Column' como valores.
pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
print("\nPivot Table con 5 funciones agregadas:")
print(pivot)

# Paso 10: Seleccionar las primeras 2 filas y 2 columnas para obtener una matriz 2x2
# Y asegurarnos que todos sus valores sean 5
df_2x2 = df.iloc[:2, :2]  # Seleccionamos las primeras 2 filas y 2 columnas

# Asignamos todos los valores de la matriz 2x2 a 5
df_2x2[:] = 5

print("\nMatriz 2x2 con todos los valores igual a 5:")
print(df_2x2)

# Confirmar que la matriz es de 2x2 y todos sus valores son 5
assert df_2x2.shape == (2, 2), "La matriz no es 2x2."
assert (df_2x2 == 5).all().all(), "No todos los valores son 5."

print("\n¡El resultado es correcto!")

DataFrame original:
    Col_1  Col_2  Col_3  Col_4  Col_5  Col_6  Col_7  Col_8  Col_9  Col_10  \
0     173     48    118    193    324    252    196    360     10     212   
1     487     40     88    175     89    338    166     26    334      73   
2     100    473    178    244    286    148    148    399    424     289   
3     460    371    184     29    291    129    129    421     54     390   
4     377    258    322    488    426     58    292    359    120     268   
5      85    204    325    263    453     48    128    132    461     357   
6     374    342     49    306     70    170    164    449     96     198   
7      43    462    369    488    406    202    384      1    395     371   
8     223    124    452     83    431    228    149    210     51     412   
9     259    308     81     33    183    129    295    276    175      43   
10     95    227    364    270    369    297    329     20     96     329   
11    452    238    140     87    462    378    110    3

  pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
  pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
  pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
  pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
  pivot = df.pivot_table(index='Col_1', values=['Col_2', 'New_Column'], aggfunc={'Col_2': np.mean, 'New_Column': [np.sum, np.min, np.max, np.mean, np.std]})
