<a href="https://colab.research.google.com/github/ledyquesada/Ejercicios/blob/main/Semana4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

A continuación se detallan funciones importantes para la manipulación de datos. Cada función se debe ajustar al ejercicio en cuestión

# Manipulación de datos con Pandas

**Selección de Columnas**


In [None]:
import pandas as pd

# Crear un DataFrame de ejemplo
data = {'Nombre': ['Alice', 'Bob', 'Charlie'],
        'Edad': [25, 30, 35],
        'Ciudad': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# Seleccionar la columna 'Nombre'
nombres = df['Nombre']


**Selección de Filas por Condición**

In [None]:
# Seleccionar filas donde la edad es mayor que 30
mayores_de_30 = df[df['Edad'] > 30]


**Indexación Loc e iLoc:**

In [None]:
# Seleccionar una fila por etiqueta
alice_info = df.loc[0]

# Seleccionar una fila por índice
primera_fila = df.iloc[0]


**Indexación Avanzada con Loc e iLoc**

In [None]:
# Seleccionar filas 1 y 2, y columnas 'Nombre' y 'Ciudad'
subset = df.loc[1:2, ['Nombre', 'Ciudad']]


**Asignación de valores**

In [None]:
# Asignar un nuevo valor a la celda en la fila 0 y columna 'Edad'
df.loc[0, 'Edad'] = 26

# Asignar el valor 'D' a la columna 'Ciudad' donde la edad es mayor que 30
df.loc[df['Edad'] > 30, 'Ciudad'] = 'D'


**Indexación Booleana**

In [None]:
# Filtrar filas donde la edad es mayor que 30
mayores_de_30 = df[df['Edad'] > 30]


**Indexación con Funciones**

In [None]:
# Aplicar una función a la columna 'Edad' para calcular el cuadrado
df['Edad_al_cuadrado'] = df['Edad'].apply(lambda x: x**2)

**Funciones Lambda**

In [None]:
square = lambda x: x**2
print(square(4))  # Output: 16

# Aplicar una función lambda a cada fila con parámetro axis
df['suma_filas'] = df.apply(lambda row: row['A'] + row['B'], axis=1)



**Apply**

In [None]:
import pandas as pd

# Crear un DataFrame de ejemplo
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# Aplicar una función lambda a cada elemento de la columna 'A'
df['A_cuadrado'] = df['A'].apply(lambda x: x**2)


# Manejo de datos faltantes
**Identificar datos faltantes-Eliminar-Rellenar-Interpolar-Imputar**

In [None]:
# Identificar datos faltantes
df.isnull()

# Eliminar filas con al menos un valor nulo
df_sin_nulos = df.dropna()

# Rellenar valores nulos con 0
df_con_ceros = df.fillna(0)

# Interpolar valores nulos
df_interpolado = df.interpolate()

#Imputación de datos faltantes
from sklearn.impute import SimpleImputer

# Paso 1 Crear un imputador simple
imputer = SimpleImputer(strategy='mean')

# Paso 2 Aplicar la imputación a las columnas con valores nulos
df_imputado = pd.DataFrame(imputer.fit_transform(df), columns=df.columns)



# Operaciones con Arrays en NumPy
**Operaciones matemáticas Básica**


In [None]:
import numpy as np

# Crear dos arrays
array1 = np.array([1, 2, 3, 4])
array2 = np.array([5, 6, 7, 8])

# Suma de dos arrays
suma = array1 + array2

# Resta de dos arrays
resta = array2 - array1

# Multiplicación elemento a elemento
multiplicacion = array1 * array2

# División elemento a elemento
division = array2 / array1


**Operaciones estadísticas Básicas**

In [None]:
# Calcular la media
media = np.mean(array1)

# Calcular la mediana
mediana = np.median(array1)

# Calcular la desviación estándar
desviacion_estandar = np.std(array1)

# Calcular la varianza
varianza = np.var(array1)


**Broadcasting**

In [None]:
# Broadcasting con un escalar
array_con_escalar = array1 + 10

# Broadcasting entre arrays de diferentes formas
matriz = np.array([[1, 2, 3], [4, 5, 6]])
suma_matriz = matriz + array1[:, np.newaxis]


**Vectorización**

In [None]:
# Operación sin vectorización
resultado_sin_vectorizacion = [x + y for x, y in zip(array1, array2)]

# Operación con vectorización
resultado_con_vectorizacion = array1 + array2


# Arrays multidimensionales

In [None]:
import numpy as np

# Crear una matriz bidimensional (2x3)
matriz_2d = np.array([[1, 2, 3], [4, 5, 6]])

# Crear un tensor tridimensional (2x3x4)
tensor_3d = np.array([[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]],
                      [[13, 14, 15, 16], [17, 18, 19, 20], [21, 22, 23, 24]]])

# Dimensiones (rango) de la matriz 2D
dimensiones_2d = matriz_2d.ndim

# Forma (shape) de la matriz 2D
forma_2d = matriz_2d.shape  # (2, 3)

# Número total de elementos en la matriz 2D
total_elementos_2d = matriz_2d.size

# Acceder a un elemento específico en la matriz 2D
elemento = matriz_2d[1, 2]  # Fila 1, Columna 2 (índices base 0)

# Slicing en la matriz 2D
submatriz = matriz_2d[:, 1:3]  # Todas las filas, columnas 1 a 2

# Acceder a un elemento específico en el tensor 3D
elemento_3d = tensor_3d[1, 2, 3]  # Capa 1, Fila 2, Columna 3

# Operaciones matemáticas y estadísticas en la matriz 2D
suma_columnas = np.sum(matriz_2d, axis=0)  # Suma a lo largo de las filas
media_filas = np.mean(matriz_2d, axis=1)   # Media a lo largo de las columnas

# Broadcasting en arrays multidimensionales
matriz_con_escalar = matriz_2d + 10  # Suma un escalar a todos los elementos

# Operaciones de álgebra lineal
producto_punto = np.dot(matriz_2d, matriz_2d.T)  # Producto punto con la transpuesta

# Cambiar la forma de un array
matriz_aplanada = matriz_2d.flatten()

# Cambiar la forma de un array manteniendo una dimensión
tensor_aplanado = tensor_3d.reshape((2, 12))

# Concatenar arrays multidimensionales
concatenacion_horizontal = np.concatenate((matriz_2d, matriz_2d), axis=1)
concatenacion_vertical = np.concatenate((matriz_2d, matriz_2d), axis=0)
