#  Guía Completa de NumPy en Python

**NumPy** (Numerical Python) es una biblioteca fundamental para el cálculo numérico en Python. Proporciona soporte para **arrays multidimensionales** y funciones matemáticas optimizadas.

---

## **1️⃣ ¿Qué es NumPy y Por Qué Usarlo?**

NumPy permite:
✔ **Manejar arreglos multidimensionales** (`ndarray`).  
✔ **Realizar operaciones matemáticas optimizadas**.  
✔ **Manipular datos de manera eficiente**.  
✔ **Usar funciones estadísticas y algebraicas avanzadas**.  

📌 **Instalar NumPy** (si no lo tienes instalado):
```bash
pip install numpy
```

📌 **Importar NumPy** en Python:
```python
import numpy as np
```

---

## **2️⃣ Creación de Arrays en NumPy**

Los arrays en NumPy son más rápidos y eficientes que las listas de Python.

### **🔹 Convertir una Lista en un `ndarray`**
```python
import numpy as np

lista = [1, 2, 3, 4, 5]
arr = np.array(lista)
print(arr)  # ✅ [1 2 3 4 5]
print(type(arr))  # ✅ <class 'numpy.ndarray'>
```

### **🔹 Arrays Multidimensionales**
```python
matriz = np.array([[1, 2, 3], [4, 5, 6]])
print(matriz)
```
📌 **Salida:**
```
[[1 2 3]
 [4 5 6]]
```

### **🔹 Arrays de Zeros y Ones**
```python
zeros = np.zeros((3, 3))  # Matriz 3x3 de ceros
ones = np.ones((2, 4))  # Matriz 2x4 de unos
print(zeros, ones)
```

### **🔹 `arange()` y `linspace()`**
```python
arr1 = np.arange(0, 10, 2)  # [0 2 4 6 8]
arr2 = np.linspace(0, 5, 10)  # 10 valores equidistantes entre 0 y 5
```

### **🔹 Matriz Identidad (`eye()`)**
```python
identidad = np.eye(4)  # Matriz identidad 4x4
```

---

## **3️⃣ Propiedades de un `ndarray`**
```python
arr = np.array([[1, 2, 3], [4, 5, 6]])

print(arr.shape)  # ✅ (2, 3) → Dimensiones
print(arr.ndim)  # ✅ 2 → Número de dimensiones
print(arr.size)  # ✅ 6 → Número total de elementos
print(arr.dtype)  # ✅ int64 (depende del sistema)
```

---

## **4️⃣ Indexado y Slicing en NumPy**
```python
arr = np.array([10, 20, 30, 40, 50])

print(arr[1])  # ✅ 20 (Acceder al segundo elemento)
print(arr[1:4])  # ✅ [20 30 40] (Slicing)
print(arr[::-1])  # ✅ [50 40 30 20 10] (Invertir array)
```

📌 **Indexado en Matrices**:
```python
matriz = np.array([[1, 2, 3], [4, 5, 6]])
print(matriz[0, 1])  # ✅ 2 (Fila 0, columna 1)
print(matriz[:, 1])  # ✅ [2 5] (Segunda columna)
```

---

## **5️⃣ Operaciones Matemáticas con Arrays**

NumPy permite **realizar operaciones matemáticas vectorizadas** sin necesidad de bucles.

```python
arr = np.array([1, 2, 3, 4, 5])

print(arr + 10)  # ✅ [11 12 13 14 15]
print(arr * 2)  # ✅ [2 4 6 8 10]
print(arr ** 2)  # ✅ [1 4 9 16 25]
```

📌 **Operaciones entre Arrays**:
```python
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
print(arr1 + arr2)  # ✅ [5 7 9]
print(arr1 * arr2)  # ✅ [4 10 18]
```

---

## **6️⃣ Funciones Matemáticas en NumPy**
```python
arr = np.array([0, np.pi / 2, np.pi])

print(np.sin(arr))  # ✅ Seno de cada elemento
print(np.log(arr + 1))  # ✅ Logaritmo natural (evitar log(0))
print(np.exp(arr))  # ✅ Exponencial e^x
```

📌 **Funciones Estadísticas**:
```python
print(np.mean(arr))  # ✅ Media
print(np.median(arr))  # ✅ Mediana
print(np.std(arr))  # ✅ Desviación estándar
```

---

## **7️⃣ Álgebra Lineal en NumPy**
```python
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

print(np.dot(A, B))  # ✅ Producto Matricial
print(np.linalg.det(A))  # ✅ Determinante de A
print(np.linalg.inv(A))  # ✅ Inversa de A
```

---

## **8️⃣ Generación de Números Aleatorios (`numpy.random`)**

### **🔹 Generar un Número Aleatorio**
```python
print(np.random.rand())  # ✅ Número aleatorio entre 0 y 1
```

### **🔹 Generar un Array Aleatorio**
```python
print(np.random.rand(3, 3))  # ✅ Matriz 3x3 de números entre 0 y 1
```

### **🔹 Números Enteros Aleatorios**
```python
print(np.random.randint(1, 100, (3, 3)))  # ✅ Matriz 3x3 de enteros entre 1 y 100
```

---

## **9️⃣ Manipulación de Arrays**

### **🔹 Transponer una Matriz**
```python
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr.T)  # ✅ Transpuesta
```

### **🔹 Apilar Arrays**
```python
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(np.vstack((a, b)))  # ✅ Apilar verticalmente
print(np.hstack((a, b)))  # ✅ Apilar horizontalmente
```

---

## **🔟 Guardar y Cargar Arrays**

```python
np.save("array.npy", arr)  # Guardar
cargado = np.load("array.npy")  # Cargar
print(cargado)
```

---

## **🚀 Conclusión**

✔ **NumPy permite manejar arrays de manera eficiente.**  
✔ **Optimiza cálculos matemáticos y algebraicos.**  
✔ **Incluye funciones estadísticas y aleatorias avanzadas.**  
✔ **Facilita manipulación de datos en machine learning y ciencia de datos.**  


#  Guía Completa de Pandas en Python

**Pandas** es una biblioteca fundamental para el análisis y manipulación de datos en Python.  
Permite **cargar, limpiar, analizar y visualizar datos de manera eficiente**.

---

## **1️⃣ ¿Qué es Pandas y Por Qué Usarlo?**

✔ **Manejo de datos en formato tabular (`DataFrame`) y unidimensional (`Series`)**  
✔ **Lectura y escritura de archivos (`CSV`, `Excel`, `SQL`, `JSON`, etc.)**  
✔ **Manipulación y transformación de datos (filtros, agrupaciones, combinaciones)**  
✔ **Funciones estadísticas y análisis exploratorio**  

📌 **Instalar Pandas** (si no lo tienes instalado):
```bash
pip install pandas
```

📌 **Importar Pandas** en Python:
```python
import pandas as pd
```

---

## **2️⃣ Creación de Estructuras de Datos en Pandas**

### **🔹 `Series` (Estructura Unidimensional)**
```python
import pandas as pd

datos = [10, 20, 30, 40, 50]
serie = pd.Series(datos)
print(serie)
```

📌 **Salida**:
```
0    10
1    20
2    30
3    40
4    50
dtype: int64
```

📌 **Definir Índices Personalizados**:
```python
serie = pd.Series(datos, index=["a", "b", "c", "d", "e"])
```

---

### **🔹 `DataFrame` (Estructura Bidimensional)**
```python
datos = {
    "Nombre": ["Ana", "Luis", "Carlos"],
    "Edad": [25, 30, 35],
    "Ciudad": ["Madrid", "Barcelona", "Sevilla"]
}

df = pd.DataFrame(datos)
print(df)
```

📌 **Salida**:
```
   Nombre  Edad    Ciudad
0     Ana    25    Madrid
1    Luis    30  Barcelona
2  Carlos    35   Sevilla
```

📌 **Acceder a Columnas**:
```python
print(df["Nombre"])  # ✅ Devuelve una Serie con los nombres
```

📌 **Acceder a Filas**:
```python
print(df.loc[1])  # ✅ Accede por índice
print(df.iloc[2])  # ✅ Accede por posición
```

---

## **3️⃣ Lectura y Escritura de Archivos**

📌 **Leer un Archivo CSV**:
```python
df = pd.read_csv("datos.csv")
```

📌 **Guardar un DataFrame en CSV**:
```python
df.to_csv("salida.csv", index=False)
```

📌 **Leer un Archivo Excel**:
```python
df = pd.read_excel("datos.xlsx")
```

📌 **Guardar un DataFrame en Excel**:
```python
df.to_excel("salida.xlsx", index=False)
```

📌 **Leer un Archivo JSON**:
```python
df = pd.read_json("datos.json")
```

📌 **Leer desde una Base de Datos SQL**:
```python
import sqlite3

conexion = sqlite3.connect("base_de_datos.db")
df = pd.read_sql_query("SELECT * FROM tabla", conexion)
```

---

## **4️⃣ Manipulación y Transformación de Datos**

### **🔹 Filtrar Datos**
```python
df_filtrado = df[df["Edad"] > 30]
```

### **🔹 Seleccionar Columnas**
```python
df_subset = df[["Nombre", "Edad"]]
```

### **🔹 Agregar Nuevas Columnas**
```python
df["Salario"] = [25000, 30000, 35000]
```

### **🔹 Eliminar Columnas**
```python
df = df.drop(columns=["Ciudad"])
```

### **🔹 Ordenar Datos**
```python
df_sorted = df.sort_values(by="Edad", ascending=False)
```

---

## **5️⃣ Estadísticas y Análisis Exploratorio**

📌 **Resumen Estadístico**:
```python
print(df.describe())
```

📌 **Número de Filas y Columnas**:
```python
print(df.shape)
```

📌 **Contar Valores Únicos**:
```python
print(df["Ciudad"].value_counts())
```

📌 **Correlación entre Variables Numéricas**:
```python
print(df.corr())
```

---

## **6️⃣ Agrupación y Pivot Tables**

📌 **Agrupar Datos (`groupby()`)**:
```python
df_grouped = df.groupby("Ciudad").mean()
```

📌 **Pivot Tables**:
```python
df_pivot = df.pivot_table(values="Salario", index="Ciudad", columns="Edad", aggfunc="sum")
```

---

## **7️⃣ Combinación y Fusión de DataFrames**

📌 **Concatenar DataFrames**:
```python
df_nuevo = pd.concat([df1, df2])
```

📌 **Unir DataFrames (`merge()`)**:
```python
df_merge = df1.merge(df2, on="ID", how="inner")
```

📌 **Tipos de Joins en Pandas**:
| Tipo | Descripción |
|------|------------|
| `inner` | Solo las coincidencias |
| `left` | Todo el de la izquierda y coincidencias de la derecha |
| `right` | Todo el de la derecha y coincidencias de la izquierda |
| `outer` | Todos los datos, llenando con `NaN` si no hay coincidencia |

---

## **8️⃣ Manejo de Valores Nulos**

📌 **Detectar Nulos**:
```python
print(df.isnull().sum())
```

📌 **Eliminar Filas con Nulos**:
```python
df_clean = df.dropna()
```

📌 **Rellenar Nulos con un Valor**:
```python
df.fillna(0, inplace=True)
```

---

## **9️⃣ Visualización de Datos con Pandas**

```python
import matplotlib.pyplot as plt

df["Edad"].hist()
plt.show()
```

📌 **Gráfico de Barras**:
```python
df["Ciudad"].value_counts().plot(kind="bar")
plt.show()
```

📌 **Gráfico de Dispersión**:
```python
df.plot.scatter(x="Edad", y="Salario")
plt.show()
```

---

## **🔟 Exportar DataFrames a Diferentes Formatos**

| Formato | Método |
|---------|--------|
| CSV | `df.to_csv("archivo.csv", index=False)` |
| Excel | `df.to_excel("archivo.xlsx", index=False)` |
| JSON | `df.to_json("archivo.json")` |
| SQL | `df.to_sql("tabla", conexion, if_exists="replace")` |

---

## **🚀 Conclusión**

✔ **Pandas permite manejar y analizar datos de manera eficiente.**  
✔ **Puede leer y escribir en múltiples formatos (`CSV`, `Excel`, `JSON`, `SQL`).**  
✔ **Facilita filtrado, agrupación, fusión y limpieza de datos.**  
✔ **Incluye herramientas estadísticas y visualización integradas.**