# Trabajando con Datos en Python Cheat Sheet

## Lectura y escritura de archivos

### Modos de apertura de archivos	
Diferentes modos para abrir archivos para operaciones específicas.	Sintaxis: r (lectura) w (escritura) a (agregar) + (actualización: lectura/escritura) b (binario, de lo contrario texto)

In [None]:
with open("data.txt", "r") as file: 
    content = file.read() 
    print(content) 
    with open("output.txt", "w") as file: 
        file.write("¡Hola, mundo!")
        with open("log.txt", "a") as file: 
            file.write("Entrada de log: Algo sucedió.") 
            with open("data.txt", "r+") as file: 
                content = file.read() 
                file.write("Contenido actualizado: " + content)

## Métodos de lectura de archivos	
Diferentes métodos para leer el contenido de un archivo de varias maneras.	

Sintaxis:
```python
file.readlines() # lee todas las líneas como una lista
readline() # lee la siguiente línea como una cadena
file.read() # lee todo el contenido del archivo como una cadena

In [None]:
with open("data.txt", "r") as file:
    lines = file.readlines()
    next_line = file.readline()
    content = file.read()

## Métodos de escritura de archivos	
Diferentes métodos de escritura para escribir contenido en un archivo.	
Sintaxis:
```python
file.write(content) # escribe una cadena en el archivo
file.writelines(lines) # escribe una lista de cadenas en el archivo
```
Ejemplo:

In [5]:
lines = ["Hola\n", "Mundo\n"]
with open("output.txt", "w") as file:
    file.writelines(lines)

## Iterando sobre líneas	
Itera a través de cada línea en el archivo usando un `bucle`.	
Sintaxis:
```python
for line in file: # Código para procesar cada línea
```
Ejemplo:

In [None]:
with open("data.txt", "r") as file:
    for line in file: print(line)

## Open() y close()	
Abrir un archivo, realizar operaciones y cerrar explícitamente el archivo usando el método close().	
Sintaxis:
```python
file = open(filename, mode) # Código que usa el archivo
file.close()
```
Ejemplo:

In [None]:
file = open("data.txt", "r")
content = file.read()
file.close()

## with open()	
Abrir un archivo usando un bloque with, asegurando el cierre automático del archivo después de su uso.
Sintaxis:
```python
with open(filename, mode) as file: # Código que usa el archivo
```
Ejemplo:

In [None]:
with open("data.txt", "r") as file:
content = file.read()

# Pandas

## .read_csv()	
Lee datos de un archivo `.CSV` y crea un DataFrame.	
Sintaxis: 
```python
dataframe_name = pd.read_csv("filename.csv") Ejemplo: df = pd.read_csv("data.csv")
```

## .read_excel()	
Lee datos de un archivo de Excel y crea un DataFrame.	
Sintaxis:
```python
dataframe_name = pd.read_excel("filename.xlsx")
```
Ejemplo:
```python
df = pd.read_excel("data.xlsx")
```

## .to_csv()	
Escribe el DataFrame en un archivo CSV.	
Sintaxis:
```python
dataframe_name.to_csv("output.csv", index=False)
```
Ejemplo:

```python
df.to_csv("output.csv", index=False)
```

## Acceder a Columnas	
Accede a una columna específica usando [] en el DataFrame.	
Sintaxis:
```python
dataframe_name["column_name"] # Accede a una sola columna
dataframe_name[["column1", "column2"]] # Accede a múltiples columnas
```
Ejemplo:
```python
df["edad"]
df[["nombre", "edad"]]
```

## describe()	
Genera un resumen estadístico de las columnas numéricas en el DataFrame.	
Sintaxis:
```python
dataframe_name.describe()
```
Ejemplo:

```python
df.describe()
```
## drop()	
Elimina filas o columnas específicas del DataFrame. axis=1 indica columnas. axis=0 indica filas.	
Sintaxis:
```python
dataframe_name.drop(["column1", "column2"], axis=1, inplace=True)
dataframe_name.drop(index=[row1, row2], axis=0, inplace=True)
```
Ejemplo:
```python
df.drop(["edad", "salario"], axis=1, inplace=True) # Eliminará columnas
df.drop(index=[5, 10], axis=0, inplace=True) # Eliminará filas
```
## dropna()	
Elimina filas con valores NaN faltantes del DataFrame. axis=0 indica filas.
Sintaxis:
```python
dataframe_name.dropna(axis=0, inplace=True)
```
Ejemplo:

```python
df.dropna(axis=0, inplace=True)
```

## duplicated()	
Valores o registros duplicados o repetitivos dentro de un conjunto de datos.	
Sintaxis:
```python
dataframe_name.duplicated()
```
Ejemplo:

```python
duplicate_rows = df[df.duplicated()]
```
## Filtrar Filas	
Crea un nuevo DataFrame con filas que cumplen condiciones específicas.	
Sintaxis:
```python
filtered_df = dataframe_name[(Condiciones)]
```
Ejemplo:

```python
filtered_df = df[(df["edad"] > 30) & (df["salario"] < 50000)
```
## groupby()	
Divide un DataFrame en grupos según criterios específicos, permitiendo la agregación, transformación o análisis posterior dentro de cada grupo.	
Sintaxis:
```python
grouped = dataframe_name.groupby(by, axis=0, level=None, as_index=True,
sort=True, group_keys=True, squeeze=False, observed=False, dropna=True)
```
Ejemplo:

```python
grouped = df.groupby(["categoría", "región"]).agg({"ventas": "suma"})
```
## head()	
Muestra las primeras n filas del DataFrame.	
Sintaxis:
```python
dataframe_name.head(n)
```
Ejemplo:

```python
df.head(5)
```
## Importar pandas
Importa la biblioteca Pandas con el alias pd.	
Sintaxis:
```python
import pandas as pd
```
Ejemplo:

```python
import pandas as pd
```
## info()	
Proporciona información sobre el DataFrame, incluidos los tipos de datos y el uso de memoria.	Sintaxis:
```python
dataframe_name.info()
```
Ejemplo:

```python
df.info()
```
## merge()	
Combina dos DataFrames basándose en múltiples columnas comunes.	
Sintaxis:
```python
merged_df = pd.merge(df1, df2, on=["column1", "column2"])
```
Ejemplo:

```python
merged_df = pd.merge(ventas, productos, on=["product_id", "category_id"])
```
## imprimir DataFrame	
Muestra el contenido del DataFrame.	
Sintaxis:
```python
print(df) # o simplemente escribe df
```
Ejemplo:
```python
print(df)
df
```
## replace()	
Reemplaza valores específicos en una columna por nuevos valores.	
Sintaxis:
```python
dataframe_name["column_name"].replace(old_value, new_value, inplace=True)
```
Ejemplo:

```python
df["estado"].replace("En Progreso", "Activo", inplace=True)
```

## tail()	
Muestra las últimas n filas del DataFrame.	
Sintaxis:
```python
dataframe_name.tail(n)
```
Ejemplo:

```python
df.tail(5)
```

# Numpy

## Importar NumPy	
Importa la biblioteca NumPy.	
Sintaxis:
```python
import numpy as np
```
Ejemplo:

```python
import numpy as np
```

## np.array()	
Crea un array unidimensional o multidimensional,	
Sintaxis:
```python
array_1d = np.array([valores de lista1]) # Array 1D
array_2d = np.array([[valores de lista1], [valores de lista2]]) # Array 2D
```
Ejemplo:
```python
array_1d = np.array([1, 2, 3]) # Array 1D
array_2d = np.array([[1, 2], [3, 4]]) # Array 2D
```
## Atributos de Array de Numpy	
- Calcula la media de los elementos del array
- Calcula la suma de los elementos del array
- Encuentra el valor mínimo en el array
- Encuentra el valor máximo en el array
- Calcula el producto punto de dos arrays
- Ejemplo:
```python
np.mean(array)
np.sum(array)
np.min(array)
np.max(array)
np.dot(array_1, array_2)
```