### Exportación y conversión de dataframes en Pandas

**Conversión de DataFrames a Diferentes Formatos**

Convertir DataFrames a Diccionarios: Convertir un DataFrame a un diccionario puede ser útil cuando necesitas manipular los datos en un formato más flexible o integrarlos en aplicaciones que manejan datos en forma de diccionario.

In [1]:
import pandas as pd

# Crear un DataFrame de ejemplo
data = {
    'Producto': ['Manzanas', 'Naranjas', 'Bananas'],
    'Ventas': [50, 30, 20],
    'Precio': [0.5, 0.75, 0.3]
}
df = pd.DataFrame(data)
print("DataFrame:")
print(df)
# Convertir a un diccionario
dict_data = df.to_dict()
print("DataFrame convertido a diccionario:")
print(dict_data)

DataFrame:
   Producto  Ventas  Precio
0  Manzanas      50    0.50
1  Naranjas      30    0.75
2   Bananas      20    0.30
DataFrame convertido a diccionario:
{'Producto': {0: 'Manzanas', 1: 'Naranjas', 2: 'Bananas'}, 'Ventas': {0: 50, 1: 30, 2: 20}, 'Precio': {0: 0.5, 1: 0.75, 2: 0.3}}


**Convertir DataFrames a Arrays de NumPy:**

Los arrays de NumPy son útiles para realizar operaciones matemáticas y estadísticas avanzadas que pueden ser más eficientes en NumPy.

In [2]:
import numpy as np

# Convertir a un array de NumPy
array_data = df.to_numpy()
print("DataFrame convertido a array de NumPy:")
print(array_data)

DataFrame convertido a array de NumPy:
[['Manzanas' 50 0.5]
 ['Naranjas' 30 0.75]
 ['Bananas' 20 0.3]]


**Convertir DataFrames a CSV:**

CSV (Comma Separated Values) es uno de los formatos más comunes para almacenar y compartir datos tabulares.

In [3]:
# Guardar el DataFrame en un archivo CSV
df.to_csv('../data/ventas.csv', index=False)
print("DataFrame guardado como archivo CSV")

DataFrame guardado como archivo CSV


**Convertir DataFrames a JSON:** 

JSON (JavaScript Object Notation) es un formato ampliamente utilizado para el intercambio de datos, especialmente en aplicaciones web y APIs.

In [4]:
# Convertir a JSON
json_data = df.to_json()
print("DataFrame convertido a JSON:")
print(json_data)

# Guardar el DataFrame en un archivo JSON
df.to_json('../data/ventas.json', orient='records', lines=True)
print("DataFrame guardado como archivo JSON")

DataFrame convertido a JSON:
{"Producto":{"0":"Manzanas","1":"Naranjas","2":"Bananas"},"Ventas":{"0":50,"1":30,"2":20},"Precio":{"0":0.5,"1":0.75,"2":0.3}}
DataFrame guardado como archivo JSON


**Convertir DataFrames a Excel:**

Excel es un formato muy popular para almacenar y compartir datos en entornos empresariales y académicos.

In [5]:
# Guardar el DataFrame en un archivo Excel
df.to_excel('../data/ventas.xlsx', index=False)
print("DataFrame guardado como archivo Excel")

DataFrame guardado como archivo Excel


**Consideraciones y Mejores Prácticas**

Elegir el Formato Adecuado: Seleccionar el formato adecuado para almacenar o compartir datos depende del contexto y los requisitos específicos. Por ejemplo:

**CSV:** Ideal para datos tabulares simples y para interoperabilidad con muchas aplicaciones.

**JSON:** Adecuado para datos estructurados y semi-estructurados, especialmente en aplicaciones web y APIs.

**Excel:** Útil para datos que requieren análisis manual o presentación en entornos empresariales.

**NumPy Arrays:** Mejor para operaciones matemáticas y estadísticas intensivas.
Manejar la Codificación de Caracteres: Cuando trabajes con datos que contienen caracteres especiales o no latinos, asegúrate de manejar correctamente la codificación de caracteres.

In [6]:
# Guardar un archivo CSV con codificación UTF-8
df.to_csv('../data/ventas_utf8.csv', index=False, encoding='utf-8')

# Leer un archivo CSV con codificación UTF-8
df_from_csv_utf8 = pd.read_csv('../data/ventas_utf8.csv', encoding='utf-8')
print(df)
print(df_from_csv_utf8)

   Producto  Ventas  Precio
0  Manzanas      50    0.50
1  Naranjas      30    0.75
2   Bananas      20    0.30
   Producto  Ventas  Precio
0  Manzanas      50    0.50
1  Naranjas      30    0.75
2   Bananas      20    0.30


**Gestión de Archivos Grandes:**

 Para datasets muy grandes, considera usar compresión para ahorrar espacio y mejorar la eficiencia.

In [7]:
# Guardar un archivo CSV comprimido
df.to_csv('../data/ventas_comprimido.csv.gz', index=False, compression='gzip')

# Leer un archivo CSV comprimido
df_from_compressed_csv = pd.read_csv('../data/ventas_comprimido.csv.gz', compression='gzip')
print(df)
print(df_from_csv_utf8)

   Producto  Ventas  Precio
0  Manzanas      50    0.50
1  Naranjas      30    0.75
2   Bananas      20    0.30
   Producto  Ventas  Precio
0  Manzanas      50    0.50
1  Naranjas      30    0.75
2   Bananas      20    0.30


**Documentación y Reproducibilidad:**

 Documenta todos los pasos y parámetros utilizados en la conversión y exportación de datos. Esto es crucial para la reproducibilidad y la transparencia del análisis.

In [8]:
# Ejemplo de documentación en el código
"""
Este script convierte un DataFrame a diferentes formatos y guarda los resultados en archivos.
- DataFrame original: df
- Formatos: diccionario, NumPy array, CSV, JSON, Excel
- Fecha: 01/01/2023
- Autor: Jesús Ortiz
"""

'\nEste script convierte un DataFrame a diferentes formatos y guarda los resultados en archivos.\n- DataFrame original: df\n- Formatos: diccionario, NumPy array, CSV, JSON, Excel\n- Fecha: 01/01/2023\n- Autor: Jesús Ortiz\n'