# Trabajando con Diferentes Formatos de Archivo en Python

En este video, aprenderás a:
1. Definir diferentes formatos de archivo como CSV, XML y JSON.
2. Escribir programas simples para leer y generar datos en estos formatos.
3. Enumerar qué bibliotecas de Python se necesitan para extraer datos.

## Tipos de Archivos

Cuando trabajas con datos, es común encontrarse con diferentes formatos de archivo. Cada tipo de archivo tiene una extensión que indica su formato. Ejemplos comunes incluyen:
- `.csv` (Comma-Separated Values)
- `.json` (JavaScript Object Notation)
- `.xml` (Extensible Markup Language)

## Bibliotecas de Python para Archivos

Python facilita el trabajo con estos formatos mediante el uso de bibliotecas. Las principales bibliotecas que cubriremos son:
- **Pandas**: Para archivos CSV.
- **json**: Para archivos JSON.
- **xml.etree.ElementTree**: Para archivos XML.

### Leer Archivos CSV con Pandas

El formato CSV es ampliamente utilizado para datos tabulares. La biblioteca **Pandas** simplifica la lectura y escritura de archivos CSV.


In [2]:
import pandas as pd

# Leer archivo CSV
df = pd.read_csv('Largest_economies.csv', header=None)

# Asignar encabezados de columna
df.columns = ['Columna1', 'Columna2', 'Columna3']

# Mostrar datos
print(df)


    Columna1        Columna2           Columna3
0        NaN         Country  GDP (Billion USD)
1        1.0   United States            26855.0
2        2.0           China            19374.0
3        3.0           Japan             4410.0
4        4.0         Germany             4309.0
5        5.0           India             3737.0
6        6.0  United Kingdom             3159.0
7        7.0          France             2923.0
8        8.0           Italy             2170.0
9        9.0          Canada             2090.0
10      10.0          Brazil             2081.0


## Leer Archivos JSON
Los archivos JSON se utilizan para representar datos en formato de texto estructurado, similar a los diccionarios de Python. La biblioteca estándar `json` se encarga de la lectura y escritura de archivos JSON.

- Primero y solo para este ejemplo transformresmos nuestro csv en un json. no lo utilizaremos despues

In [3]:
import pandas as pd

# Leer el archivo CSV
df = pd.read_csv('Largest_economies.csv')

# Convertir el DataFrame a JSON
json_data = df.to_json(orient='records', lines=True)

# Guardar el JSON en un archivo
with open('archivo.json', 'w') as json_file:
    json_file.write(json_data)
    


print("Conversión completa: CSV a JSON.")


Conversión completa: CSV a JSON.


In [5]:
import json

# Leer archivo JSON
with open('archivo.json', 'r') as file:
    data = json.load(file)

# Mostrar datos
print(data)


JSONDecodeError: Extra data: line 2 column 1 (char 71)

## Leer Archivos XML
Los archivos XML son documentos de texto que usan etiquetas para definir datos. La biblioteca `xml.etree.ElementTree` permite analizar y extraer datos de archivos XML.

In [None]:
import xml.etree.ElementTree as ET

# Analizar archivo XML
tree = ET.parse('FileExample.xml')
root = tree.getroot()

# Extraer datos
for element in root.findall('.//Tag'):
    print(element.text)


## Resumen
En este video, has aprendido a:

- Reconocer diferentes tipos de archivos.
- Utilizar bibliotecas de Python para extraer datos.
- Usar DataFrames de Pandas para organizar datos tabulares.

Estos métodos y bibliotecas simplifican el proceso de manejo y análisis de datos en diversos formatos, facilitando la integración y el procesamiento de datos en tus proyectos.