# Carga de Datos en Python

## Introducción

En este notebook, exploraremos diferentes formas de cargar datos en Python utilizando varias bibliotecas populares. Cubriremos:

1. Carga de datos desde archivos CSV
2. Carga de datos desde archivos Excel
3. Carga de datos desde archivos JSON
4. Carga de datos desde bases de datos SQL
5. Carga de datos desde una API

Para cada método, proporcionaremos ejemplos de código y explicaciones detalladas.

## 1. Carga de datos desde archivos CSV

El formato CSV (Comma Separated Values) es uno de los formatos más comunes para almacenar datos tabulares. Utilizaremos la biblioteca `pandas` para cargar datos desde un archivo CSV.




In [None]:
## Con este procedimiento habilitamos el Drive para carga de archivos
from google.colab import drive
drive.mount('/content/drive')

MessageError: Error: credential propagation was unsuccessful

In [None]:
# Importamos la biblioteca pandas
import pandas as pd

# Cargamos el archivo CSV
data_csv = pd.read_csv('sample_data/california_housing_test.csv')

# Mostramos las primeras filas del DataFrame
print(data_csv.head())

   longitude  latitude  housing_median_age  total_rooms  total_bedrooms  \
0    -122.05     37.37                27.0       3885.0           661.0   
1    -118.30     34.26                43.0       1510.0           310.0   
2    -117.81     33.78                27.0       3589.0           507.0   
3    -118.36     33.82                28.0         67.0            15.0   
4    -119.67     36.33                19.0       1241.0           244.0   

   population  households  median_income  median_house_value  
0      1537.0       606.0         6.6085            344700.0  
1       809.0       277.0         3.5990            176500.0  
2      1484.0       495.0         5.7934            270500.0  
3        49.0        11.0         6.1359            330000.0  
4       850.0       237.0         2.9375             81700.0  


In [None]:
type(data_csv)

In [None]:
## Filas y columnas de nuestro dataframe
data_csv.shape

(3000, 9)

## 2. Carga de datos desde archivos Excel

Los archivos Excel son muy populares para almacenar y compartir datos. Utilizaremos `pandas` para cargar datos desde un archivo Excel.



In [None]:
# Cargamos el archivo Excel
data_excel = pd.read_excel('/content/Libro2.xlsx', sheet_name='Hoja1')

# Mostramos las primeras filas del DataFrame
print(data_excel.head())

  Unnamed: 0  columna1  columna2  columna3
0      fila1         1         2         5
1      fila2         3         4         6
2      fila3         7         8         9


In [None]:
type(data_excel)

## 3. Carga de datos desde archivos JSON

El formato JSON (JavaScript Object Notation) es muy utilizado para intercambiar datos entre servidores y aplicaciones web. Utilizaremos `pandas` para cargar datos desde un archivo JSON.

In [None]:
# Importamos la biblioteca pandas
import pandas as pd

# Cargamos el archivo JSON
data_json = pd.read_json('ruta/al/archivo.json')

# Mostramos las primeras filas del DataFrame
print(data_json.head())

## 4. Carga de datos desde bases de datos SQL

Las bases de datos SQL son muy comunes para almacenar grandes volúmenes de datos estructurados. Utilizaremos `pandas` junto con `sqlalchemy` para cargar datos desde una base de datos SQL.

In [None]:
# Importamos las bibliotecas pandas y sqlalchemy
import pandas as pd
from sqlalchemy import create_engine

# Creamos la conexión a la base de datos
engine = create_engine('mysql+pymysql://usuario:contraseña@host:puerto/nombre_base_de_datos')

# Ejecutamos una consulta SQL y cargamos los datos en un DataFrame
data_sql = pd.read_sql('SELECT * FROM nombre_tabla', con=engine)

# Mostramos las primeras filas del DataFrame
print(data_sql.head())


## 5. Carga de datos desde una API

Las APIs (Application Programming Interfaces) son interfaces que permiten la comunicación entre diferentes aplicaciones. Utilizaremos `requests` para hacer una solicitud a una API y cargar los datos en un DataFrame utilizando `pandas`.

In [None]:
# Importamos las bibliotecas requests y pandas
import requests
import pandas as pd

# Hacemos una solicitud GET a la API
response = requests.get('https://api.example.com/data')

# Convertimos los datos JSON a un DataFrame
data_api = pd.DataFrame(response.json())

# Mostramos las primeras filas del DataFrame
print(data_api.head())


## Conclusión

En este notebook, hemos explorado varias formas de cargar datos en Python utilizando diferentes fuentes y formatos. El uso de la biblioteca `pandas` facilita enormemente la carga y manipulación de datos en Python.

### Referencias
- [Pandas Documentation](https://pandas.pydata.org/pandas-docs/stable/)
- [SQLAlchemy Documentation](https://docs.sqlalchemy.org/en/14/)
- [Requests Documentation](https://docs.python-requests.org/en/latest/)