#Cargar y visualizar datos con Pandas (CSV, Google Sheets y Excel)

### Objetivos

* Cargar y visualizar archivos CSV, Google Sheets y Excel en Google Colab usando Pandas.

* Practicar operaciones básicas de inspección y visualización de datos.

### ¿Qué vamos a hacer?

* Cargar ventas.csv (subido manualmente al entorno de Colab) y ver sus primeras filas.

* Cargar una planilla de Google Sheets a partir de su URL y ver sus primeras filas.

* Cargar prueba.xlsx (subido manualmente al entorno de Colab) y ver sus primeras filas.

* (Bonus) Visualizaciones básicas aplicables a cualquier DataFrame.

> Tip: en Colab podés subir archivos con el ícono de carpeta (panel izquierdo) o con files.upload().

## Preparación del entorno

Antes de trabajar con archivos de datos, vamos a importar las librerías que usaremos en este cuaderno:

- **Pandas**: para cargar, manipular y visualizar datos en tablas (DataFrames).
- **Matplotlib**: para realizar gráficos sencillos.
- **Pathlib**: para manejar rutas de archivos de forma más clara.

Además, configuramos algunas opciones para que las tablas se vean completas en Colab.


In [1]:
import pandas as pd
from pathlib import Path

# Opciones de display para que se vea cómodo en Colab
pd.set_option("display.max_rows", 20)
pd.set_option("display.max_columns", 50)
pd.set_option("display.width", 120)

print("Pandas versión:", pd.__version__)

Pandas versión: 2.2.2


## Planillas propias o compartidas (con autenticación en Drive)

Una manera de trabajar con Google Sheets en Colab es conectar nuestro cuaderno
directamente con **Google Drive**.

Ventajas:
- No hace falta que la hoja sea pública.
- Se puede acceder a hojas que son **propias** o que nos han compartido (con acceso de lectura o edición).

¿Cómo funciona?
1. Colab nos pedirá autenticarnos con nuestra cuenta de Google.
2. Con la librería **gspread** abrimos la hoja usando su URL.
3. Obtenemos todos los registros y los convertimos en un DataFrame de Pandas.


In [2]:
# Paso 1: instalar gspread si no está
!pip install -q gspread

# Paso 2: autenticación en Google
from google.colab import auth
auth.authenticate_user()

import gspread
from google.auth import default

creds, _ = default()
gc = gspread.authorize(creds)

# Paso 3: abrir la hoja por URL
url_hoja = "https://docs.google.com/spreadsheets/d/1E12NQu4FLqayQx8fAi7ofW-5ZhyejZI8zKUTIH5QGhM/edit?usp=drive_link"
hoja = gc.open_by_url(url_hoja)

# Paso 4: seleccionar la primera hoja
worksheet = hoja.sheet1

# Paso 5: traer datos
datos = worksheet.get_all_records()

df_sheet = pd.DataFrame(datos)
print("Tamaño del DataFrame:", df_sheet.shape)
display(df_sheet.head())

Tamaño del DataFrame: (954, 5)


Unnamed: 0,Fecha,Vendedor,Sede Entrega,Producto,Importe
0,06/11/2020,Vendedor 10,Sede D,Producto Z,$75880.72
1,01/10/2021,Vendedor 10,Sede D,Producto Y,$279412.05
2,09/05/2021,Vendedor 4,Sede A,Producto W,
3,07/10/2021,Vendedor 3,Sede D,Producto U,$33830.98
4,02/08/2021,Vendedor 3,Sede C,Producto U,$205706.84


In [3]:
# CSV

ruta = Path("ventas.csv")
import pandas as pd

# Compartido solo lectura para cualquiera con el enlace
url = "https://drive.google.com/uc?id=1nmLR_eFjee81kQqgdsjLVGsOIfll3zFt"
df = pd.read_csv(url)

# Visualizar las primeras filas
print(df.head())

        Fecha     Vendedor Sede Entrega    Producto     Importe
0  06/11/2020  Vendedor 10       Sede D  Producto Z   $75880.72
1  01/10/2021  Vendedor 10       Sede D  Producto Y  $279412.05
2  09/05/2021   Vendedor 4       Sede A  Producto W         NaN
3  07/10/2021   Vendedor 3       Sede D  Producto U   $33830.98
4  02/08/2021   Vendedor 3       Sede C  Producto U  $205706.84
