# Leer archivos Excel desde Databricks (Volume y SharePoint)

En este notebook vemos cómo leer archivos **Excel (.xlsx)** en Databricks usando:

1. Soporte nativo de Excel en Spark
2. Lakeflow Connect para SharePoint

Ejemplo pensado para POCs y demos reproducibles.

In [None]:
# Configuración
CONNECTOR_NAME = "<NOMBRE_DE_LA_CONNECTION>"

EXCEL_URL = (
    "https://hablandodedata.sharepoint.com/sites/<SITE_NAME>/"
    "Shared%20Documents/<RUTA>/demo.xlsx"
)

LOCAL_EXCEL_PATH = "/Volumes/<catalog>/<schema>/<volume>/demo.xlsx"

## Opción A — Leer Excel desde un Volume

In [None]:
df_volume = (
    spark.read
        .format("excel")
        .option("headerRows", 1)
        .load(LOCAL_EXCEL_PATH)
)

display(df_volume)

## Opción B — Leer Excel directamente desde SharePoint (Lakeflow Connect)

In [None]:
df_sharepoint = (
    spark.read
        .format("excel")
        .option("databricks.connection", CONNECTOR_NAME)
        .option("headerRows", 1)
        .load(EXCEL_URL)
)

display(df_sharepoint)

## Guardar resultado en Delta (opcional)

In [None]:
(df_sharepoint
    .write
    .mode("overwrite")
    .format("delta")
    .saveAsTable("demo.excel_from_sharepoint")
)

## Notas finales

- Usar Secret Scopes para credenciales.
- Minimizar permisos en Microsoft Graph.
- Ideal para integrarse luego con DLT o Jobs.