## Importación de Datos Financieros con Yahoo Finance en Python

El análisis financiero comienza frecuentemente con la obtención de datos históricos de activos financieros. Yahoo Finance es una fuente confiable y popular que proporciona datos como precios de apertura, cierre, máximos, mínimos, volumen y precios ajustados.

La biblioteca `yfinance` simplifica el proceso de descarga de estos datos de manera eficiente. A continuación, se presenta un ejemplo práctico para descargar los datos históricos de Apple (AAPL) entre el 1 de enero de 2020 y el 1 de enero de 2024:



In [15]:
# Importar la biblioteca yfinance
import yfinance as yf

# Definir las variables para el análisis
ticker = "AAPL"            # Símbolo del activo (Apple)
start_date = "2020-01-01"  # Fecha de inicio
end_date = "2024-01-01"    # Fecha de fin

# Descargar datos históricos usando las variables definidas
data = yf.download(
    ticker,                # Símbolo del activo
    start=start_date,      # Fecha de inicio
    end=end_date,          # Fecha de fin
    progress=True          # Mostrar barra de progreso durante la descarga
)

# Mostrar las primeras filas del conjunto de datos
data.head()

[*********************100%***********************]  1 of 1 completed


Price,Adj Close,Close,High,Low,Open,Volume
Ticker,AAPL,AAPL,AAPL,AAPL,AAPL,AAPL
Date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
2020-01-02,72.796028,75.087502,75.150002,73.797501,74.059998,135480400
2020-01-03,72.08831,74.357498,75.144997,74.125,74.287498,146322800
2020-01-06,72.662697,74.949997,74.989998,73.1875,73.447502,118387200
2020-01-07,72.320976,74.597504,75.224998,74.370003,74.959999,108872000
2020-01-08,73.484344,75.797501,76.110001,74.290001,74.290001,132079200


Este comando genera un DataFrame con las siguientes columnas:

- **Open:** Precio de apertura.
- **High:** Precio máximo.
- **Low:** Precio mínimo.
- **Close:** Precio de cierre.
- **Adj Close:** Precio ajustado (considera dividendos y splits).
- **Volume:** Número de acciones negociadas.


In [16]:
print(data.columns)

MultiIndex([('Adj Close', 'AAPL'),
            (    'Close', 'AAPL'),
            (     'High', 'AAPL'),
            (      'Low', 'AAPL'),
            (     'Open', 'AAPL'),
            (   'Volume', 'AAPL')],
           names=['Price', 'Ticker'])


El comando `print(data.columns)` muestra las columnas del DataFrame generado.

En las versiones más recientes de `yfinance`, las columnas pueden venir organizadas en **dos dimensiones** (índice jerárquico o `MultiIndex`), lo que puede complicar el acceso a los datos.

Para resolver este problema y trabajar con columnas de una sola dimensión, puedes usar el siguiente comando:

```python
# Eliminar el segundo nivel del índice jerárquico (MultiIndex) en las columnas
data.columns.droplevel(1)



In [17]:
data.columns.droplevel(1)

Index(['Adj Close', 'Close', 'High', 'Low', 'Open', 'Volume'], dtype='object', name='Price')

### Simplificación de los nombres de columnas

Dado que las columnas actuales tienen un índice jerárquico (`MultiIndex`), podemos simplificar los nombres eliminando el segundo nivel (`Ticker`) y dejando solo los nombres relacionados con los precios. Esto lo logramos con el siguiente comando:


In [19]:
# Simplificar los nombres de las columnas eliminando el segundo nivel del MultiIndex
data.columns = data.columns.droplevel(1)

# Mostrar las primeras filas del DataFrame con las columnas simplificadas
data.head()


Price,Adj Close,Close,High,Low,Open,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2020-01-02,72.796028,75.087502,75.150002,73.797501,74.059998,135480400
2020-01-03,72.08831,74.357498,75.144997,74.125,74.287498,146322800
2020-01-06,72.662697,74.949997,74.989998,73.1875,73.447502,118387200
2020-01-07,72.320976,74.597504,75.224998,74.370003,74.959999,108872000
2020-01-08,73.484344,75.797501,76.110001,74.290001,74.290001,132079200
