## 1. Instalación e importación de librerías

In [None]:
# Solo es necesario ejecutar una vez en la terminal o en una celda con '!'  
!pip install yfinance pandas numpy matplotlib plotly

In [None]:
# Importamos las librerías básicas
import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.express as px


## 2. Descarga de datos con yfinance

In [None]:
# Definimos el ticker y el rango de fechas
tickers = ['NVDA', 'AAPL']
start_date = "2020-01-01"
end_date = "2022-12-31"

# Descarga de datos diarios
dataframe = yf.download(tickers, start=start_date, end=end_date, auto_adjust=True)

# Primer vistazo
dataframe.head()


In [None]:
# Elegimos la columna que queramos (preci ajustado)
adj_close = dataframe['Close']

adj_close.head()

## 3. Limpieza de datos

- Revisamos si hay valores faltantes

- Ajustamos tipos de dato

- Reindexamos si es necesario

In [None]:
# 3.1 Detectar valores nulos
print("Valores nulos por columna:")
print(adj_close.isna().sum())

Recordemos que df_clean = df.copy() crea una copia nueva y la guarda en la variable de antes del igual.

Hay2 formas de eliminar valores faltantes:
- Por filas: (para eliminar días problemáticos)
    - df.dropna(axis=0, how='ANY')

        elimina todos los valores de la fila si hay CUALQUIER valor NaN (nulo)

    - df.dropna(axis=0, how='ALL')

        elimina todos los valores de la fila si TODOS son NaN (nulo)
        
- Por columnas: (para eliminar activos problemáticos)
    - df.dropna(axis=1, how='ANY')

        elimina todos los valores de la columna si hay CUALQUIER valor NaN (nulo)

    - df.dropna(axis=1, how='ALL')

        elimina todos los valores de la columna si TODOS son NaN (nulo)

- En la función dropna hay otros 2 argumentos que nos pueden interesar:
    - inplace=, True si queremos que la limpieza se haga en el mismo dataframe
    - thresh=, para establecer el número mínimo de valores nulos que tiene que haber para que se elimine la fila o columna en cuestión

In [None]:
# 3.2 Eliminar nulos (si los hubiese)
adj_close_clean = adj_close.dropna(axis=0, how='ANY')


In [None]:
# 3.3 Indexar por fecha como DatetimeIndex
adj_close_clean.index = pd.to_datetime(adj_close_clean.index)

adj_close_clean.info()

## 4. Slicing con condicionales

In [None]:
# Extraer datos del año 2021
# TO-DO

In [None]:
# Días con cierre por encima de los 150 USD
# TO-DO


In [None]:
# Días con cierre por encima de los 150 USD para cualquiera de las acciones
# TO-DO

## 5. Visualización

In [None]:
plt.figure(figsize=(10, 5))
plt.plot(df_clean.index, df_clean['AAPL'], color='tab:blue', lw=1.5, label='AAPL')
plt.plot(df_clean.index, df_clean['NVDA'], color='tab:orange', lw=1.5, label='NVDA')
plt.title('Precio de Cierre de AAPL y NVDA (2020–2022)')
plt.xlabel('Fecha')
plt.ylabel('USD')
plt.grid(alpha=0.3)
plt.legend()
plt.show()


In [None]:
plt.figure(figsize=(8, 4))
plt.hist(df_clean['AAPL'], bins=50, color='tab:green', edgecolor='pink', label='AAPL')
plt.title('Distribución de Close Diario')
plt.xlabel('Close')
plt.ylabel('Frecuencia')
plt.legend()
plt.show()