# Práctica 01: Organización de datos

**Nota**: Se modificó el paso de *renombrar variable* (08/01/2025) para considerar "Close" y "Adj Close" según el caso.

**Objetivo**: En el área de negocios, con frecuencia es necesario analizar datos financieros para comprender el desempeño del mercado o identificar tendencias relevantes. Imagina que trabajas como analista en el área de ventas de una empresa y necesitas evaluar el desempeño financiero de tu principal cliente para anticiparte a riesgos o identificar oportunidades. Tu tarea será descargar datos históricos de precios de una acción desde una fuente confiable y organizarlos en un DataFrame. Luego, calcularás el rendimiento diario con la finalidad de identificar tendencias, medir la estabilidad de su crecimiento y evaluar posibles riesgos financieros.

**Actividades**:

In [None]:
# Importa las bibliotecas necesarias
import pandas as pd
import numpy as np
import yfinance as yf

*Descarga de datos*: Localiza el símbolo (*ticker*) que identifica las acciones de una empresa que cotiza en alguna de las principales bolsas de valores, por ejemplo 'AAPL', 'MSFT', etc. Puedes realizar una búsqueda en https://finance.yahoo.com/. Utiliza la función `download()`de la librería *yfinance* para descargar los datos de esa acción y guardar el resultado en un DataFrame con un nombre descriptivo. El siguiente ejemplo te puede servir como guía sustituyendo 'APPL' por el símbolo de la acción seleccionada:
`df_apple = yf.download('AAPL', period='1mo', interval='1d', progress=False)`.

In [None]:
# Descargar datos


*Renombrar variables*: En algunos casos, además de "Close" se muestra una variable llamada "Adj Close" que corresponde a un precio de cierre ajustado . Versiones recientes de yfinance reemplazan "Adj Close" en el lugar de "Close" a menos que se utilice el argumento `auto_adjust=False`. Entonces:
- Si tu DataFrame incluye la columna "Adj Close", renombra esta variable como "price".
- Si tu DataFrame solo incluye "Close", renombra esta variable como "price".

In [None]:
# Renombrar variable

*Crear nueva variable*: En una nueva columna del DataFrame, calcula el rendimiento simple (R) diario con base en los precios (P) de la acción. El rendimiento simple se define como:  
$$
 R_t = P_t / P_t-1
$$
La función `pct_change()`en Pandas, de manera predeterminada calcula el cambio respecto a la fila anterior; que en este caso equivale al rendimiento simple diario. Utiliza algo similar a:   `df['simple_rtn'] = df['price'].pct_change()`.

In [None]:
# Calcular rendimiento

*Borrar filas con datos perdidos*: El primer renglón siempre mostrará un *not a number* (NaN) porque no hay un precio previo para calcular el rendimiento. Quita el renglón con los valores perdidos.

In [None]:
# Borrar fila con datos perdidos

*Seleccionar columnas*: Reescribe o crea un nuevo dataframe que además de la fecha solo contenga las columnas con el dato del precio de la acción `price` y el rendimiento diario `simple_rtn`.

In [None]:
# Seleccionar columnas

*OPCIONAL: Crear función*: Agrupa los pasos anteriores en una función que descargue los precios históricos de una acción y calcule el rendimiento diario simple. 
- La función debe incluir el parámetro *ticker* para recibir el símbolo de una acción.
- La función debe devolver un DataFrame con las columnas 'price' y 'simple_rtn'.

Ejemplo de uso:
df = descargar_accion('APPL')

In [None]:
# Crear función
def descargar_accion(ticker):
    pass

**Entregable**: Guarda y exporta este notebook en formato html o (o "Imprime" como pdf) y compártelo en la plataforma del curso

### Nota para financieros y economistas
Si estás interesado en calcular el rendimiento logarítmico en vez del rendimiento simple, puedes utilizar lo siguiente:  
`df['log_rtn'] = np.log(df.price/df.price.shift(1))`