[![Abrir en Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/adan-rs/amd/blob/main/practicas/Practica_1b.ipynb)

# Práctica 1b: Análisis exploratorio de datos
## Enfoque en preparación y criterio cuantitativo

**Objetivo**: En el área de negocios, con frecuencia es necesario analizar datos financieros para comprender el desempeño del mercado o identificar tendencias relevantes. Imagina que trabajas como analista en el área de ventas de una empresa y necesitas evaluar el desempeño financiero de tu principal cliente para anticiparte a riesgos o identificar oportunidades. Tu tarea será descargar datos históricos de precios de una acción desde una fuente confiable y organizarlos en un DataFrame. Luego, calcularás el rendimiento diario con la finalidad de identificar tendencias, medir la estabilidad de su crecimiento y evaluar posibles riesgos financieros.

**Actividades**:

In [None]:
# Importa las bibliotecas necesarias
import pandas as pd
import numpy as np
import yfinance as yf

*Descarga de datos*: Localiza el símbolo (*ticker*) que identifica las acciones de una empresa que cotiza en alguna de las principales bolsas de valores, por ejemplo 'AAPL', 'MSFT', etc. Puedes realizar una búsqueda en https://finance.yahoo.com/. Utiliza la función `download()`de la librería *yfinance* para descargar los datos de esa acción y guardar el resultado en un DataFrame con un nombre descriptivo. El siguiente ejemplo te puede servir como guía sustituyendo 'AAPPL' por el símbolo de la acción seleccionada:  
`df_accion = yf.download('AAPL', period='1mo', interval='1d', auto_adjust=True, progress=False)`.  


Importante: debe ser **otra acción** diferente a AAPL

In [None]:
# Descargar datos


In [None]:
# Inspecciona los datos


*Nota importante (MultiIndex en columnas):* en algunas versiones de `yfinance`, aunque descargues *un solo ticker*, el DataFrame puede venir con *MultiIndex* en las columnas (por ejemplo, nivel `Price` y nivel `Ticker`). Si te sucede y `Ticker` está en el segundo nivel, aplana las columnas con:
`df_accion.columns = df_accion.columns.droplevel(1)`

In [None]:
# Si es necesario, quita un nivel en las columnas 


*Renombrar variables*: 
Dependiendo de cómo se descarguen los datos con yfinance, el DataFrame puede contener:
- Close: precio de cierre no ajustado
- Adj Close: precio de cierre ajustado por dividendos y splits

Si se utiliza el argumento `auto_adjust=True`, yfinance elimina la columna Adj Close y ajusta automáticamente los precios, por lo que Close ya representa el precio ajustado.

Para estandarizar el análisis, define una sola columna llamada price:
- Si existe Adj Close, renómbrala como `price`.
- En caso contrario, renombra Close como `price`.

In [None]:
# Renombrar variable


*Crear nueva variable*: En una nueva columna del DataFrame, calcula el rendimiento simple (R) diario con base en los precios (P) de la acción. El rendimiento simple se define como:  
$$
r_t = \frac{P_t}{P_{t-1}} - 1
$$

En Pandas, `pct_change()` calcula justamente ese rendimiento (cambio porcentual respecto a la fila anterior). Utiliza algo similar a:

```python
df_accion['simple_rtn'] = df_accion['price'].pct_change()
```

*Nota para interesados en finanzas*:
Si estás interesado en calcular el rendimiento logarítmico en vez del rendimiento simple, puedes utilizar lo siguiente:  
`df['log_rtn'] = np.log(df.price/df.price.shift(1))`

In [None]:
# Calcular rendimiento


*Borrar filas con datos perdidos*: El primer renglón siempre mostrará un *not a number* (NaN) porque no hay un precio previo para calcular el rendimiento. Quita el renglón con los valores perdidos.

In [None]:
# Borrar fila con datos perdidos


*Seleccionar columnas*: Reescribe o crea un nuevo dataframe que además de la fecha solo contenga las columnas con el dato del precio de la acción `price` y el rendimiento diario `simple_rtn`.

In [None]:
# Seleccionar columnas


*Crear función*: Agrupa los pasos anteriores en una función que descargue los precios históricos de una acción y calcule el rendimiento diario simple.

Requisitos:
- La función debe incluir el parámetro `ticker` para recibir el símbolo de una acción.
- La función debe estandarizar el resultado para que, aunque `yfinance` devuelva columnas con MultiIndex, al final exista una columna `price`.
- La función debe devolver un DataFrame con las columnas `price` y `simple_rtn`.

Por ejemplo, que se pueda ejecutar lo siguiente:

```python
df = descargar_accion('AAPPL')
df
```

In [None]:
# Crear función
def descargar_accion(ticker):
    pass

*Visualización de la serie de tiempo:*
Con la información preparada, genera un gráfico de línea que muestre la evolución del precio (price) de la acción a lo largo del tiempo.

El gráfico debe:
- Utilizar la fecha como eje horizontal.
- Utilizar el precio (price) como eje vertical.
- Incluir un título descriptivo.
- Etiquetar adecuadamente ambos ejes.

Utiliza matplotlib o pandas para crear el gráfico.  
Sugerencia: si el índice del DataFrame es la fecha, puedes usar directamente el método `.plot()` de Pandas.

In [None]:
# Crea una visualización


Con base en el gráfico y los rendimientos calculados, describe brevemente el comportamiento general del precio durante el periodo analizado.

## Uso de IA Generativa (para profundizar)

Se espera que utilices una herramienta de IA Generativa (por ejemplo, ChatGPT, Copilot, Claude, Gemini u otra similar) no para resolver directamente la práctica, sino para **ir más allá de lo que se pide**.

Puedes usarla para:
- Explorar interpretaciones adicionales de los resultados.
- Proponer visualizaciones alternativas o métricas complementarias.
- Reflexionar sobre posibles extensiones del análisis.

Comparte el *prompt* utilizado y la respuesta o resultado obtenido.




## Entregable
Guarda y exporta este notebook en formato html o (o "Imprime" como pdf) y compártelo en la plataforma del curso.

## Rúbrica
- *Preparación y calidad de datos (20%)*: inspección inicial, manejo de datos faltantes, coherencia de los datos, estructura adecuada para un análisis.
- *Uso de medidas numéricas y transformaciones (20%)*: uso de medidas descriptivas, creación de variables o correcciones conceptuales
- *Visualización y comunicación gráfica (20%)*: visualizaciones adecuadas al objetivo.
- *Criterio analítico y justificación (20%)*: decisiones razonadas y criterios explícitos.
- *Extensión del análisis con IA Generativa (20%)*: uso de la IA para ir más allá de lo solicitado, mediante un prompt que muestre una reflexión crítica de los objetivos.
