<a href="https://colab.research.google.com/github/RAFS20/Mongo_DB/blob/main/Ejemplo_Mongo_Time_Series.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Análisis de Series Temporales Utilizando Datos de Yahoo Finance y MongoDB

En este tutorial, se aplica a través de los pasos para realizar un análisis de series temporales utilizando datos de Yahoo Finance y una base de datos de MongoDB en Python. En este ejemplo, ampliaremos el análisis incluyendo el cálculo de rendimientos diarios y la construcción de una media móvil de 50 días.

## 1. Instalación de Bibliotecas

La primera línea del código es una instrucción para instalar varias bibliotecas necesarias para el proyecto. Veamos cada una de estas bibliotecas y su utilidad:

### a. yfinance

```bash
pip install yfinance
```

- **yfinance** es una biblioteca de Python que proporciona una interfaz sencilla para acceder a datos financieros y económicos de Yahoo Finance. Permite descargar datos históricos de acciones, índices, divisas, bonos y más. Es una herramienta esencial para obtener información financiera actualizada y realizar análisis.

### b. pymongo

```bash
pip install pymongo
```

- **pymongo** es la biblioteca oficial de Python para trabajar con MongoDB, un sistema de gestión de bases de datos NoSQL orientado a documentos. Permite conectarse a una base de datos MongoDB, insertar, consultar y manipular datos. En este proyecto, se utilizará para almacenar los datos financieros descargados en una base de datos.

### c. pandas

```bash
pip install pandas
```

- **pandas** es una biblioteca de análisis de datos en Python. Proporciona estructuras de datos y herramientas para trabajar con datos tabulares, como DataFrames, que son muy útiles para manipular y analizar datos financieros. pandas facilita la limpieza, transformación y análisis de datos.

### d. matplotlib

```bash
pip install matplotlib
```

- **matplotlib** es una biblioteca de Python ampliamente utilizada para crear gráficos y visualizaciones. Es especialmente útil para representar datos financieros en gráficos de líneas, barras, histogramas y más. En este proyecto, se empleará para visualizar los precios de las acciones y otros datos relacionados.

Habiendo instalado estas bibliotecas, el código estará listo para ser ejecutado.

## 2. Importación de Bibliotecas y Módulos

```python
import yfinance as yf
import pymongo
from pymongo import MongoClient
import pandas as pd
import matplotlib.pyplot as plt
```

En esta sección, se importan todas las bibliotecas y módulos que se utilizarán en el código. Veamos cada uno de ellos:

### a. `yfinance as yf`

- **yfinance** se importa bajo el alias **yf**. Esto permite utilizar las funciones y métodos de **yfinance** utilizando el prefijo **yf.**. Por ejemplo, más adelante en el código, veremos cómo se usa para descargar datos de Yahoo Finance.

### b. `pymongo`

- **pymongo** es importado directamente. Se utilizará para conectarse a una base de datos MongoDB y realizar operaciones relacionadas con la base de datos.

### c. `from pymongo import MongoClient`

- Desde **pymongo**, importamos la clase **MongoClient**, que es esencial para establecer la conexión con la base de datos MongoDB.

### d. `import pandas as pd`

- **pandas** se importa bajo el alias **pd**, que es una convención común en la comunidad de programación de Python. Esto facilita la referencia a funciones y objetos de pandas.

### e. `import matplotlib.pyplot as plt`

- **matplotlib.pyplot** se importa bajo el alias **plt**, lo que es una convención común para simplificar el código al crear gráficos y visualizaciones.

Ahora que hemos importado todas las bibliotecas y módulos necesarios, podemos comenzar a analizar el código paso a paso.

## 3. Conexión a la Base de Datos MongoDB

```python
# Conecta a la base de datos de MongoDB
client = MongoClient('localhost', 27017)
db = client['finance_data']  # Cambia 'finance_data' al nombre de tu base de datos
collection_name = 'stock_data'  # Cambia al nombre de la colección donde almacenaste los datos
```

En esta sección del código, se establece la conexión a una base de datos MongoDB local. Aquí se explica cada parte:

### a. `MongoClient('localhost', 27017)`

- Se crea un objeto **MongoClient** que representa la conexión a la base de datos MongoDB. El primer argumento ('localhost') es la dirección del servidor de MongoDB, que en este caso es el servidor local. El segundo argumento (27017) es el puerto por defecto

 de MongoDB.

### b. `db = client['finance_data']`

- Se selecciona la base de datos a la que se accederá mediante el cliente MongoDB. En este ejemplo, la base de datos se denomina 'finance_data'. Debes cambiar esta cadena al nombre de tu propia base de datos si es diferente.

### c. `collection_name = 'stock_data'`

- Se establece el nombre de la colección dentro de la base de datos donde se almacenarán los datos financieros descargados. En este caso, la colección se llama 'stock_data'. De nuevo, debes cambiar este valor si utilizas un nombre diferente para tu colección.

La conexión a la base de datos MongoDB está lista, y ahora podemos proceder a descargar los datos financieros de Yahoo Finance.

## 4. Descarga de Datos de Yahoo Finance

```python
# Descarga datos de Yahoo Finance
def download_stock_data(ticker, start_date, end_date):
    data = yf.download(ticker, start=start_date, end=end_date)
    return data
```

En esta sección, se define una función llamada `download_stock_data` que descargará los datos históricos de una acción específica desde Yahoo Finance. Veamos cómo funciona:

### a. `def download_stock_data(ticker, start_date, end_date):`

- Se define una función llamada `download_stock_data` que toma tres argumentos:
  - `ticker`: El símbolo del ticker de la acción que deseamos descargar, por ejemplo, 'AAPL' para Apple Inc.
  - `start_date`: La fecha de inicio desde la cual queremos descargar datos históricos.
  - `end_date`: La fecha de finalización hasta la cual queremos descargar datos históricos.

### b. `data = yf.download(ticker, start=start_date, end=end_date)`

- Utilizamos la función `yf.download` de la biblioteca **yfinance** para descargar los datos financieros. Los argumentos `ticker`, `start`, y `end` se pasan a esta función para especificar la acción, la fecha de inicio y la fecha de finalización de los datos que deseamos.

### c. `return data`

- La función devuelve los datos descargados en forma de un DataFrame de pandas llamado `data`. Un DataFrame es una estructura de datos tabular que facilita la manipulación y análisis de datos.

Hemos definido la función para descargar los datos, pero aún no la hemos llamado. La llamada a esta función se realizará más adelante en el código.

## 5. Almacenamiento de Datos en MongoDB

```python
# Almacena los datos en MongoDB
def store_data_in_mongodb(data, collection_name):
    collection = db[collection_name]
    collection.insert_many(data.to_dict('records'))
```

En esta sección, se define una función llamada `store_data_in_mongodb` que se utilizará para almacenar los datos descargados en MongoDB. Vamos a examinarla en detalle:

### a. `def store_data_in_mongodb(data, collection_name):`

- Se define una función llamada `store_data_in_mongodb` que toma dos argumentos:
  - `data`: Los datos financieros que deseamos almacenar en la base de datos. Estos datos deben estar en forma de un DataFrame de pandas.
  - `collection_name`: El nombre de la colección en la base de datos donde se almacenarán los datos.

### b. `collection = db[collection_name]`

- Se obtiene una referencia a la colección en la base de datos MongoDB donde se almacenarán los datos. La colección se especifica utilizando el argumento `collection_name`.

### c. `collection.insert_many(data.to_dict('records'))`

- Se utiliza el método `insert_many` para agregar los datos al conjunto de documentos en la colección de MongoDB. La función `to_dict('records')` se aplica al DataFrame `data` para convertirlo en una lista de diccionarios, donde cada diccionario representa un documento que se almacenará en la base de datos.

Hasta este punto, hemos definido las funciones necesarias para descargar datos y almacenarlos en MongoDB. Ahora, procederemos a la descarga real de los datos y su almacenamiento en la base de datos.

## 6. Descarga de Datos y Almacenamiento en MongoDB

```python
if __name__ == "__main__":
    ticker = 'AAPL'  # Cambia el símbolo del ticker a la acción que desees analizar
    start_date = '2020-01-01'
    end_date = '2023-09-15'

    stock_data = download_stock_data(ticker, start_date, end_date)
    store_data_in_mongodb(stock_data, collection_name)
```

Esta sección del código es el punto de entrada principal del programa y es donde se ejecutan las operaciones de descarga y almacenamiento de datos. Aquí se detallan las acciones realizadas:

### a. `if __name__ == "__main__":`

- Esta línea verifica si el script se está ejecutando como un programa principal y no como un módulo importado. Si se está ejecutando como programa principal, se procede a ejecutar el código dentro de este bloque.

### b. `ticker = 'AAPL'`

- Se define el símbolo del ticker de la acción que se desea analizar. En este caso, se utiliza 'AAPL' para Apple Inc. Puedes cambiar

 este valor al símbolo de la acción que desees analizar.

### c. `start_date = '2020-01-01'`

- Se especifica la fecha de inicio desde la cual se descargarán los datos históricos. En este ejemplo, se establece en el 1 de enero de 2020.

### d. `end_date = '2023-09-15'`

- Se establece la fecha de finalización hasta la cual se descargarán los datos históricos. En este caso, se fija 2023-09-15.

### e. `stock_data = download_stock_data(ticker, start_date, end_date)`

- Se llama a la función `download_stock_data` que definimos previamente, pasando los argumentos `ticker`, `start_date`, y `end_date`. Esto descarga los datos de Yahoo Finance y los almacena en el DataFrame `stock_data`.

### f. `store_data_in_mongodb(stock_data, collection_name)`

- Luego de descargar los datos, se llama a la función `store_data_in_mongodb` para almacenarlos en la base de datos MongoDB. Los datos almacenados estarán en la colección cuyo nombre se especifica en `collection_name`.

Hasta este punto, hemos logrado descargar datos de Yahoo Finance y almacenarlos en una base de datos MongoDB. Sin embargo, esto es solo el comienzo del análisis de series temporales. En la siguiente sección del código, continuaremos con el análisis de los datos descargados.

## 7. Recuperación de Datos de MongoDB

```python
# Recupera los datos de MongoDB y los convierte a un DataFrame de Pandas
def retrieve_data_from_mongodb(collection_name):
    collection = db[collection_name]
    cursor = collection.find()
    data = list(cursor)
    df = pd.DataFrame(data)
    return df
```

En esta sección, se define una función llamada `retrieve_data_from_mongodb` que se utilizará para recuperar los datos almacenados en MongoDB y convertirlos en un DataFrame de Pandas. Aquí se explican los detalles:

### a. `def retrieve_data_from_mongodb(collection_name):`

- Se define una función llamada `retrieve_data_from_mongodb` que toma un argumento: `collection_name`, que es el nombre de la colección en la base de datos de la cual se recuperarán los datos.

### b. `collection = db[collection_name]`

- Se obtiene una referencia a la colección especificada en `collection_name` en la base de datos MongoDB.

### c. `cursor = collection.find()`

- Se utiliza el método `find` en la colección para obtener un cursor que permite recorrer todos los documentos (registros) en la colección. Un cursor es una estructura que se utiliza para iterar a través de los documentos de una colección.

### d. `data = list(cursor)`

- Se itera a través del cursor y se recopilan todos los documentos en una lista llamada `data`. Cada documento es un diccionario que representa un registro en la colección.

### e. `df = pd.DataFrame(data)`

- Finalmente, se utiliza la lista de diccionarios `data` para crear un DataFrame de pandas llamado `df`. Cada fila en el DataFrame corresponde a un registro en la colección de MongoDB.

Hasta este punto, hemos recuperado los datos almacenados en la base de datos MongoDB y los hemos convertido en un DataFrame de Pandas, lo que facilita su análisis y manipulación. Ahora, continuaremos con el análisis de series temporales en la sección siguiente del código.

# Análisis de Series Temporales y Cálculo de Rendimientos Diarios

En este análisis, se realizará un desglose paso a paso del código proporcionado, que se centra en el análisis de series temporales de datos financieros descargados de una base de datos de MongoDB utilizando Python. Se explicarán cada uno de los elementos del código y se analizará su significado y utilidad. El código en cuestión es el siguiente:

```python
if __name__ == "__main__":
    stock_data_df = retrieve_data_from_mongodb(collection_name)

    # Análisis de series temporales
    stock_data_df['Date'] = pd.to_datetime(stock_data_df['Date'])
    stock_data_df.set_index('Date', inplace=True)

    # Calcular rendimientos diarios
    stock_data_df['Daily_Return'] = stock_data_df['Adj Close'].pct_change()

    # Graficar los precios de cierre
    plt.figure(figsize=(12, 6))
    plt.plot(stock_data_df['Close'], label='Precio de Cierre')
    plt.title(f'Análisis de Series Temporales para {ticker}')
    plt.xlabel('Fecha')
    plt.ylabel('Precio')
    plt.legend()
    plt.show()

    # Graficar los rendimientos diarios
    plt.figure(figsize=(12, 6))
    plt.plot(stock_data_df['Daily_Return'], label='Rendimiento Diario')
    plt.title(f'Rendimientos Diarios para {ticker}')
    plt.xlabel('Fecha')
    plt.ylabel('Rendimiento')
    plt.legend()
    plt.show()
```



## 1. Verificación de la Ejecución Principal

```python
if __name__ == "__main__":
```

Esta línea de código es una estructura condicional que verifica si el script se está ejecutando como un programa principal o si ha sido importado como un módulo en otro script. Si esta condición es verdadera, significa que el script se está ejecutando de forma independiente como programa principal, y el código dentro de este bloque se ejecutará.

## 2. Recuperación de Datos de MongoDB

```python
stock_data_df = retrieve_data_from_mongodb(collection_name)
```

En esta línea de código, se llama a la función `retrieve_data_from_mongodb` para recuperar los datos financieros almacenados en una base de datos de MongoDB y se almacenan en un DataFrame de Pandas llamado `stock_data_df`. A continuación, se analiza el proceso de recuperación de datos:

### - `retrieve_data_from_mongodb(collection_name)`

Este es el nombre de la función que se llama para recuperar los datos de la base de datos MongoDB. Toma un argumento, `collection_name`, que se utiliza para especificar la colección desde la cual se recuperarán los datos. La función se ha definido previamente en el código y se encarga de conectarse a la base de datos, buscar los documentos en la colección especificada y convertirlos en un DataFrame de Pandas.

### - `stock_data_df`

Este es el DataFrame de Pandas donde se almacenarán los datos recuperados. El nombre `stock_data_df` se utiliza para denotar que este DataFrame contiene información relacionada con datos financieros de acciones.

En resumen, esta línea de código recupera los datos financieros de MongoDB y los almacena en un DataFrame de Pandas, lo que facilitará su posterior análisis y manipulación.

## 3. Análisis de Series Temporales

```python
# Análisis de series temporales
stock_data_df['Date'] = pd.to_datetime(stock_data_df['Date'])
stock_data_df.set_index('Date', inplace=True)
```

Este bloque de código se centra en la preparación de los datos para el análisis de series temporales. A continuación, se explica cada parte de este proceso:

### a. Conversión de la Columna de Fechas

```python
stock_data_df['Date'] = pd.to_datetime(stock_data_df['Date'])
```

En esta línea de código, se convierte la columna 'Date' del DataFrame en un formato de fecha utilizando la función `pd.to_datetime` de la biblioteca Pandas. Esto es esencial para que Pandas pueda interpretar estas fechas como datos temporales y realizar operaciones basadas en el tiempo.

### b. Establecimiento de la Columna de Fechas como Índice

```python
stock_data_df.set_index('Date', inplace=True)
```

En esta línea de código, se establece la columna 'Date' como el índice del DataFrame utilizando el método `set_index`. Al establecer la fecha como índice, se facilita el análisis de series temporales, ya que se puede acceder a los datos en función de las fechas de manera más eficiente. La opción `inplace=True` asegura que la modificación se realice en el propio DataFrame `stock_data_df`.

## 4. Cálculo de Rendimientos Diarios

```python
stock_data_df['Daily_Return'] = stock_data_df['Adj Close'].pct_change()
```

En esta línea de código, se calculan los rendimientos diarios de la acción y se agregan como una nueva columna llamada 'Daily_Return' en el DataFrame `stock_data_df`. Veamos cómo se realiza este cálculo:

### a. `stock_data_df['Adj Close']`

- Esta parte del código accede a la columna 'Adj Close' del DataFrame `stock_data_df`. 'Adj Close' suele representar el precio de cierre ajustado de una acción, que tiene en cuenta eventos como dividendos y divisiones de acciones.

### b. `.pct_change()`

- El método `.pct_change()` se aplica a la columna 'Adj Close' y calcula el cambio porcentual entre cada par de valores consecutivos. En otras palabras, calcula el rendimiento diario de la acción. Los resultados se almacenan en la nueva columna 'Daily_Return'.

Los rendimientos diarios son útiles para comprender cómo cambia el precio de una acción de un día a otro y para evaluar su volatilidad.

## 5. Graficar los Precios de Cierre

```python
plt.figure(figsize=(12, 6))
plt.plot(stock_data_df['Close'], label='Precio de Cierre')
plt.title(f'Análisis de Series Temporales para {ticker}')
plt.xlabel('Fecha')
plt.ylabel('Precio')
plt.legend()
plt.show()
```

En este bloque de código, se crea un gráfico para visualizar los precios de cierre de la acción a lo largo del tiempo. A continuación, se desglosa el proceso:

### a. `plt.figure(figsize=(12, 6))`

- Se crea una figura de Matplotlib con un tamaño específico de 12 pulgadas de ancho y 6 pulgadas de alto. Esta figura será el lienzo en el que se representará

 el gráfico.

### b. `plt.plot(stock_data_df['Close'], label='Precio de Cierre')`

- Se utiliza el método `plt.plot` para trazar la columna 'Close' del DataFrame `stock_data_df`, que contiene los precios de cierre de la acción. La etiqueta 'Precio de Cierre' se utiliza para identificar esta línea en la leyenda del gráfico.

### c. `plt.title(f'Análisis de Series Temporales para {ticker}')`

- Se establece el título del gráfico utilizando la función `plt.title`. El título se genera dinámicamente y muestra el nombre del símbolo de la acción analizada (definido previamente como `ticker`).

### d. `plt.xlabel('Fecha')` y `plt.ylabel('Precio')`

- Se agregan etiquetas a los ejes x e y del gráfico utilizando `plt.xlabel` y `plt.ylabel`, respectivamente. Esto ayuda a comprender qué información se muestra en el gráfico.

### e. `plt.legend()`

- Se agrega una leyenda al gráfico utilizando `plt.legend()`. La leyenda proporciona información sobre las líneas trazadas en el gráfico y permite identificarlas fácilmente.

### f. `plt.show()`

- Finalmente, se utiliza `plt.show()` para mostrar el gráfico en la pantalla.

En resumen, este bloque de código crea un gráfico que representa los precios de cierre de la acción a lo largo del tiempo, lo que facilita la visualización de la tendencia de precios.

## 6. Graficar los Rendimientos Diarios

```python
plt.figure(figsize=(12, 6))
plt.plot(stock_data_df['Daily_Return'], label='Rendimiento Diario')
plt.title(f'Rendimientos Diarios para {ticker}')
plt.xlabel('Fecha')
plt.ylabel('Rendimiento')
plt.legend()
plt.show()
```

En este bloque de código, se crea un segundo gráfico para visualizar los rendimientos diarios de la acción a lo largo del tiempo. El proceso es similar al explicado anteriormente:

### a. `plt.figure(figsize=(12, 6))`

- Se crea una nueva figura de Matplotlib con el mismo tamaño de 12 pulgadas de ancho y 6 pulgadas de alto. Cada figura es independiente y permite mostrar diferentes gráficos.

### b. `plt.plot(stock_data_df['Daily_Return'], label='Rendimiento Diario')`

- Se utiliza el método `plt.plot` para trazar la columna 'Daily_Return' del DataFrame `stock_data_df`, que contiene los rendimientos diarios de la acción. La etiqueta 'Rendimiento Diario' se usa para identificar esta línea en la leyenda del gráfico.

### c. `plt.title(f'Rendimientos Diarios para {ticker}')`

- Se establece el título del gráfico con una descripción que incluye el nombre del símbolo de la acción (`ticker`) y la naturaleza de la información mostrada, que son los rendimientos diarios.

### d. `plt.xlabel('Fecha')` y `plt.ylabel('Rendimiento')`

- Se agregan etiquetas a los ejes x e y del gráfico para describir qué se representa en cada eje.

### e. `plt.legend()`

- Se agrega una leyenda al gráfico para identificar fácilmente la línea que representa los rendimientos diarios.

### f. `plt.show()`

- Se utiliza `plt.show()` para mostrar el gráfico en la pantalla.

Este bloque de código crea un gráfico que muestra cómo varían los rendimientos diarios de la acción a lo largo del tiempo, lo que es útil para evaluar la volatilidad y las tendencias en los retornos de inversión.