<a href="https://colab.research.google.com/github/cristiandarioortegayubro/pandito/blob/main/colab/03_plotly_002.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<h1 p align="center">
<b>
<font color="DeepPink">
Saliendo de lo pandito
</font>
</h1>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20BDS%20Horizontal%208.png?raw=true" width="400">
</p>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/pandito/blob/main/images/imagen-001.png?raw=true" width="300">
</p>



 # **<font color="DeepPink">Plotly - Gráficos básicos</font>**

 ## **<font color="DeepPink">Carga de bibliotecas necesarias</font>**

In [1]:
import yfinance as yf
import plotly.express as px

<p align="justify">
Las líneas de código <code>import yfinance as yf</code> e <code>import plotly.express as px</code> son declaraciones de importación en Python. Estas declaraciones permiten cargar bibliotecas o módulos externos en tu programa para que puedas acceder a las funciones y características proporcionadas por esas bibliotecas.

1. **import yfinance as yf**:
   En esta línea, se importa el módulo `yfinance` y se le asigna un alias o nombre corto `yf`. `yfinance` es una biblioteca que proporciona una interfaz para acceder y descargar datos financieros de Yahoo Finance. Al asignarle un alias, puedes usar el nombre corto `yf` para hacer referencia a las funciones y clases del módulo en tu código.

2. **import plotly.express as px**:
   En esta línea, se importa el módulo `plotly.express` y se le asigna un alias `px`. `plotly.express` es una biblioteca que facilita la creación de visualizaciones interactivas, incluidos gráficos, diagramas y más. Al igual que en el caso anterior, asignar un alias más corto (`px` en este caso) hace que sea más conveniente acceder a las funciones y clases proporcionadas por la biblioteca.

En resumen, las declaraciones de importación te permiten cargar bibliotecas externas en tu programa para aprovechar sus funcionalidades.

 ## **<font color="DeepPink">Definición de variables y descarga de datos</font>**

In [2]:
# Símbolos de las acciones
tickers = ['AAPL', 'GOOG', 'MSFT']

# Fecha de inicio y fin para enero de 2020
start_date = '2020-01-01'
end_date = '2020-01-31'

# Obtener los datos utilizando yfinance
data = yf.download(tickers,
                   start=start_date,
                   end=end_date,
                   interval='1d',
                   progress=False)

<p align="justify">
En este código, se están utilizando los módulos de la biblioteca <code>yfinance</code> para descargar datos históricos de las acciones de Apple, Google y Microsoft durante el mes de enero de 2020.
<br><br>
Aquí está la explicación detallada de cada línea de código:

1. `tickers = ['AAPL', 'GOOG', 'MSFT']`: Esta línea crea una lista llamada `tickers` que contiene los símbolos de las acciones que se desean analizar. En este caso, se están utilizando los símbolos de las acciones de Apple, Google y Microsoft.

2. `start_date = '2020-01-01'`: Aquí se define la fecha de inicio del período para el que se descargarán los datos. En este caso, la fecha de inicio es el 1 de enero de 2020.

3. `end_date = '2020-01-31'`: Esta línea define la fecha final del período para el que se descargarán los datos. En este caso, la fecha final es el 31 de enero de 2020.

4. `data = yf.download(tickers, start=start_date, end=end_date, interval='1d', progress=False)`: Aquí se utiliza la función `download` del módulo `yf` para descargar los datos históricos de las acciones especificadas en la lista `tickers`. Los argumentos `start`, `end` e `interval` se utilizan para especificar el período de tiempo y la frecuencia de los datos. El argumento `progress` se establece en `False` para evitar la visualización de una barra de progreso durante la descarga.

<p align="justify">
Después de ejecutar este código, la variable <code>data</code> contendrá un objeto que almacena los datos históricos de las acciones de Apple, Google y Microsoft durante el mes de enero de 2020, con una frecuencia diaria.
<br><br>
Cada columna en este objeto representará diferentes aspectos de los datos, como precios de apertura, cierre, máximo, mínimo y volumen de operaciones.

In [3]:
data.head()

Unnamed: 0_level_0,Adj Close,Adj Close,Adj Close,Close,Close,Close,High,High,High,Low,Low,Low,Open,Open,Open,Volume,Volume,Volume
Unnamed: 0_level_1,AAPL,GOOG,MSFT,AAPL,GOOG,MSFT,AAPL,GOOG,MSFT,AAPL,GOOG,MSFT,AAPL,GOOG,MSFT,AAPL,GOOG,MSFT
Date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2
2020-01-02,73.249016,68.3685,155.093704,75.087502,68.3685,160.619995,75.150002,68.406998,160.729996,73.797501,67.077499,158.330002,74.059998,67.077499,158.779999,135480400,28132000,22622100
2020-01-03,72.536896,68.032997,153.162476,74.357498,68.032997,158.619995,75.144997,68.625,159.949997,74.125,67.277199,158.059998,74.287498,67.392998,158.320007,146322800,23728000,21116200
2020-01-06,73.114891,69.710503,153.55838,74.949997,69.710503,159.029999,74.989998,69.824997,159.100006,73.1875,67.5,156.509995,73.447502,67.5,157.080002,118387200,34646000,20813700
2020-01-07,72.771019,69.667,152.158279,74.597504,69.667,157.580002,75.224998,70.149498,159.669998,74.370003,69.518997,157.320007,74.959999,69.897003,159.320007,108872000,30054000,21634100
2020-01-08,73.94162,70.216003,154.58194,75.797501,70.216003,160.089996,76.110001,70.579002,160.800003,74.290001,69.542,157.949997,74.290001,69.603996,158.929993,132079200,30560000,27746500


 ## **<font color="DeepPink">Adaptando el DataFrame</font>**

In [4]:
# Seleccionar los precios de cierre ajustados
close_prices = data['Adj Close']

<p align="justify">
La línea de código <code>close_prices = data['Adj Close']</code> se utiliza para seleccionar y asignar a la variable <code>close_prices</code> la columna de precios de cierre ajustados ("Adj Close") de los datos descargados.
<br><br>
Aquí está la explicación más detallada:

- `data`: Es el objeto que contiene los datos descargados utilizando la función `yf.download()` previamente. Este objeto generalmente es un DataFrame, una estructura de datos tabular similar a una hoja de cálculo, en la que cada columna representa una variable diferente y cada fila representa una observación en un momento específico.

- `'Adj Close'`: Es el nombre de la columna que deseamos seleccionar de los datos. "Adj Close" representa el precio de cierre ajustado de las acciones. El precio de cierre ajustado es el precio al que una acción cerró en un día específico, teniendo en cuenta los ajustes necesarios, como dividendos y desdoblamientos.

- `close_prices`: Es la variable a la que se asignará la columna de precios de cierre ajustados. Una vez que se ejecuta la línea de código, `close_prices` será una Serie (una columna del DataFrame) que contiene los precios de cierre ajustados para las acciones en el período de tiempo especificado.

<p align="justify">
En resumen, la línea de código selecciona y extrae la columna de precios de cierre ajustados de los datos descargados y la asigna a la variable <code>close_prices</code>, lo que nos permite trabajar específicamente con esos datos en el análisis y la visualización subsiguientes.

In [5]:
# Crear un DataFrame
bar_data = close_prices.reset_index().melt(id_vars=['Date'], var_name='Ticker', value_name='Precio')

<p align="justify">
La línea de código <code>bar_data = close_prices.reset_index().melt(id_vars=['Date'], var_name='Ticker', value_name='Precio')</code> realiza una transformación en los datos de precios de cierre ajustados para prepararlos para su uso en la creación de un gráfico de barras en Plotly. La operación implica reorganizar los datos de manera que se puedan utilizar fácilmente para representar un gráfico de barras.
<br><br>
Aquí está la explicación más detallada de cada parte de la línea de código:

1. `close_prices`: Es la Serie que contiene los precios de cierre ajustados para las acciones de Apple, Google y Microsoft en el período de tiempo especificado.

2. `.reset_index()`: Este método se aplica a la Serie `close_prices` y devuelve un DataFrame donde se restablece el índice de las filas a un rango numérico y se coloca la columna de fechas ("Date") como una columna normal en el DataFrame.

3. `.melt(id_vars=['Date'], var_name='Ticker', value_name='Precio')`: El método `.melt()` se utiliza para transformar el DataFrame reindexado en un formato donde los valores de las columnas se "derriten" en una sola columna de valores. La transformación implica:

   - `id_vars=['Date']`: La columna "Date" se mantiene como identificador, lo que significa que no se derrite en la nueva columna.
   - `var_name='Ticker'`: Los nombres de las columnas originales ("AAPL", "GOOG", "MSFT") se transfieren a la nueva columna "Ticker", que representará las categorías en el gráfico de barras.
   - `value_name='Precio'`: Los valores numéricos (precios de cierre ajustados) se trasladan a la columna "Precio".

<p align="justify">
El resultado de esta transformación es que <code>bar_data</code> será un DataFrame que contiene tres columnas: "Date", "Ticker" y "Precio".
<br><br>
Cada fila representará un registro de precios de cierre ajustados para una fecha y una acción específicas. Este formato es adecuado para crear un gráfico de barras en Plotly donde "Date" se mapeará en el eje $X$, "Precio" se mapeará en el eje $Y$ y "Ticker" se usará para agrupar los datos en diferentes barras correspondientes a cada acción.

In [6]:
bar_data.head()

Unnamed: 0,Date,Ticker,Precio
0,2020-01-02,AAPL,73.249016
1,2020-01-03,AAPL,72.536896
2,2020-01-06,AAPL,73.114891
3,2020-01-07,AAPL,72.771019
4,2020-01-08,AAPL,73.94162


In [7]:
bar_data.tail()

Unnamed: 0,Date,Ticker,Precio
55,2020-01-24,MSFT,159.361603
56,2020-01-27,MSFT,156.696548
57,2020-01-28,MSFT,159.767151
58,2020-01-29,MSFT,162.258377
59,2020-01-30,MSFT,166.835297


In [8]:
bar_data = bar_data.query("Date < '2020-01-08'")

 ## **<font color="DeepPink">Creación del gráfico de barras</font>**

<p align="justify">
Un gráfico de barras es una representación gráfica que utiliza barras rectangulares para comparar y mostrar la magnitud o cantidad de diferentes categorías o elementos.
<br><br>
Cada barra en el gráfico representa una categoría específica y su altura está proporcionalmente relacionada con la cantidad o valor que representa. Los gráficos de barras son una forma efectiva de visualizar y comparar datos en diferentes categorías de manera clara y concisa.
<br><br>
En un gráfico de barras:

- El eje vertical (eje $Y$) generalmente representa la magnitud de los valores, mientras que el eje horizontal (eje $X$) representa las diferentes categorías o elementos.

- Las barras pueden ser horizontales o verticales, dependiendo de la orientación del gráfico.

- La longitud de cada barra es proporcional al valor o cantidad que representa. Las barras más largas indican valores mayores y las barras más cortas indican valores menores.

- Las barras se pueden presentar una al lado de la otra (gráfico de barras agrupadas) o en secuencia una sobre la otra (gráfico de barras apiladas).

<p align="justify">
Los gráficos de barras son especialmente útiles para comparar visualmente datos en diferentes categorías y para identificar tendencias, patrones o diferencias entre las categorías. Son ampliamente utilizados en diversas áreas, como estadísticas, finanzas, mercadotecnia, ciencias sociales y más, para presentar información de manera efectiva y comprensible.

In [9]:
# Crear el gráfico de barras utilizando Plotly
fig = px.bar(bar_data,
             x=bar_data.Date,
             y=bar_data.Precio,
             color=bar_data.Ticker,
             barmode="group",
             title='Precios de Cierre de Acciones en enero de 2020')

fig.update_xaxes(title_text='Fecha')
fig.update_yaxes(title_text='Precio de Cierre')
fig.show()

 ## **<font color="DeepPink">Creación del gráfico lineal</font>**

<p align="justify">
Un gráfico lineal, también conocido como gráfico de líneas, es una representación gráfica que utiliza líneas para conectar puntos de datos en un sistema de coordenadas cartesianas.
<br><br>
Cada punto de datos en el gráfico lineal se representa mediante una coordenada en el plano cartesiano, donde el eje horizontal (eje $X$) generalmente representa una variable independiente y el eje vertical (eje $Y$) representa una variable dependiente.
<br><br>
En un gráfico lineal:

- Los puntos de datos se conectan con líneas rectas, lo que crea una visualización continua y suave de la relación entre las variables.

- La forma y la pendiente de la línea entre los puntos de datos pueden proporcionar información sobre la tendencia, dirección y cambio en los datos a lo largo del tiempo o de la variable independiente.

- Los gráficos lineales son especialmente útiles para mostrar cambios y tendencias en datos a lo largo de un período de tiempo o a medida que una variable cambia. También son útiles para representar relaciones continuas entre dos variables.

- Los gráficos lineales pueden incluir una línea única que conecta los puntos de datos o múltiples líneas para comparar diferentes series de datos.

- Pueden tener marcadores en los puntos de datos para resaltarlos y mejorar la legibilidad.



In [10]:
# Crear el gráfico de líneas utilizando Plotly
fig = px.line(close_prices,
              x=close_prices.index,
              y=close_prices.columns,
              title='Precios de Cierre de Acciones en enero de 2020')

fig.update_xaxes(title_text='Fecha')
fig.update_yaxes(title_text='Precio de Cierre')
fig.show()

 ## **<font color="DeepPink">Creación del gráfico de burbujas</font>**

<p align="justify">
Un gráfico de burbujas es una representación visual que utiliza burbujas o círculos en un plano para mostrar datos. Cada burbuja en el gráfico de burbujas representa un punto de datos específico, mientras que el tamaño de la burbuja se utiliza para representar una tercera variable numérica.
<br><br>
En un gráfico de burbujas:

- El eje horizontal (eje $X$) generalmente representa una variable independiente, mientras que el eje vertical (eje $Y$) representa otra variable independiente.

- El tamaño de cada burbuja está relacionado con una tercera variable, que puede ser una medida de cantidad, magnitud o cualquier otro valor numérico.

- Las burbujas pueden superponerse o estar separadas, dependiendo de la distribución de los datos en el gráfico.

- El color de las burbujas también se puede utilizar para representar una cuarta variable, lo que agrega otra dimensión a la visualización.

- Los gráficos de burbujas son ideales para representar relaciones complejas entre múltiples variables. Pueden revelar patrones, tendencias y correlaciones en los datos de manera visual.

- Son útiles para resaltar valores atípicos o anomalías en los datos, ya que las burbujas inusuales pueden ser fácilmente identificadas por su tamaño y posición.


In [11]:
# Crear un DataFrame para los datos del gráfico de burbujas
bubble_data = close_prices.reset_index().melt(id_vars=['Date'], var_name='Ticker', value_name='Precio')

# Crear el gráfico de burbujas utilizando Plotly Express
fig = px.scatter(bubble_data,
                 x='Date',
                 y='Precio',
                 size='Precio',
                 color='Ticker',
                 title='Gráfico de Burbujas de Precios de Acciones en enero de 2020')

fig.update_xaxes(title_text='Fecha')
fig.update_yaxes(title_text='Precio')
fig.show()

 # **<font color="DeepPink">Templates</font>**

<p align="justify">
Los "templates" en Plotly son conjuntos predefinidos de estilos y configuraciones que se pueden aplicar a los gráficos para darles una apariencia y formato específicos de manera rápida y sencilla. En lugar de tener que ajustar manualmente cada aspecto del diseño y la apariencia del gráfico, los templates permiten aplicar un conjunto completo de configuraciones con solo una línea de código.
<br><br>
Los templates en Plotly pueden incluir:

1. Estilos visuales predefinidos: Colores, fuentes, tamaños de texto y líneas, estilos de relleno, etc.

2. Configuraciones de diseño: Tamaño del gráfico, márgenes, espaciado entre ejes, etc.

3. Personalizaciones específicas de tipo de gráfico: Ajustes predeterminados para tipos de gráficos específicos, como líneas, barras, dispersión, etc.

4. Configuraciones de ejes: Etiquetas de ejes, rango, intervalos, etc.

5. Configuraciones interactivas: Comportamiento de herramientas de interacción como zoom, panning, tooltips, etc.

6. Personalizaciones de fondo y diseño general: Fondos, leyendas, cuadrículas, etc.



In [12]:
bar_data = bar_data.query("Date < '2020-01-08'")

In [13]:
fig = px.bar(bar_data,
             x=bar_data.Date,
             y=bar_data.Precio,
             color=bar_data.Ticker,
             barmode="group",
             title='Precios de Cierre de Acciones en enero de 2020')

fig.update_xaxes(title_text='Fecha')
fig.update_yaxes(title_text='Precio de Cierre')
fig.show()

In [14]:
templates =  ['ggplot2', 'seaborn', 'simple_white', 'plotly',
              'plotly_white', 'plotly_dark', 'presentation', 'xgridoff',
              'ygridoff', 'gridon', 'none']

In [15]:
for i in templates:
  fig.update_layout(template = i,
                    title=f'Precios de Cierre de Acciones en enero de 2020, Template {i}')
  fig.show()

 # **<font color="DeepPink">Conclusiones</font>**

<p align="justify">
👀 En este colab nosotros:
<br><br>
✅ Cargamos las bibliotecas necesarias para graficar y obtener datos.
<br>
✅ Generamos variables y realizamos la descarga de datos.
<br>
✅ Creamos un gráfico de barras.
<br>
✅ Creamos un gráfico lineal.
<br>
✅ Creamos un gráfico de burbujas.
<br>
✅ Visualizamos las distintas "templates" gráficas.
<br>
<br>
<p align="center">
<img src="https://www.python.org/static/community_logos/python-powered-h-70x91.png">
</p>

---