<img src="assets/socalo-ICDA.png">

# Python para Finanzas y Ciencia de Datos
Federico Brun | fedejbrun@gmail.com

_Jueves 15 Octubre 2020_

## Visualización de Datos en Python

<img src="https://files.realpython.com/media/How-to-Plot-With-Pandas_Watermarked.f283f64b4ae3.jpg">

_Fuente: realpython.com_

La Visualización de los Datos con que trabajamos cumple un rol muy importante a la hora de reportar y divulgar nuestro trabajo .
La capacidad de saber utilizar las herramientas de visualización no solo es útil para mostrar nuestros resultados a terceros, sino que además puede ayudarnos y guiar nuestro trabajo.

En Python existen muchas librerías que nos asisten en esta tarea. 
En nuestro estudio de opciones veremos algunos ejemplos básicos con las alternativas mas ampliamente utilizadas.

## Instalar librerías con PIP y CONDA

Como adelantamos, al usar Anaconda, muchas de las librerías que se usan para la Ciencia de Datos y Finanzas ya vienen incluidas en nuestra descarga.

Pero como este no es siempre el caso, debemos aprender a descargar librerías de Python usando los administradores de paqeutes.

Un administrador de paquetes es un programa que se utiliza para descargar, instalar y administrar paquetes de software escritos en Python.

La gran mayoría de estos paquetes, los encontramos en <a href="https://pypi.org/" target="_blank">Python Package Index</a> cuando usamos PIP; y en <a href="https://anaconda.org/" target="_blank">Anaconda Cloud</a> cuando usamos CONDA.

Para instalar un paquete entonces, usando PIP o CONDA, tenemos las siguientes opciones:
* Desde la terminal:

``` pip install plotly ```

``` conda install plotly ```

* Desde JupyterNotebook en una celda de codigo:

```!pip install plotly ```

```!conda install plotly ```
___

## Matplotlib

<img src="https://matplotlib.org/_static/logo2_compressed.svg"/>Matplotlib es una librería para la generación de gráficos a partir de datos contenidos en listas o arrays en Python y su extensión matemática NumPy.

https://matplotlib.org/

In [None]:
import matplotlib.pyplot as plt
import numpy as np

In [None]:
plt.plot([1, 2, 3, 4], [1, 4, 2, 3])  # Plot some data on the axes.

Con algunas lineas adicionales, podemos mejorar la calidad de nuestro gráfico aumentando el tamaño de la visualización, y agregando referencias como una grilla, un titulo, y etiquetas para los ejes cartesianos.

In [None]:
eje_x = [1, 2, 4, 6, 8, 9, 15, 17, 30]
eje_y = [1, 3, 5, 7, 9, 9, 10, 18, 4]

In [None]:
plt.figure(figsize=(15,8))  # Agrandar el gráfico que se muestra 
plt.plot(eje_x, eje_y)

# Agregar referencias
plt.grid(True)
plt.title('Primer Gráfico en Matplotlib', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16)

Podemos tambien cambiar la representacion de los puntos que mostramos.
Para no mostrar la dirección de memorio del gráfico, agregamos `;` en la ultima instrucción `plt` .

In [None]:
plt.figure(figsize=(15,8))  # Agrandar el gráfico que se muestra 
plt.plot(eje_x, eje_y, 'bs')

# Agregar referencias
plt.grid(True)
plt.title('Cambiar puntos azules', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16);

Podemos mostrar mas de una figura en un mismo grafico.

In [None]:
plt.figure(figsize=(15,8))  # Agrandar el gráfico que se muestra 
plt.plot(eje_x, eje_y, 'bs',eje_x, eje_y, )

# Agregar referencias
plt.grid(True)
plt.title('Linea y puntos', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16);

In [None]:
# evenly sampled time at 200ms intervals
t = np.arange(0., 5., 0.2)

# red dashes, blue squares and green triangles
plt.figure(figsize=(15,8))
plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')

# Agregar referencias
plt.grid(True)
plt.title('Multiples trazos', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16);

Y podemos trabajar con datos que almacenamos en una estructura de datos que no es una lsita, por ejemplo un diccionario o un **DataFrame** de Pandas.

In [None]:
data = {'a': np.arange(50),
        'c': np.random.randint(0, 50, 50),
        'd': np.random.randn(50)}
data['b'] = data['a'] + 10 * np.random.randn(50)
data['d'] = np.abs(data['d']) * 100

plt.figure(figsize=(15,8))
plt.scatter('a', 'b', c='c', s='d', data=data)

# Agregar referencias
plt.grid(True)
plt.title('Datos de un DataFrame', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16);

En un mismo gráfico, podemos mostrar varias figuras y varios ejes.

In [None]:
# Definimos una funcion matematica como las
# que acostumbramos a graficar en papel
def f(t):
    return np.exp(-t) * np.cos(2*np.pi*t)

$$f(t) = e^{-t} * cos(2 \pi t)$$

Si bien no es necesario en Jupyter, para mostrar los gráficos y para hacer que nuestro bloque de código de visualización sea mas comprensible, hacemos una llamada a la función `show()` del objeto `plt` al final del bloque.

In [None]:
t1 = np.arange(0.0, 5.0, 0.1)
t2 = np.arange(0.0, 5.0, 0.02)

plt.figure(figsize=(15,8))

plt.subplot(211)
plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')
plt.grid(True)
plt.title('Primer conjuntos de datos', fontsize=24)
plt.ylabel('y-axis', fontsize=16)

plt.subplot(212)
plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
plt.grid(True)
plt.title('Segundo conjunto de datos', fontsize=24)
plt.xlabel('x-axis', fontsize=16)
plt.ylabel('y-axis', fontsize=16)

plt.show();

<a href="https://matplotlib.org/tutorials/introductory/sample_plots.html#sphx-glr-tutorials-introductory-sample-plots-py" target="_blank">Ejemplos de diferentes Gráficos con Matplotlib</a>

---

## Visualización de Datos de Numpy y Pandas con Matplotlib
Matplotlib se integra muy facilmente con Numpy y Pandas, para poder mostrar nuestros datos de forma rápida y sencilla. 

Construimos una serie de números aleatorios con Numpy, para guardar en una **Serie** de Pandas.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
size, scale = 1000, 10
muestra = pd.Series(np.random.gamma(scale, size=size) ** 1.5)

In [None]:
plt.figure(figsize=(15,8))
muestra.plot.hist(bins=20, rwidth=0.9)

plt.title('Tiempos de llegada de Servicios Emergencias Medicas', fontsize=24)
plt.xlabel('Tiempo de llegada (min)', fontsize=16)
plt.ylabel('Episodios', fontsize=16)
plt.grid(axis='y', alpha=0.75)

Para ir encaminando nuestro estudio enfocado a resolver un problema, volvamos al Dataset de informacion global de COVID.

In [None]:
global_covid_df = pd.read_csv('https://covid19.who.int/WHO-COVID-19-global-data.csv')

In [None]:
global_covid_df

Limpiamos un poco el DataFrame.

In [None]:
ignorar_columnas = [
    ' WHO_region',
    ' Cumulative_cases',
    ' New_deaths',
    ' Cumulative_deaths'
]

global_covid_df.drop(ignorar_columnas, inplace=True, axis=1)

In [None]:
global_covid_df.rename(columns={
    'Date_reported': 'fecha',
    ' Country_code': 'cod_pais',
    ' Country': 'pais',
    ' New_cases': 'casos_nuevos'
}, inplace=True)
global_covid_df.set_index('fecha', inplace=True)
global_covid_df

In [None]:
global_por_fecha = global_covid_df.groupby('fecha').sum()

In [None]:
global_por_fecha

In [None]:
global_por_fecha.plot(figsize=(20, 5))

plt.title('Nuevos Casos Diarios')
plt.xlabel('Fecha')
plt.ylabel('Cantidad de nuevos casos')
plt.grid(axis='y', alpha=0.75)

In [None]:
global_por_fecha.cumsum().plot(figsize=(20, 5))

plt.title('Casos aumulados')
plt.xlabel('Fecha')
plt.ylabel('Casos acumulados (miles)')
plt.grid(axis='y', alpha=0.75)

In [None]:
global_ultimos_30 = global_por_fecha.iloc[-30:, :]
global_ultimos_30

In [None]:
global_ultimos_30.plot(figsize=(20, 5))

plt.title('Nuevos casos diarios (Ultimos 30 dias)')
plt.xlabel('Fecha')
plt.ylabel('Nuevos casos diarios')
plt.grid(axis='y', alpha=0.75)

Si bien es una forma bastante "directa" de visualizar datos de Pandas, podemos observar algunas limitaciones, como por ejemplo la falta de interactividad de los gráficos, y lo "básicos" que resultan los gráfios que se crean por defecto sin que apliquemos ningun tipo de transformacion ni mejora en la presentación.

Para mejorar nuestras visualizaciones de datos, vamos a usar **Plotly**.

---

## Plotly
<img src='https://blog.f1000.com/wp-content/uploads/2017/07/logo.png'/>

Plotly es una librería que nos permite crear gráficos al igual que Matplotlib. Las ventajas que nos da plotly son la interactividad en nuestras visualizaciones, la gran variedad de tipos de gráficos, soporte por parte de los desarrolladores del proyecto, y una fácil integración con herramientas mas avanzadas como por ejemplo **Dash** que nos permite generar tableros de datos interactivos como el que usamos de ejemplo de la OMS, y todo usando **solamente Python!**

https://plotly.com/python/

#### Primer paso instalar plotly si todavía no lo tenemos

In [None]:
!pip install plotly==4.11.0

In [None]:
!pip install "notebook>=5.3" "ipywidgets>=7.2"

#### Segundo paso importar plotly

In [None]:
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.figure_factory as ff

Primero creamos un objeto que sea de tipo `Figure`:

In [None]:
fig = go.Figure()

fig.add_trace(go.Bar(x=["Lunes", "Martes", "Miercoles", "Jueves", "Viernes"],
                     y=[1, 1, 2, 4, 2]))

fig.show()

Podemos crear una figura vacía, para ir llenándola de elementos "sobre la marcha".

In [None]:
fig = go.Figure()
fig.show()

Podemos agregar títulos, al gráfico y a cada uno de los ejes.

In [None]:
fig.add_trace(go.Scatter(x=["Lunes", "Martes", "Miercoles", "Jueves", "Viernes"],
                         y=[1, 1, 2, 4, 2],
                        name="hs/dia"))
fig.update_layout(title="Horas por día dedicadas al curso ICDA Python")
fig.show()

In [None]:
fig.add_trace(go.Scatter(x=["Lunes", "Martes", "Miercoles", "Jueves", "Viernes"],
                         y=[5, 5, 4, 3, 2],
                        name="energía"))
fig.update_layout(title="Horas por día dedicadas al curso ICDA Python vs Energía ")
fig.show()

#### Pie Charts

<a href='https://plotly.com/python/pie-charts/' target='_blank'>Documentación: Pie charts con Plotly</a>

In [None]:
import pandas as pd

portfolio = pd.read_csv('cartera-arg.csv')
portfolio

In [None]:
import plotly.express as px
fig = px.pie(portfolio, values='Cantidad', names='Ticker')
fig.show()

In [None]:
import plotly.express as px
fig = px.pie(portfolio, values='Cantidad', names='Ticker', color_discrete_sequence=px.colors.sequential.RdBu)
fig.show()

#### Scatter Plots 

<a href='https://plotly.com/python/line-and-scatter/' target='_blank'>Documentacion: Scatter Plots con Plotly</a>

Datos descargados de Statsmodels, una librería para anáisis estadístico https://www.statsmodels.org/stable/datasets/index.html

Descargamos el conjunto de Duncan's Occupational Prestige Data. Descripción: datos sobre el prestigio y otras características de 45 ocupaciones estadounidenses en 1950. El data frame tiene 45 filas y 4 columnas.

Importamos primeros las librerías que nos permitirán descargar los datos y manipularlos.

In [None]:
import statistics as sts
import statsmodels.api as sm #https://www.statsmodels.org/stable/datasets/statsmodels.datasets.get_rdataset.html
import pandas as pd #https://es.wikipedia.org/wiki/Pandas
import numpy as np #https://es.wikipedia.org/wiki/NumPy
from patsy import dmatrices

In [None]:
# Datos
df = sm.datasets.get_rdataset("Duncan", "carData").data
df.head()

**Descripción de los datos:**

+ **type:** *Type of occupation.* A factor with the following levels: *prof*, professional and managerial; *wc*, white-collar; *bc*,
   blue-collar. Los *white collars* son trabajadores de traje y corbata que trabajan en un escritorio y, estereotípicamente, evitan el trabajo físico. *blue-collars* se refiere a los trabajadores que realizan trabajos manuales duros, generalmente agricultura, manufactura, construcción, minería o mantenimiento.

+ **income:** *Percentage of occupational incumbents in the 1950 US Census who earned USD 3,500 or more per year (about USD 36,000 in 2017 US dollars).*

+ **education:** *Percentage of occupational incumbents in 1950 who were high school graduates (which, were we cynical, we would say is roughly equivalent to a PhD in 2017).*

+ **prestige:** *Percentage of respondents in a social survey who rated the occupation as "good" or better in prestige.*

In [None]:
# Figura

fig = px.scatter(df, x="education", y="income", size="prestige", color="type", hover_name=df.index,
            size_max=50)
fig.update_layout(
    title="Scatter Plot",
    xaxis_title="Education",
    yaxis_title="Income",
    font=dict(
        family="Arial, monospace",
        size=12,
        color="#7f7f7f"
    )
)

#### Box Plots  

<a href='https://plotly.com/python/box-plots/' target='_blank'>Documentación: Box Plots con Plotly</a>

In [None]:
fig = px.box(df, x='type', y="income")
fig.update_layout(
    title="Box Plots",
    xaxis_title="Type",
    yaxis_title="Income",
    font=dict(
        family="Arial, monospace",
        size=12,
        color="#7f7f7f"
    )
)
fig.show()

#### Análisis de Series de Tiempo
Evaluamos el rendimiento de ADRs de tres bancos argentinos (Galicia, Macro y Supervielle) para estudiar que tan relacionados se encuentran para crear una estrategia de inversión.

Importamos librerías

In [None]:
import pandas as pd
import numpy as np
from datetime import datetime

Descargamos los datos desde Yahoo Finance, buscando el enlace de descarga del CSV.

In [None]:
t_0 = datetime(1990, 1,1, 21, 0).timestamp() #Starting Date
t_end =  datetime.now() #End Date
t_end = datetime(t_end.year, t_end.month, t_end.day, 21, 0).timestamp()

## Grupo Financiero Galicia S.A. (GGAL)
Ticker = 'GGAL'  #Ticker
url = 'https://query1.finance.yahoo.com/v7/finance/download/'+ Ticker +'?period1='+str(int(t_0))+'&period2='+ str(int(t_end)) +'&interval=1d&events=history.csv'
#url = 'https://query1.finance.yahoo.com/v7/finance/download/GGAL?period1=1432425600&period2=1590278400&interval=1d&events=history'
df_ggal = pd.read_csv(url)
df_ggal.set_index('Date', inplace=True)

## Banco Macro S.A. (BMA)
Ticker = 'BMA'  #Ticker
url = 'https://query1.finance.yahoo.com/v7/finance/download/'+ Ticker +'?period1='+str(int(t_0))+'&period2='+ str(int(t_end)) +'&interval=1d&events=history.csv'
df_bma = pd.read_csv(url)
df_bma.set_index('Date', inplace=True)

## Grupo Supervielle S.A. (SUPV)
Ticker = 'SUPV'  #Ticker
url = 'https://query1.finance.yahoo.com/v7/finance/download/'+ Ticker +'?period1='+str(int(t_0))+'&period2='+ str(int(t_end)) +'&interval=1d&events=history.csv'
df_supv = pd.read_csv(url)
df_supv.set_index('Date', inplace=True)

A partir de los tres Dataframes que obtuvimos de la descarga, construimos un único Dataframe con la funcion `concat()` de Pandas.

In [None]:
df = pd.concat([df_ggal['Close'].round(2), df_bma['Close'].round(2), df_supv['Close'].round(2)], axis=1, join='inner')
df.columns = ['GGAL USD', 'BMA USD',  'SUPV USD']
df

Importamos librerías para graficar las series de tiempo.

In [None]:
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.figure_factory as ff

#### Graficar series de Tiempo
Vamos a usar `make_subplots()`, una función de Plotly que nos permite crear figuras con múltiples figuras dentro de si, o "gráficos adentro de gráficos".

<a href='https://plotly.com/python/mixed-subplots/' target='_blank'>Documentación: Subplots Plotly</a>

<a href='https://relopezbriega.github.io/blog/2016/09/26/series-de-tiempo-con-python/' target='_blank'>Tutorial sobre análisis de Series de Tiempo muy interesante</a>



In [None]:
fig = make_subplots(rows=2, cols=3, horizontal_spacing=0.10)

fig.update_layout(height=700, width=950)

fig.layout.title.text = "Acciones Bancarias Argentinas (Precios en USD y retornos diarios en %)"
#GGAL
fig.add_scatter(
    x= df.index,
    y =df['GGAL USD'] ,
    name='GGAL',
    yaxis='y1',
    showlegend=False,
    row=1, col=1,
    line = dict(color='#ff7f0e')
)
fig.add_scatter(
    x= df.index,
    y =df['GGAL USD'].pct_change()*100 ,
    name='GGAL',
    yaxis='y1',
    showlegend=False,
    row=2, col=1,
    line = dict(color='#ff7f0e')
)

#BMA
fig.add_scatter(
    x= df.index,
    y =df['BMA USD'] ,
    name='BMA',
    yaxis='y1',
    showlegend=False,
    row=1, col=2,
    line = dict(color='#17becf')
)
fig.add_scatter(
    x= df.index,
    y =df['BMA USD'].pct_change()*100 ,
    name='BMA',
    yaxis='y1',
    showlegend=False,
    row=2, col=2,
    line = dict(color='#17becf')
)

#SUPV
fig.add_scatter(
    x= df.index,
    y =df['SUPV USD'] ,
    name='SUPV',
    yaxis='y1',
    showlegend=False,
    row=1, col=3,
    line = dict(color='#d62728')
)
fig.add_scatter(
    x= df.index,
    y =df['SUPV USD'].pct_change()*100 ,
    name='SUPV',
    yaxis='y1',
    showlegend=False,
    row=2, col=3,
    line = dict(color='#d62728')
)

fig.update_layout(showlegend=False)

fig.update_yaxes(title_text='GGAL daily prices in USD',title_font=dict(size=14, family='arial', color='#ff7f0e'),row=1, col=1)
fig.update_yaxes(title_text='BMA daily prices in USD',title_font=dict(size=14, family='arial', color='#17becf'),row=1, col=2)
fig.update_yaxes(title_text='SUPV daily prices in USD',title_font=dict(size=14, family='arial', color='#d62728'),row=1, col=3)


fig.update_yaxes(title_text='GGAL daily return %',title_font=dict(size=14, family='arial', color='#ff7f0e'),row=2, col=1)
fig.update_yaxes(title_text='BMA daily return %',title_font=dict(size=14, family='arial', color='#17becf'),row=2, col=2)
fig.update_yaxes(title_text='SUPV daily return %',title_font=dict(size=14, family='arial', color='#d62728'),row=2, col=3)

#### Correlation Heatmap
También conocido como Matriz de Correlación, esta figura es ampliamente utilizada para el análisis exploratorio de datos. 

Ayuda a concer de manera gráfica, qué variables estan _correlacionadas_ y en qué medida.

<a href='https://plotly.com/python/heatmaps/' target='_blank'>Documentación: Heatmaps Plotly</a>

In [None]:
print( np.around(df.corr(), decimals=2))

fig = make_subplots(rows=1, cols=1)

fig.update_layout(height=400, width=800)

fig.layout.title.text = "Fig.: Correlation Heatmap para precios"

fig.add_heatmap(
    z=df.corr(),
    x=['GGAL', 'BMA', 'SUPV'],
    y=['GGAL', 'BMA', 'SUPV'],
    hoverongaps = False, 
    colorscale='Viridis'
    
)

fig.show()

In [None]:
print( np.around(df.pct_change().corr(), decimals=2))

fig = make_subplots(rows=1, cols=1)

fig.update_layout(height=400, width=800)

fig.layout.title.text = "Fig.: Correlation Heatmap para retornos"

fig.add_heatmap(
    z=df.pct_change().corr(),
    x=['GGAL', 'BMA', 'SUPV'],
    y=['GGAL', 'BMA', 'SUPV'],
    hoverongaps = False, 
    colorscale='Viridis'
)

fig.show()

---
Como ya dijimos, la mejor manera de aprender a usar Plotly al igual que las otras librerías para Ciencia de Datos, es buscando solucionar un problema específico. Para ello vamos a emular alguno de los gráficos del Dashboard de COVID de la OMS siguiendo el siguiente marco de trabajo:
1. Definir nuestro objetivo: por ejemplo "Replicar el gráfico de barras de los casos diarios Globales".
2. Buscar la documentación de la figura y ver ejemplos.
3. Si es necesario limpiar nuestro set de datos.
4. Adaptar la documentación del paso 2 a nuestras necesidades.
5. Refinar la presentación hasta lograr un resultado satisfactorio.

#### 1º Definir el objetivo: Gráfico de barras de casos diarios Globales
A partir de los datos del archvo de CSV, vamos a limpiarlos para obtener los casos diarios y graficar el avance de los mismos emulando la visualizacin de la página de la OMS (Gráfico "Global Situation")
#### 2º Buscar documentación de la figura y ejemplos:
Una búsqueda en Google con las palabras "plotly time series bar chart" nos arroja muchos resultados. El primero es la documentación oficial de la librería.
<a href='https://plotly.com/python/time-series/' target='_blank'>Documentación: Series de Tiempo con Plotly</a>

#### 3º Limpiar Dataset:
Ya tenemos un DataFrame de Pandas que nos sirve, por lo que el trabajo de limpieza de datos en este caso será minimo.

In [None]:
global_por_fecha

#### 4º Adaptar la documentación del paso 2 a nuestras necesidades:

In [None]:
import plotly.express as px

fig = px.line(global_por_fecha, global_por_fecha.index, y='casos_nuevos')
fig.show()

Para ver las diferencias con Matplotlib:
* Interactividad
* Indices inteligentes
* Responsive
* Gráficos básicos con mayor calidad de presentación

In [None]:
fig = px.line(global_por_fecha, global_por_fecha.index, y='casos_nuevos')
fig.show()

global_por_fecha.plot();

#### 5º Refinar la presentación:
Lograr una visualización que sea lo mas parecida posible al gráfico de la página de la OMS.

In [None]:
fig = px.bar(global_por_fecha, x=global_por_fecha.index, y='casos_nuevos')
fig.show()

Cambiamos el color de los trazos a gris.

In [None]:
fig.update_traces(marker_color='grey')

Achicamos el tamaño vertical del gráfico (`height`) y agregamos un pequeño espacio entre barras.

In [None]:
fig.update_layout(height=250, bargap=0.05)

Quitamos las etiquetas de los ejes.

In [None]:
fig.update_layout(
    xaxis=dict(title=''), 
    yaxis=dict(title=''))

Cambiamos el color del fondo por blanco.

In [None]:
fig.update_layout(plot_bgcolor='rgba(0, 0, 0, 0)')

Movemos las etiquetas del eje Y hacia la derecha.

In [None]:
fig.update_layout(yaxis=dict(side='right'))

Para agregar el número total de casos acumulados primero lo guardamos en una variable.

In [None]:
global_por_fecha.cumsum().iloc[-1]['casos_nuevos']

In [None]:
total_casos_confirmados = global_por_fecha.cumsum().iloc[-1]['casos_nuevos']
total_casos_confirmados

Agregamos una anotación al gráfico.

In [None]:
fig.add_annotation(font={'family': 'Arial',
                        'size': 32},
                   text="{:,}".format(total_casos_confirmados),
                   x='2020-01-01',
                   y=400000,
                  showarrow=False)
fig.add_annotation(font={'family': 'Arial',
                        'size': 16},
                   text='casos confirmados',
                   x='2020-01-01',
                   y=300000,
                  showarrow=False)

Por último vamos a modificar el comportamiento al mover el mouse por encima de los datos, para que nos muestre la información correspondiente para la posición de X en la que nos encontremos.

In [None]:
fig.update_layout(hovermode='x')

In [None]:
fig.update_layout(hoverlabel=dict(
    bgcolor="white",
    font={'family': 'Arial', 'size': 16},
))

In [None]:
fig.update_layout(title="Global Situation")