## Tabla de contenidos:
* [Carga de datos](#carga-datos)
* [Gráfico animado](#grafico-burbujas)

### Carga del dataset con los datos preparados para los gráficos <a class="anchor" name="carga-datos"/>

In [None]:
import pandas as pd
import numpy as np

df_books_by_genre_and_year = pd.read_csv("books_by_genre_and_year.csv")

# Convertir los tipos float a int
df_books_by_genre_and_year.publication_year = df_books_by_genre_and_year.publication_year.astype(dtype=np.int32)
df_books_by_genre_and_year.num_pages = df_books_by_genre_and_year.num_pages.astype(dtype=np.int32)
df_books_by_genre_and_year.ratings_count = df_books_by_genre_and_year.ratings_count.astype(dtype=np.int32)
df_books_by_genre_and_year.number_of_books = df_books_by_genre_and_year.number_of_books.astype(dtype=np.int32)

df_books_by_genre_and_year.info()

### Gráfico animado con  burbujas <a class="anchor" name="grafico-burbujas"/>

Hemos preparado un gráfico animado mediante el uso de las librerías **plotly** y **bubbly**.
La animación representa el total del número de libros publicados durante los años (eje x), así como su valoración media (eje y), género (se representa en la burbuja), super género (se representa con el color de la burbuja) y número de valoraciones (tamaño de la burbuja)

Podemos explorar la información de 2 formas distintas respecto a la variable "fecha de publicación":
    1. De modo automático con el botón "play"
    2. De modo manual arrastando para ello la barra de control ubicada bajo el gráfico.
 
También es posible controlar el nivel de zoom del gráfico mediante:
    1. Mediante el botón "zoom" ubicado en la barra ubicada en la parte superior del gráfico.
    2. Seleccionando con el ratón un área del gráfico sobre la que quedamos hacer zoom.
    
Por último podremos ver con más detalle la información del gráfico al pasar el puntero del ratón por encima de las burbujas. Al hacerlo podremos ver el género, super género, valoración media y total de valoraciones al que pertenece el libro.

![bubbleplot](images/bubbleplot.png)

In [None]:
from plotly.offline import init_notebook_mode, iplot
init_notebook_mode()
from bubbly.bubbly import bubbleplot

figure = bubbleplot(
    dataset=df_books_by_genre_and_year.sort_values(by="publication_year"),
    x_column = 'number_of_books',
    y_column = 'average_rating',
    bubble_column='genre',
    time_column="publication_year",
    size_column="ratings_count",
    color_column="supergenre")

iplot(figure)

<div style="width:100%;">
    <div style="float: left;">
            <div style="text-align: left">
            <a href="./books.ipynb">Volver a Análisis de Datos</a>
        </div>
    </div>
    <div style="float: right;">
        <div style="text-align: right">
            <a href="./books-bigml.ipynb">Continuar a Machine Learning</a>
        </div>
    </div>
</div>