### Otras Librerías

En esta clase vamos a conocer otras librerías de Python para visualizaciones de mucha utilidad:

- Bokeh: para visualizaciones interactivas
- Folium: para visualizar geolocalizaciones
- WordCloud: para visualizar nubes de palabras


In [None]:
pip install pandas_bokeh

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting pandas_bokeh
  Downloading pandas_bokeh-0.5.5-py2.py3-none-any.whl (29 kB)
Installing collected packages: pandas_bokeh
Successfully installed pandas_bokeh-0.5.5


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

### Bokeh

Esta es una libreria para visualizaciones que permite gráficos interactivos, para construir un gráfico primero es necesario definir la **figure** y luego definir como se realizará el Gráfico. 
**Glyphs (glifos)**; Son los objetos básicos que conforman los gráficos Bokeh, por ejemplo: lineas, rectángulos, cuadrados.

**Outputs**: Para la salida de los documentos se puede configurar de distintas maneras, dos de ellas son *output_file* (genera archivos html) o *output_notebook* (muestra en la Notebook) que se colocan junto con **show** o **save**
Estas funciones generalmente son invocadas junto a las funciones `show` o `save`

[Documentación Bokeh](https://bokeh.org/)

Vamos a realizar gráficos con el dataset de Instagram que utilizamos la clase pasada. Ya que hicimos una limpieza vamos a utilizar el Dataset limpio que la clase pasada contruimos con *to_csv*.

In [None]:
import pandas as pd
import numpy as np

In [None]:
data = pd.read_csv("instagram_limpio.csv")

FileNotFoundError: ignored

In [None]:
data.head()

In [None]:
# Definimos eje x, utlizamos to_list para crear una lista a partir de la Series

x= data["descripcion"].value_counts().index.to_list()
y= data["descripcion"].value_counts().to_list()


In [None]:
from bokeh.plotting import figure, show, output_notebook

# Definimos la figura
p = figure(x_range=x, height=350, title="Cantidad por descripcion")

#Definimos el gráfico
p.vbar(x=x, top=y, width=0.9)
output_notebook()

show(p)

In [None]:
x= data["publicaciones"].to_list()
y= data["seguidores"].to_list()

In [None]:
output_notebook()
p = figure(width=500, height=500)
p.circle(x, y, size=7, color="firebrick", alpha=0.5)
output_notebook()

show(p)

In [None]:
pip install folium


### Folium

Esta libreria es útil para realizar gráficos con datos geolocalizados, en este caso vamos a hacer un mapa donde se marquen los árboles del Dataset del Arbolado de la Ciudad de Buenos Aires.

Primero debemos definir con latitud y longitud el área que vamos a gráficar, en este caso colocamos los datos del primer registro. En segundo lugar se definen los Marcadores que vamos a utilizar.

[Documentación Folium](https://python-visualization.github.io/folium/)


In [1]:
import folium

In [None]:
data = pd.read_csv("https://cdn.buenosaires.gob.ar/datosabiertos/datasets/arbolado-publico-lineal/arbolado-publico-lineal-2017-2018.csv")

In [None]:
data.head(1)

In [2]:
# Generamos el mapa

mapa = folium.Map(location=[-34.594902, -58.378563])

In [3]:
mapa

In [8]:
# Creamos el mapa con 2 marcadores correspondientes a los dos primeros arboles del dataset y al marcarlo se leera "Click aqui"

mapa = folium.Map(location=[-34.594902, -58.378563], zoom_start=12, tiles="Stamen Terrain")

tooltip = "Click Aquí!"
folium.Marker(
    [-34.592319, -58.681532], popup="<i>Hola</i>", tooltip=tooltip
).add_to(mapa)
folium.Marker(
    [-34.657717	, -58.468852], popup="<b>Timberline Lodge</b>", tooltip=tooltip
).add_to(mapa)

<folium.map.Marker at 0x7f49b33b8d90>

In [9]:
mapa

In [None]:
# No es posible realizar este mapa con datos nulos por lo que vamos a eliminarlos del dataset

data_mapa = data.dropna()

In [None]:
# Dado que el archivo es muy grande y va a tardar mucho, vamos a tomar una muestra aleatoria de 1000 arboles

data_mapa_muestra = data_mapa.sample(1000)

In [None]:
# Vamos a crear el mapa y una funcion lambda para iterar sobre el DataFrame y generar cada marcador
# VAmos a indicar que sea verde y que la información del marcador sea el tipo de arbol (nombre cientifico)

mapa = folium.Map(location=[-34.594902, -58.378563], zoom_start=12, tiles="Stamen Terrain")
data_mapa_muestra.apply(lambda row:folium.Marker(
    location=[row["lat"],row["long"]],popup=row["nombre_cientifico"], icon=folium.Icon(color="green", icon="info-sign")).add_to(mapa), axis=1)
mapa

In [None]:
pip install wordcloud


In [None]:
import random 
from wordcloud import WordCloud

# Creamos un vector con posibles palabras de manera aleatoria
lista_palabras = ["datos", "analisis", "Python", "Aprender Programando", "UTN", "Storytelling", "dataset", "Pandas", "Gráficos", "Visuzalizaciones", "Estadìstica"]

# Usamos random.choices para generar aleatoriamente 100 palabras. 
palabras = random.choices(lista_palabras, k = 100)
palabras

In [None]:
# Creamos la nube de palabras
wordcloud = WordCloud().generate(" ".join(palabras))
plt.figure(figsize=(10, 10))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()