El WebScrapping puede usarse, por ejemplo, en el llamado "*TheoryCraft*" de los videojuegos. Esto es, analizar los de datos de determinados aspectos de un videojuego para optimizar un aspecto determinado de la experiencia. Se usa principalmente para estudiar a los personajes y **evaluar su nivel de poder** para saber cuáles son los que tienen un mayor **retorno** (más facilidad para completar contenido) a menor **inversión**.

En este caso, vamos a extraer los datos de los stats principales de los 83 personajes presentes (a 5 de junio de 2024) en el videojuego Genshin Impact para aprender cómo convertir una tabla de su página "wiki" a una DataFrame o un Excel. 

## Paso a Paso

In [None]:
# Importamos la librería request para manejar las peticiones de acceso a la web y descarga de contenido.
import requests
# Especificamos la web
enlace = "https://genshin-impact.fandom.com/wiki/Character/Comparison"

# Convertimos la web en texto
texto_web = requests.get(enlace).text
print(texto_web)

In [None]:
# Para darle un formato, BeautifulSoup tiene a su disposición un módulo para "formatear" o dar forma al contenido 
# usando el parser que presentamos anteriormente.

from bs4 import BeautifulSoup
sopa = BeautifulSoup(texto_web, 'lxml')
print(sopa)

In [None]:
# La información que queremos se encuentra en las tablas, vamos a recuperarlas
tablas = sopa.find_all('table')
print(tablas)

In [None]:
# Al existir varias tablas, tenemos que localizarlas. La clase de CSS de las tablas es "article-table sortable"

tablas_datos_personajes = sopa.find_all('table', class_= 'article-table sortable')
print(tablas_datos_personajes)

In [None]:
# Vemos que tenemos todas las tablas, el tipo de variable es ResultSet
type(tablas_datos_personajes)

In [None]:
# Vamos a seleccionar la primera tabla, la de los stats de los personajes
stats_personajes = tablas_datos_personajes[0]
print(stats_personajes)

In [None]:
# Para localizar a los personajes, vamos a transformar la tabla a una estructura dataframe de pandas

import pandas as pd
dataframe_informacion_personajes = pd.read_html(str(stats_personajes))[0]
print(dataframe_informacion_personajes)

In [None]:
# Podemos guardar esta información en un archivo Excel:
!pip install XlsxWriter
# Guardamos la información en el archivo:
archivo_stats_personajes = pd.ExcelWriter('Characters Base Stats comparison paso a paso.xlsx', engine='xlsxwriter')
dataframe_informacion_personajes.to_excel(archivo_stats_personajes, sheet_name='List')
archivo_stats_personajes.close() #el .save() dejó de funcionar, hay que usar .close()

## A pelo

In [None]:
# Importamos la librería request para manejar las peticiones de acceso a la web y descarga de contenido.
import requests

# Especificamos la web
enlace = "https://genshin-impact.fandom.com/wiki/Character/Comparison"

# Convertimos la web en texto
texto_web = requests.get(enlace).text

# Para darle un formato, BeautifulSoup tiene a su disposición un módulo para "formatear" o dar forma al contenido 
# usando el parser que presentamos anteriormente.
from bs4 import BeautifulSoup
sopa = BeautifulSoup(texto_web, 'lxml')

# La información que queremos se encuentra en las tablas, vamos a recuperarlas
tablas = sopa.find_all('table')

# Al existir varias tablas, tenemos que localizarlas. La clase de CSS de las tablas es "article-table sortable"
tablas_datos_personajes = sopa.find_all('table', class_= 'article-table sortable')

# Vamos a seleccionar la primera tabla, la de los stats de los personajes
stats_personajes = tablas_datos_personajes[0]

# Para localizar a los personajes, vamos a transformar la tabla a una estructura dataframe de pandas
import pandas as pd
dataframe_informacion_personajes = pd.read_html(str(stats_personajes))[0]

# Podemos guardar esta información en un archivo Excel:
!pip install XlsxWriter
# Guardamos la información en el archivo:
archivo_stats_personajes = pd.ExcelWriter('Characters Base Stats comparison directo.xlsx', engine='xlsxwriter')
dataframe_informacion_personajes.to_excel(archivo_stats_personajes, sheet_name='List')
archivo_stats_personajes.close() #el .save() dejó de funcionar, hay que usar .close()

El resultado de ejecutar todo el Notebook es que se generarán 2 Excels iguales pero con distinto nombre. 

## Cabe destacar que es posible importar varias tablas y unificarlas en un mismo Excel en varias hojas o sheets, en caso de querer ampliar la información obtenida.

Lo que debería hacer un TheoryCrafter a partir de aquí sería aplicar un análisis estadístico de sus variables para averiguar los datos de interés y poder llegar a una conclusión y poder comunicarle un veredicto a su comunidad con consejos para el resto de jugadores.