In [1]:
import pandas as pd
import sqlite3
import requests
from bs4 import BeautifulSoup
from io import StringIO


# Codificar la URL correctamente
url = 'https://es.wikipedia.org/wiki/Kylian_Mbappé#Estadísticas'
response = requests.get(url)

# SOLUCIONAR EL ERROR DE UNICODE
# response.encoding = 'utf-8'  # Establecer la codificación a UTF-8

# Usar BeautifulSoup para analizar el contenido HTML
# 'html.parser' es el analizador HTML integrado a BeautifulSoup
soup = BeautifulSoup(response.text, 'html.parser')

# *** Convertir el HTML a un objeto StringIO ***
# StringIO: Convertimos el HTML completo en una cadena
html_string = str(soup)
# y luego lo envolvemos en un objeto StringIO.
html_io = StringIO(html_string)
# Esto simula un archivo HTML, permitiendo a pd.read_html leerlo adecuadamente.
# Leer las tablas del HTML usando StringIO
tables = pd.read_html(html_io)

# Conexion a base de datos
conn = sqlite3.connect('jugadores.db')

# Itera dentro de la pagina, imprime el indice y el dataframe (tabla) que encuentre
for index, table in enumerate(tables):
    print("**************************************************************")
    print("**************************************************************")
    print('Index', index)
    print('Tbl->Col', table)

**************************************************************
**************************************************************
Index 0
Tbl->Col                                         Kylian Mbappé  \
0                      Oficial de la Legión de Honor.   
1                                                 NaN   
2                                    Datos personales   
3                                     Nombre completo   
4                                            Apodo(s)   
5                                          Nacimiento   
6                                    Nacionalidad(es)   
7                                              Altura   
8                                                Peso   
9                                   Carrera deportiva   
10                                            Deporte   
11                                   Club profesional   
12                                    Debut deportivo   
13                                               Club   
14

In [2]:
df = pd.DataFrame(tables[3])
df

Unnamed: 0_level_0,Club,Div.,Temporada,Liga,Liga,Liga,Copas nacionales,Copas nacionales,Copas nacionales,Copas internacionales,Copas internacionales,Copas internacionales,Total,Total,Total
Unnamed: 0_level_1,Club,Div.,Temporada,Part.,Goles,Asist.,Part.,Goles,Asist.,Part.,Goles,Asist.,Part.,Goles,Asist.
0,A. S. Monaco F. C. II Francia,4.ª,2015-16,10,2,0,—,—,—,—,—,—,10,2,0
1,A. S. Monaco F. C. II Francia,4.ª,2016-17,2,2,0,—,—,—,—,—,—,2,2,0
2,A. S. Monaco F. C. II Francia,Total club,Total club,12,4,0,0,0,0,0,0,0,12,4,0
3,A. S. Monaco F. C. Francia,1.ª,2015-16,11,1,1,2,0,1,1,0,1,14,1,3
4,A. S. Monaco F. C. Francia,1.ª,2016-17,29,15,11,6,5,3,9,6,0,44,26,14
5,A. S. Monaco F. C. Francia,1.ª,2017-18,1,0,0,1,0,0,0,0,0,2,0,0
6,A. S. Monaco F. C. Francia,Total club,Total club,41,16,12,9,5,4,10,6,1,60,27,17
7,Paris Saint-Germain F. C. Francia,1.ª,2017-18,27,13,7,9,4,6,8,4,3,44,21,16
8,Paris Saint-Germain F. C. Francia,1.ª,2018-19,29,33,9,6,2,3,8,4,5,43,39,17
9,Paris Saint-Germain F. C. Francia,1.ª,2019-20,20,18,7,7,7,5,10,5,6,37,30,18


In [3]:
    try:
        #Select el index que deseamos
        table = tables[3]
        table_name = 'mbappe'
        # Exporto la tabla a sqlite
        table.to_sql(table_name, conn, if_exists='replace', index=False)

        print(f'Tabla {table_name} exportada a SQLite')
    except Exception as e:
        print(f'Error al exportar tabla {table_name}: {str(e)}')

conn.commit()
# Cierro conexion a la base de datos
conn.close()

Tabla mbappe exportada a SQLite
