## Web Scrapping para obtener los Indice de Masa Corporal

In [49]:
import requests
import pandas as pd
from bs4 import BeautifulSoup

In [50]:
response = requests.get(
	url="https://es.wikipedia.org/wiki/Anexo:%C3%8Dndice_de_masa_corporal_de_la_poblaci%C3%B3n_por_pa%C3%ADs",
)

In [51]:
def scrape_wiki_table(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')

    table = soup.find('table', {'class': 'wikitable'})

    headers = [header.text.strip() for header in table.find_all('th')]
    rows = []
    for row in table.find_all('tr'):
        cells = row.find_all('td')
        if len(cells) > 0:
            row_data = [cell.text.strip() for cell in cells]
            if len(row_data) < len(headers):
                row_data += [''] * (len(headers) - len(row_data))  # Append empty strings for missing cells
            rows.append(row_data)

    df = pd.DataFrame(rows, columns=headers)
    return df

df = scrape_wiki_table("https://es.wikipedia.org/wiki/Anexo:%C3%8Dndice_de_masa_corporal_de_la_poblaci%C3%B3n_por_pa%C3%ADs")
df = df[["País", "Porcentaje global", "Porcentaje en hombres", "Porcentaje en mujeres"]]
df.rename(columns={
    "Porcentaje en hombres": "IMC_Hombres",
    "Porcentaje global": "IMC_Global",
    "Porcentaje en mujeres": "IMC_Mujeres"
}, inplace=True)

df.to_csv('IMC.csv', index=False)