In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Function to fetch and parse inflation data for a given year
def fetch_inflation_data(year):
    # Build the URL using the provided year
    url = f"https://www.inflation.eu/es/tasas-de-inflacion/alemania/inflacion-historica/ipc-inflacion-alemania-{year}.aspx"
    
    # Perform a GET request to the page
    response = requests.get(url)
    response.raise_for_status()  # Ensure the request was successful
    
    # Parse the page content with BeautifulSoup
    soup = BeautifulSoup(response.content, 'html.parser')
    
    # Find all table rows <tr> with classes "tabledata1" or "tabledata2"
    rows = soup.find_all('tr', class_=['tabledata1', 'tabledata2'])
    
    # Prepare a list to store the data
    data = []
    
    # Extract relevant data from each row
    for row in rows:
        cells = row.find_all('td')
        if len(cells) >= 2:
            # Extract and clean the text from the cells
            month_period = cells[0].get_text(strip=True)
            monthly_rate = cells[1].get_text(strip=True)
            
            # Get the month name
            month_name = month_period.split(' ')[0]
            
            # Remove percentage symbol and replace comma with a dot
            monthly_rate_value = float(monthly_rate.replace('%', '').replace(',', '.'))
            
            # Append the data to the list
            data.append({'Year': int(year), 'Month': month_name, 'Inflation': monthly_rate_value})
    
    return data

# Main program loop
complete_data = []  # Initialize an empty list for the complete data

while True:
    # Request the year from the user
    year = input("Enter the year you want to query: ")
    
    # Fetch and append the data for the specified year
    complete_data.extend(fetch_inflation_data(year))
    
    # Create a DataFrame with the collected data
    df = pd.DataFrame(complete_data)
    
    # Display the DataFrame
    print(df)
    
    # Ask if the user wants to perform another query
    another_query = input("Do you want to perform another query? (yes/no): ").strip().lower()
    
    if another_query != 'yes':
        break  # Exit the loop if the user does not want another query

# If you want, you can save the DataFrame to a file here

Enter the year you want to query:  2018


    Year       Month  Inflation
0   2018       enero      -0.58
1   2018     febrero       0.29
2   2018       marzo       0.59
3   2018       abril       0.19
4   2018        mayo       0.78
5   2018       junio       0.10
6   2018       julio       0.38
7   2018      agosto       0.10
8   2018  septiembre       0.19
9   2018     octubre       0.19
10  2018   noviembre      -0.67
11  2018   diciembre       0.00


Do you want to perform another query? (yes/no):  yes
Enter the year you want to query:  2019


    Year       Month  Inflation
0   2018       enero      -0.58
1   2018     febrero       0.29
2   2018       marzo       0.59
3   2018       abril       0.19
4   2018        mayo       0.78
5   2018       junio       0.10
6   2018       julio       0.38
7   2018      agosto       0.10
8   2018  septiembre       0.19
9   2018     octubre       0.19
10  2018   noviembre      -0.67
11  2018   diciembre       0.00
12  2019       enero      -0.77
13  2019     febrero       0.39
14  2019       marzo       0.39
15  2019       abril       0.96
16  2019        mayo       0.19
17  2019       junio       0.28
18  2019       julio       0.47
19  2019      agosto      -0.19
20  2019  septiembre       0.00
21  2019     octubre       0.09
22  2019   noviembre      -0.75
23  2019   diciembre       0.47


Do you want to perform another query? (yes/no):  yes
Enter the year you want to query:  2020


    Year       Month  Inflation
0   2018       enero      -0.58
1   2018     febrero       0.29
2   2018       marzo       0.59
3   2018       abril       0.19
4   2018        mayo       0.78
5   2018       junio       0.10
6   2018       julio       0.38
7   2018      agosto       0.10
8   2018  septiembre       0.19
9   2018     octubre       0.19
10  2018   noviembre      -0.67
11  2018   diciembre       0.00
12  2019       enero      -0.77
13  2019     febrero       0.39
14  2019       marzo       0.39
15  2019       abril       0.96
16  2019        mayo       0.19
17  2019       junio       0.28
18  2019       julio       0.47
19  2019      agosto      -0.19
20  2019  septiembre       0.00
21  2019     octubre       0.09
22  2019   noviembre      -0.75
23  2019   diciembre       0.47
24  2020       enero      -0.57
25  2020     febrero       0.30
26  2020       marzo       0.20
27  2020       abril       0.10
28  2020        mayo       0.00
29  2020       junio       0.10
30  2020

Do you want to perform another query? (yes/no):  no


In [None]:
df.to_excel('inflation_data.xlsx', index=False)