# Análisis del Producto Interno Bruto (PIB) por Industria
Este Jupyter Notebook tiene como objetivo obtener y analizar datos del Producto Interno Bruto (PIB) por industria proporcionados por la API de la Oficina de Análisis Económico (BEA) de los Estados Unidos. A continuación se describen los pasos realizados en este notebook:

1. **Importación de las bibliotecas necesarias**: Se importan las bibliotecas `requests`, `pandas`, `matplotlib.pyplot`, `os` y `dotenv` para manejar las solicitudes HTTP, manipular datos, crear gráficos, manejar variables de entorno y cargar variables de entorno desde un archivo `.env`, respectivamente.

2. **Carga de variables de entorno**: Se cargan las variables de entorno desde un archivo `.env` para obtener la clave de la API de BEA.

3. **Configuración de la solicitud a la API**: Se define la URL de la API y los parámetros necesarios para realizar la solicitud GET a la API de BEA para obtener datos del PIB por industria de los últimos 5 años.

4. **Realización de la solicitud a la API**: Se realiza la solicitud GET a la API de BEA y se verifica si la solicitud fue exitosa. Si la solicitud es exitosa, se parsea la respuesta JSON y se extraen los datos.

5. **Almacenamiento de los datos**: Los datos obtenidos se convierten en un DataFrame de pandas y se guardan en un archivo CSV en la ruta especificada.

6. **Análisis y visualización de los datos**: Se realizan análisis y visualizaciones de los datos obtenidos para comprender mejor las tendencias del PIB por industria.

## Variables presentes en este notebook:
- `api_key`: Clave de la API de BEA.
- `data`: Diccionario que contiene la respuesta JSON de la API de BEA.
- `df`: DataFrame de pandas que contiene los datos del PIB por industria.
- `output_path`: Ruta donde se almacena el archivo CSV con los datos del PIB por industria.
- `params`: Diccionario con los parámetros de la solicitud a la API de BEA.
- `response`: Objeto de respuesta de la solicitud GET a la API de BEA.
- `results`: Lista que contiene los datos extraídos de la respuesta JSON de la API de BEA.
- `url`: URL de la API de BEA.


In [23]:
import requests
import pandas as pd
import matplotlib.pyplot as plt
import os
from dotenv import load_dotenv

# Cargar las variables de entorno desde el archivo .env
load_dotenv()

# Obtener la clave de la API desde la variable de entorno
api_key = os.getenv('BEA_API_KEY')

if api_key is None:
    print("Error: La clave de API no está configurada correctamente.")
else:
    # Definir la URL de la API
    url = "https://apps.bea.gov/api/data"

    # Parámetros de la solicitud para obtener datos de GDP por industria
    params = {
        "UserID": api_key,
        "method": "GetData",
        "datasetname": "GDPbyIndustry",
        "TableName": "ALL",  # Consultar todas las tablas (puedes especificar una tabla si prefieres)
        "Year": "2017,2018,2019,2020,2021",  # Últimos 5 años
        "Frequency": "A",  # Datos anuales
        "Industry": "ALL",  # Todas las industrias
        "TableID": "ALL",  # Todas las tablas
        "ResultFormat": "json"
    }

    try:
        # Realizar la solicitud GET a la API de BEA
        response = requests.get(url, params=params)

        # Verificar si la solicitud fue exitosa
        if response.status_code == 200:
            # Parsear la respuesta JSON
            data = response.json()

            # Verificar si la respuesta contiene resultados
            if 'Results' in data['BEAAPI']:
                # Extraer los datos
                results = data['BEAAPI']['Results'][0]['Data']
                
                # Convertir los datos en un DataFrame de pandas
                df = pd.DataFrame(results)
                
                # Definir la ruta de almacenamiento
                output_path = r"C:\Users\Juan\Documents\Universidad\ETL\data\gdp_by_industry.csv"
                
                # Guardar el DataFrame en formato CSV en la ruta especificada
                df.to_csv(output_path, index=False)
                print(f"Archivo CSV almacenado en: {output_path}")
                
            else:
                print("No se encontraron resultados en la respuesta.")
        else:
            print(f"Error en la solicitud. Código de estado: {response.status_code}")

    except Exception as e:
        print(f"Error al procesar la solicitud: {e}")


Archivo CSV almacenado en: C:\Users\Juan\Documents\Universidad\ETL\data\gdp_by_industry.csv


In [24]:
# Print the first few rows and column names of the DataFrame
print(df.head())
print(df.columns)


  TableID Frequency  Year Quarter Industry  \
0       1         A  2017    2017       11   
1       1         A  2017    2017    111CA   
2       1         A  2017    2017    113FF   
3       1         A  2017    2017       21   
4       1         A  2017    2017      211   

                           IndustrYDescription DataValue NoteRef  
0  Agriculture, forestry, fishing, and hunting     176.8       1  
1                                        Farms     138.7       1  
2    Forestry, fishing, and related activities      38.1       1  
3                                       Mining     267.3       1  
4                       Oil and gas extraction     161.1       1  
Index(['TableID', 'Frequency', 'Year', 'Quarter', 'Industry',
       'IndustrYDescription', 'DataValue', 'NoteRef'],
      dtype='object')
