In [1]:
import requests
import pandas as pd
from dotenv import load_dotenv
import os 
import time

In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Salud": ["UNH", "JNJ", "LLY", "MRK", "PFE"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Salud_company_overview.csv", index=False)
df_balance_sheet.to_csv("Salud_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Salud_cash_flow.csv", index=False)
df_income_statement.to_csv("Salud_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Salud
Descargando datos para: UNH
Descargando datos para: JNJ
Descargando datos para: LLY
Descargando datos para: MRK
Descargando datos para: PFE
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Consumo Discrecional": ["AMZN", "TSLA", "HD", "MCD", "NKE"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Consumo_Discrecional_company_overview.csv", index=False)
df_balance_sheet.to_csv("Consumo_Discrecional_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Consumo_Discrecional_cash_flow.csv", index=False)
df_income_statement.to_csv("Consumo_Discrecional_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Consumo Discrecional
Descargando datos para: AMZN
Descargando datos para: TSLA
Descargando datos para: HD
Descargando datos para: MCD
Descargando datos para: NKE
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Consumo Básico": ["PG", "KO", "PEP", "WMT", "COST"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Consumo_Basico_company_overview.csv", index=False)
df_balance_sheet.to_csv("Consumo_Basico_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Consumo_Basico_cash_flow.csv", index=False)
df_income_statement.to_csv("Consumo_Basico_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Consumo Básico
Descargando datos para: PG
Descargando datos para: KO
Descargando datos para: PEP
Descargando datos para: WMT
Descargando datos para: COST
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Energía": ["XOM", "CVX", "COP", "SLB", "EOG"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Energia_company_overview.csv", index=False)
df_balance_sheet.to_csv("Energia_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Energia_cash_flow.csv", index=False)
df_income_statement.to_csv("Energia_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Energía
Descargando datos para: XOM
Descargando datos para: CVX
Descargando datos para: COP
Descargando datos para: SLB
Descargando datos para: EOG
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Finanzas": ["BRK.B", "JPM", "BAC", "WFC", "MS"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Finanzas_company_overview.csv", index=False)
df_balance_sheet.to_csv("Finanzas_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Finanzas_cash_flow.csv", index=False)
df_income_statement.to_csv("Finanzas_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Finanzas
Descargando datos para: BRK.B
Descargando datos para: JPM
Descargando datos para: BAC
Descargando datos para: WFC
Descargando datos para: MS
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Industriales": ["RTX", "HON", "BA", "GE", "CAT"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Industriales_company_overview.csv", index=False)
df_balance_sheet.to_csv("Industriales_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Industriales_cash_flow.csv", index=False)
df_income_statement.to_csv("Industriales_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Industriales
Descargando datos para: RTX
Descargando datos para: HON
Descargando datos para: BA
Descargando datos para: GE
Descargando datos para: CAT
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Materiales": ["LIN", "SHW", "FCX", "APD", "NEM"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Materiales_company_overview.csv", index=False)
df_balance_sheet.to_csv("Materiales_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Materiales_cash_flow.csv", index=False)
df_income_statement.to_csv("Materiales_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Materiales
Descargando datos para: LIN
Descargando datos para: SHW
Descargando datos para: FCX
Descargando datos para: APD
Descargando datos para: NEM
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Inmobiliario": ["PLD", "AMT", "CCI", "SPG", "EQR"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Inmobiliario_company_overview.csv", index=False)
df_balance_sheet.to_csv("Inmobiliario_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Inmobiliario_cash_flow.csv", index=False)
df_income_statement.to_csv("Inmobiliario_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Inmobiliario
Descargando datos para: PLD
Descargando datos para: AMT
Descargando datos para: CCI
Descargando datos para: SPG
Descargando datos para: EQR
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Comunicación": ["CMCSA", "NFLX", "DIS", "WBD", "CHTR"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Comunicacion_company_overview.csv", index=False)
df_balance_sheet.to_csv("Comunicacion_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Comunicacion_cash_flow.csv", index=False)
df_income_statement.to_csv("Comunicacion_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Comunicación
Descargando datos para: CMCSA
Descargando datos para: NFLX
Descargando datos para: DIS
Descargando datos para: WBD
Descargando datos para: CHTR
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Servicios Públicos": ["NEE", "DUK", "SO", "AEP", "EXC"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Serv_Publicos_company_overview.csv", index=False)
df_balance_sheet.to_csv("Serv_Publicos_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Serv_Publicos_cash_flow.csv", index=False)
df_income_statement.to_csv("Serv_Publicos_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Servicios Públicos
Descargando datos para: NEE
Descargando datos para: DUK
Descargando datos para: SO
Descargando datos para: AEP
Descargando datos para: EXC
Descarga completada y datos guardados.


In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Tecnología de la Información": ["AAPL", "MSFT", "NVDA", "GOOGL", "META"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("TI_company_overview.csv", index=False)
df_balance_sheet.to_csv("TI_balance_sheet.csv", index=False)
df_cash_flow.to_csv("TI_cash_flow.csv", index=False)
df_income_statement.to_csv("TI_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Tecnología de la Información
Descargando datos para: AAPL
Descargando datos para: MSFT
Descargando datos para: NVDA
Descargando datos para: GOOGL
Descargando datos para: META
Descarga completada y datos guardados.


In [None]:
# Obtener el directorio actual donde está el script
input_directory = os.getcwd()

# Tipos de datos a consolidar
categories = ["company_overview", "balance_sheet", "cash_flow", "income_statement"]

# Archivos de salida
output_files = {
    "company_overview": "sp500_company_overview.csv",
    "balance_sheet": "sp500_balance_sheet.csv",
    "cash_flow": "sp500_cash_flow.csv",
    "income_statement": "sp500_income_statement.csv"
}

# Consolidar los datos
for category in categories:
    print(f"Procesando archivos para {category}...")
    consolidated_data = []
    header_columns = None  # Para guardar las columnas del primer archivo
    
    # Buscar archivos que pertenecen a la categoría
    for file_name in sorted(os.listdir(input_directory)):  # Ordenar para consistencia
        if category in file_name:
            file_path = os.path.join(input_directory, file_name)
            print(f"Leyendo archivo: {file_name}")
            
            # Leer el archivo
            try:
                if header_columns is None:
                    # Leer el primer archivo con encabezado
                    data = pd.read_csv(file_path, header=0)
                    header_columns = data.columns  # Guardar las columnas
                else:
                    # Leer los archivos posteriores sin encabezado
                    data = pd.read_csv(file_path, header=None)
                    data.columns = header_columns  # Asignar las mismas columnas
                
                consolidated_data.append(data)
            except Exception as e:
                print(f"Error leyendo archivo {file_name}: {e}")
    
    # Concatenar los archivos si hay datos
    if consolidated_data:
        consolidated_df = pd.concat(consolidated_data, ignore_index=True)
        
        # Guardar en un archivo maestro
        output_file = os.path.join(input_directory, output_files[category])
        consolidated_df.to_csv(output_file, index=False)
        print(f"Archivo consolidado guardado en: {output_file}")
    else:
        print(f"No se encontraron archivos para {category} o están vacíos.")

print("Consolidación completada.")


Procesando archivos para company_overview...
Leyendo archivo: Comunicacion_company_overview.csv
Leyendo archivo: Consumo_Basico_company_overview.csv
Leyendo archivo: Consumo_Discrecional_company_overview.csv
Leyendo archivo: Energia_company_overview.csv
Leyendo archivo: Finanzas_company_overview.csv
Leyendo archivo: Industriales_company_overview.csv
Leyendo archivo: Inmobiliario_company_overview.csv
Leyendo archivo: Materiales_company_overview.csv
Leyendo archivo: Salud_company_overview.csv
Leyendo archivo: Serv_Publicos_company_overview.csv
Leyendo archivo: TI_company_overview.csv
Archivo consolidado guardado en: c:\Users\FernandoSanz-Extreme\OneDrive - AMCHOR INVESTMENT STRATEGIES SGIIC, S.A\Escritorio\Ironhack\DATA_OCT24_MAD\Quests\Company_analysis\pruebas descargas\sp500_company_overview.csv
Procesando archivos para balance_sheet...
Leyendo archivo: Comunicacion_balance_sheet.csv
Leyendo archivo: Consumo_Basico_balance_sheet.csv
Leyendo archivo: Consumo_Discrecional_balance_sheet.c

In [None]:
# Tu clave de API de Alpha Vantage
API_KEY = os.getenv("API_KEY")

# Lista de las 5 principales compañías por sector en el S&P 500
sp500_top5_by_sector = {
    "Finanzas": ["BRK-B", "JPM", "BAC", "WFC", "MS"]
}

# Función para hacer la solicitud a la API
def fetch_alpha_vantage_data(symbol, endpoint):
    """
    Obtiene datos de Alpha Vantage para un símbolo específico y un endpoint dado.
    """
    url = f"https://www.alphavantage.co/query"
    params = {
        "function": endpoint,
        "symbol": symbol,
        "apikey": API_KEY
    }
    response = requests.get(url, params=params)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Error al obtener datos para {symbol}. Código de estado: {response.status_code}")
        return None

# Crear DataFrames para almacenar datos de todos los sectores
data_overview = []
data_balance_sheet = []
data_cash_flow = []
data_income_statement = []

# Descargar datos para cada compañía en cada sector
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)

        # Pausa para evitar el límite de solicitudes de la API
        time.sleep(12)  # Alpha Vantage permite 5 solicitudes por minuto para cuentas gratuitas.

# Convertir listas en DataFrames
df_overview = pd.DataFrame(data_overview)
df_balance_sheet = pd.DataFrame(data_balance_sheet)
df_cash_flow = pd.DataFrame(data_cash_flow)
df_income_statement = pd.DataFrame(data_income_statement)

# Guardar los datos como archivos CSV
df_overview.to_csv("Finanzas_company_overview.csv", index=False)
df_balance_sheet.to_csv("Finanzas_balance_sheet.csv", index=False)
df_cash_flow.to_csv("Finanzas_cash_flow.csv", index=False)
df_income_statement.to_csv("Finanzas_income_statement.csv", index=False)

print("Descarga completada y datos guardados.")

Procesando sector: Finanzas
Descargando datos para: BRK-B
Descargando datos para: JPM
Descargando datos para: BAC
Descargando datos para: WFC
Descargando datos para: MS
Descarga completada y datos guardados.


In [None]:
# replace the "demo" apikey below with your own key from https://www.alphavantage.co/support/#api-key
url = f'https://www.alphavantage.co/query?function=OVERVIEW&symbol=BRK-B&apikey={os.getenv("API_KEY")}'
r = requests.get(url)
data = r.json()

print(data)

{'Symbol': 'BRK-B', 'AssetType': 'Common Stock', 'Name': 'Berkshire Hathaway Inc', 'Description': 'Berkshire Hathaway Inc. is an American multinational conglomerate holding company headquartered in Omaha, Nebraska, United States. The company wholly owns GEICO, Duracell, Dairy Queen, BNSF, Lubrizol, Fruit of the Loom, Helzberg Diamonds, Long & Foster, FlightSafety International, Pampered Chef, Forest River, and NetJets, and also owns 38.6% of Pilot Flying J; and significant minority holdings in public companies Kraft Heinz Company (26.7%), American Express (18.8%), The Coca-Cola Company (9.32%), Bank of America (11.9%), and Apple (6.3%).', 'CIK': '1067983', 'Exchange': 'NYSE', 'Currency': 'USD', 'Country': 'USA', 'Sector': 'FINANCE', 'Industry': 'FIRE, MARINE & CASUALTY INSURANCE', 'Address': '3555 FARNAM STREET, OMAHA, NE, US', 'OfficialSite': 'https://www.berkshirehathaway.com', 'FiscalYearEnd': 'December', 'LatestQuarter': '2024-09-30', 'MarketCapitalization': '1029257101000', 'EBITD

In [1]:
symbols1 = ["AAPL", "MSFT", "NVDA", "GOOGL", "META", "UNH", "JNJ", "LLY", "MRK", "PFE", "AMZN", "TSLA", "HD", "MCD", "NKE", "PG", "KO", "PEP", "WMT", "COST", "XOM", "CVX", "COP", "SLB", "EOG"]
symbols2 = ["BRK-B", "JPM", "BAC", "WFC", "MS", "RTX", "HON", "BA", "GE", "CAT", "LIN", "SHW", "FCX", "APD", "NEM", "PLD", "AMT", "CCI", "SPG", "EQR", "CMCSA", "NFLX", "DIS", "WBD", "CHTR"]
symbols3 = ["NEE", "DUK", "SO", "AEP", "EXC"]

In [None]:
#definimos los parametros que queremos sacar y la contraseña de la API
my_key = os.getenv("API_KEY")
alpha_function= "TIME_SERIES_DAILY"
alpha_outputsize = "full"

#Creamos lista vacia en la que ir guardndo los datos que nos devuelve la API
data = []

#Hacemos un bule para sacar los datos de todos los valores de la lista (hay limite de 25 diarios pero le pasamos toda la lista)
for value in symbols3:
    print(f"Procesando symbol: {value}")
    alpha_symbol = value
    url = f"https://www.alphavantage.co/query?function={alpha_function}&symbol={alpha_symbol}&apikey={my_key}&outputsize={alpha_outputsize}"
    r = requests.get(url)
    data.append(r.json())
    time.sleep(12) #Metemos un sleep porque la API también tiene limite de maximo 5 llamadas por minuto

Procesando symbol: NEE
Procesando symbol: DUK
Procesando symbol: SO
Procesando symbol: AEP
Procesando symbol: EXC


In [3]:
import json
with open('data3.json', 'w', encoding='utf-8') as f:
    json.dump(data, f, ensure_ascii=False, indent=4)

In [None]:
for sector, companies in sp500_top5_by_sector.items():
    print(f"Procesando sector: {sector}")
    for symbol in companies:
        print(f"Descargando datos para: {symbol}")
        # Company Overview
        overview = fetch_alpha_vantage_data(symbol, "OVERVIEW")
        if overview:
            overview["sector"] = sector
            data_overview.append(overview)

        # Balance Sheet
        balance_sheet = fetch_alpha_vantage_data(symbol, "BALANCE_SHEET")
        if balance_sheet and "annualReports" in balance_sheet:
            for report in balance_sheet["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_balance_sheet.append(report)

        # Cash Flow
        cash_flow = fetch_alpha_vantage_data(symbol, "CASH_FLOW")
        if cash_flow and "annualReports" in cash_flow:
            for report in cash_flow["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_cash_flow.append(report)

        # Income Statement
        income_statement = fetch_alpha_vantage_data(symbol, "INCOME_STATEMENT")
        if income_statement and "annualReports" in income_statement:
            for report in income_statement["annualReports"]:
                report["symbol"] = symbol
                report["sector"] = sector
                data_income_statement.append(report)