## üöÄ Scale Your MVP

### 1. Full Coverage: The Magnificent Seven
Target companies:

- Apple, Microsoft, Amazon, Google (Alphabet), Meta, Nvidia, Tesla
- Benchmark: S&P 500
### 2. Database PostgreSQL
Create a relational database with the following tables:

- **stock_prices:** historical prices per company

- **market_events:** price events (+/-5%) or key news

- **news_raw:** all raw news articles

- **news_clean:** cleaned and filtered relevant news

- **gpt_analysis:** GPT sentiment and investment recommendation output

- **backtest_results:** ROI of simulated investments after event

### 3. Visualizations
Using Plotly, Seaborn, or Power BI:

üìà Price chart with event markers and GPT sentiment

üìä ROI comparison: real investment vs. investment after news

üìä Event impact ranking by company

üß† Correlation between GPT relevance and actual ROI

### 4. Pipeline Automation
With argparse or modular scripts that do:

- Event detection

- News retrieval

- News filtering + cleaning

- Prompt generation

- GPT evaluation

- Result storage

- ROI simulation

### 5. Comparison Against S&P 500
Calculate the ROI of the S&P 500 on the same event dates

Compare each company's ROI with the index

Did the event impact only the company or also the market?

### 6. Heuristic-Based Decision Making
Define a simple decision tree based on GPT output:

- if relevance > 0.7 and sentiment == "Bullish" and PER < 20:
    return "Buy"
- elif relevance > 0.7 and sentiment == "Bullish" and PER > 35:
    return "Risk"

In [2]:
symbols = ["AAPL", "MSFT", "AMZN", "GOOGL", "META", "NVDA", "TSLA"]

In [1]:
import os
import openai
import pandas as pd
from alpaca_trade_api.rest import REST
import pandas as pd
from datetime import datetime, timedelta
import requests
from dotenv import load_dotenv
import os

load_dotenv()

ALPACA_API_KEY = os.getenv("ALPACA_API_KEY")
ALPACA_API_SECRET = os.getenv("ALPACA_API_SECRET")
ALPACA_BASE_URL = os.getenv("ALPACA_BASE_URL")
ALPHA_VANTAGE_API_KEY = os.getenv("ALPHA_VANTAGE_API_KEY")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

openai.api_key = OPENAI_API_KEY

### 1. EVENT IDENTIFIER - AAPL
Down/upsides  of over 5% in a Day

In [6]:
# === CONEXI√ìN ===
api = REST(ALPACA_API_KEY, ALPACA_API_SECRET, ALPACA_BASE_URL, api_version="v2")

def get_price_data(symbol: str, start_date: str, end_date: str, pct_change):
    df = api.get_bars(symbol, timeframe='1D', start=start_date, end=end_date).df
    # df = df[df['symbol'] == symbol]  ‚ùå innecesaria
    df['pct_change'] = df['close'].pct_change() * 100
    df['event'] = df['pct_change'].abs() > pct_change
    return df


def detect_price_events(df):
    return df[df['event']].copy()

In [9]:
if __name__ == "__main__":
    symbol = "SPY"
    df = get_price_data(symbol, "2000-01-01", "2025-03-31", 5)
    events = detect_price_events(df)
    print(events[['close', 'pct_change']])

                             close  pct_change
timestamp                                     
2020-03-09 04:00:00+00:00  276.320   -7.097468
2020-03-12 04:00:00+00:00  255.240   -6.931632
2020-03-13 04:00:00+00:00  270.200    5.861150
2020-03-16 04:00:00+00:00  241.065  -10.782754
2020-03-17 04:00:00+00:00  254.190    5.444590
2020-03-18 04:00:00+00:00  235.690   -7.278020
2020-03-24 04:00:00+00:00  242.000    8.676127
2020-03-26 04:00:00+00:00  260.930    5.729568
2020-04-06 04:00:00+00:00  264.740    6.771527
2020-06-11 04:00:00+00:00  300.690   -5.748676
2022-11-10 05:00:00+00:00  394.690    5.495416


In [10]:
if __name__ == "__main__":
    symbol = "AAPL"
    df = get_price_data(symbol, "2022-01-01", "2025-03-31", 5)
    events = detect_price_events(df)
    print(events[['close', 'pct_change']])

                            close  pct_change
timestamp                                    
2022-01-28 05:00:00+00:00  170.33    6.977767
2022-05-05 04:00:00+00:00  156.77   -5.571618
2022-05-11 04:00:00+00:00  146.50   -5.184130
2022-05-18 04:00:00+00:00  140.82   -5.641919
2022-09-13 04:00:00+00:00  153.84   -5.867956
2022-10-28 04:00:00+00:00  155.74    7.555249
2022-11-10 05:00:00+00:00  146.87    8.897457
2024-05-03 04:00:00+00:00  183.38    5.981622
2024-06-11 04:00:00+00:00  207.15    7.264913


### 2. GET NEWS for EVENT - AAPL +7.27%  in 11-06-2024    
Check out the News from AlphaVantage that came out near to this EVENT

In [52]:
from datetime import datetime, timedelta
import pandas as pd
import requests
import os

def get_news_sentiments_for_event(symbol, event_date, api_key):
    dt = datetime.strptime(event_date, "%Y-%m-%d")
    start = (dt - timedelta(days=7)).strftime("%Y%m%dT0000")
    end = dt.strftime("%Y%m%dT2359")

    url = f"https://www.alphavantage.co/query"
    params = {
        "function": "NEWS_SENTIMENT",
        "tickers": symbol,
        "time_from": start,
        "time_to": end,
        "limit": 50,
        "apikey": api_key
    }

    print(f"üîç Buscando noticias desde {start} hasta {end} para {symbol}...")
    res = requests.get(url, params=params)
    data = res.json()
    
    if "feed" in data:
        df = pd.DataFrame(data["feed"])
        return df
    else:
        print("‚ùå No se encontraron noticias o alcanzaste el l√≠mite de la API.")
        return pd.DataFrame()

# Par√°metros de prueba
SYMBOL = "AAPL"
EVENT_DATE = "2024-06-11"
API_KEY = os.getenv("ALPHA_VANTAGE_API_KEY")  # O pon tu clave directamente aqu√≠ como string

# Ejecutar prueba
news_df = get_news_sentiments_for_event(SYMBOL, EVENT_DATE, API_KEY)

if not news_df.empty:
    print(f"‚úÖ {len(news_df)} noticias encontradas.")
    print(news_df[['title', 'summary']].head(5))
else:
    print("‚ö†Ô∏è No se encontraron noticias.")


üîç Buscando noticias desde 20240604T0000 hasta 20240611T2359 para AAPL...
‚úÖ 50 noticias encontradas.
                                               title  \
0  Time to Buy Apple's  ( AAPL )  Stock for Highe...   
1  S&P, Nasdaq Notch New Closing Highs Ahead of C...   
2  Event Contract Trading Signals Uncertainty In ...   
3         Best ETF Ideas for the Second Half of 2024   
4  Apple Soars, Drives Nasdaq To High; Fed, Infla...   

                                             summary  
0  Apple's (AAPL) stock spiked +7% today to fresh...  
1  While Apple (AAPL) helped the Nasdaq and S&P h...  
2  The chance of courts seeing Apple Inc AAPL as ...  
3  We discuss the market outlook and investing st...  
4  Dow Jones Futures: Apple Drives S&P 500 To Hig...  


In [53]:
news_df
news_df.to_csv(f'news_{SYMBOL}_{EVENT_DATE}.csv', sep=';', index=False)

### 3. FILTER NEWS for EVENT - AAPL +7.27%  in 11-06-2024    
Filter out the News from AlphaVantage that have a relevance score of over 0.5

In [54]:
import pandas as pd
import ast
from datetime import datetime

# === CONFIGURACI√ìN ===
CSV_INPUT = "news_AAPL_2024-06-11.csv"  # Cambiar si se analiza otro archivo
CSV_OUTPUT = "news_AAPL_2024-06-11_clean.csv"
SEPARADOR = ";"
TICKER_OBJETIVO = "AAPL"
RELEVANCIA_MINIMA = 0.5

# === FUNCIONES ===
def extract_aapl_relevance(ticker_sentiment, ticker="AAPL"):
    try:
        sentiments = ast.literal_eval(ticker_sentiment)
        for entry in sentiments:
            if entry['ticker'] == ticker:
                return float(entry['relevance_score'])
    except (ValueError, SyntaxError, KeyError, TypeError):
        return None

# === PROCESO PRINCIPAL ===
def limpiar_noticias_alpha(csv_input, csv_output, ticker_objetivo, min_relevancia):
    df = pd.read_csv(csv_input, sep=SEPARADOR)
    df['relevancia_AAPL'] = df['ticker_sentiment'].apply(lambda x: extract_aapl_relevance(x, ticker_objetivo))

    # Filtrar por relevancia
    df_filtrado = df[df['relevancia_AAPL'] > min_relevancia]

    # Seleccionar columnas √∫tiles y renombrar
    df_limpio = df_filtrado[[
        'title', 'summary', 'url', 'time_published',
        'overall_sentiment_label', 'overall_sentiment_score', 'relevancia_AAPL'
    ]].copy()

    df_limpio['time_published'] = pd.to_datetime(df_limpio['time_published'], format='%Y%m%dT%H%M%S')

    df_limpio.rename(columns={
        'title': 'titulo',
        'summary': 'resumen',
        'url': 'url',
        'time_published': 'fecha',
        'overall_sentiment_label': 'sentimiento',
        'overall_sentiment_score': 'score_sentimiento'
    }, inplace=True)

    # Guardar CSV limpio
    df_limpio.to_csv(csv_output, sep=SEPARADOR, index=False)
    print(f"‚úÖ Noticias limpiadas guardadas en: {csv_output}")

# === EJECUCI√ìN ===
if __name__ == "__main__":
    limpiar_noticias_alpha(CSV_INPUT, CSV_OUTPUT, TICKER_OBJETIVO, RELEVANCIA_MINIMA)


‚úÖ Noticias limpiadas guardadas en: news_AAPL_2024-06-11_clean.csv


### 4. GET OpenAI Interpreation for EVENT - AAPL +7.27%  in 11-06-2024    
Send him the news and evaluate them

In [None]:
from openai import OpenAI
import os

client = OpenAI(api_key="")

print("üîë Longitud de clave:", len(client.api_key))

# Cargar archivo limpio
df = pd.read_csv("news_AAPL_2024-06-11_clean.csv", sep=";")
noticia = df.iloc[0]

# Datos del evento
fecha_evento = "2024-06-11"
precio = 207.15
variacion = 7.26
ticker = "AAPL"
sector = "Tecnolog√≠a"
indice_mercado = "S&P 500"
contexto_macro = """
En junio de 2024, el contexto econ√≥mico est√° marcado por recuperaci√≥n tras un periodo inflacionario,
con pol√≠ticas monetarias moderadas y una expectativa de bajadas de tipos en EE.UU. La tecnolog√≠a lidera las subidas del mercado.
"""

prompt = f"""
Act√∫a como un analista financiero experto. A continuaci√≥n tienes una noticia del {fecha_evento} sobre la empresa {ticker}, que pertenece al sector {sector}.
Ese d√≠a la acci√≥n tuvo una subida de +{variacion:.2f}% y cerr√≥ en {precio} USD.

---

üìå Noticia:
T√≠tulo: {noticia['titulo']}
Resumen: {noticia['resumen']}
Fuente: {noticia['url']}

---

üìä Contexto macroecon√≥mico:
{contexto_macro}

üìà El {indice_mercado} tambi√©n subi√≥ ligeramente ese d√≠a.

---

üîç Por favor responde:
1. ¬øCu√°l es el sentimiento principal de esta noticia? Usa una sola palabra: Bullish / Neutral / Bearish / Cautious.
2. ¬øCu√°l ser√≠a un score de sentimiento del 0 al 1?
3. ¬øCrees que esta noticia influy√≥ significativamente en la subida del precio de la acci√≥n ese d√≠a? Estima un valor entre 0 (no influy√≥) y 1 (fue completamente responsable).
4. Justifica brevemente tu razonamiento considerando el contenido de la noticia, el contexto macro y el comportamiento general del mercado.

Responde en formato claro y estructurado.
"""

response = client.chat.completions.create(
    model="gpt-4.1-nano",
    messages=[{"role": "user", "content": prompt}],
    temperature=0.3
)

print(response.choices[0].message.content)


üîë Longitud de clave: 164
1. Sentimiento principal: Bullish

2. Score de sentimiento: 0.8

3. Influencia en la subida del precio: 0.7

4. Justificaci√≥n:
La noticia presenta un tono claramente optimista, destacando una asociaci√≥n estrat√©gica entre Apple y OpenAI para integrar ChatGPT en sus productos, lo cual sugiere innovaci√≥n y potencial crecimiento. La subida del +7.26% en la acci√≥n refleja una fuerte reacci√≥n positiva del mercado, probablemente impulsada por esta noticia y la percepci√≥n de avances tecnol√≥gicos que podr√≠an potenciar las ventas y la cuota de mercado de Apple. Adem√°s, en el contexto macroecon√≥mico favorable, con recuperaci√≥n econ√≥mica, pol√≠ticas monetarias moderadas y un sector tecnol√≥gico en auge, es probable que los inversores hayan interpretado esta noticia como una se√±al de crecimiento sostenido. Aunque otros factores como el comportamiento general del mercado y la tendencia alcista del S&P 500 tambi√©n contribuyeron, la noticia en s√≠ parece habe

### 5. Trading/Holding Strategy for NEWS afer EVENT - AAPL +7.27%  in 11-06-2024    

In [57]:
from datetime import date, timedelta
from alpaca_trade_api.rest import REST
import os

# === CONFIGURACI√ìN ===
ALPACA_API_KEY = os.getenv("ALPACA_API_KEY") or "TU_API_KEY"
ALPACA_API_SECRET = os.getenv("ALPACA_API_SECRET") or "TU_SECRET"
ALPACA_BASE_URL = "https://paper-api.alpaca.markets"
SYMBOL = "AAPL"
buy_date = date(2024, 6, 4)
sell_date = date(2024, 6, 18)

# === CONEXI√ìN API ===
api = REST(ALPACA_API_KEY, ALPACA_API_SECRET, ALPACA_BASE_URL, api_version='v2')

# === FUNCIONES ===
def get_close_price(symbol, target_date):
    barset = api.get_bars(symbol, timeframe="1Day", start=target_date, end=target_date + timedelta(days=1)).df
    if not barset.empty:
        return barset.iloc[0]['close']
    else:
        return None

# === OBTENER PRECIOS ===
price_buy = get_close_price(SYMBOL, buy_date)
price_sell = get_close_price(SYMBOL, sell_date)

if price_buy and price_sell:
    roi = (price_sell - price_buy) / price_buy
    print(f"üí∞ Compra el {buy_date}: ${price_buy:.2f}")
    print(f"üí∞ Venta el {sell_date}: ${price_sell:.2f}")
    print(f"üìà ROI: {roi*100:.2f}%")
else:
    print("‚ùå No se pudieron obtener ambos precios.")


üí∞ Compra el 2024-06-04: $194.35
üí∞ Venta el 2024-06-18: $214.29
üìà ROI: 10.26%


In [62]:
from datetime import datetime, timedelta
import pandas as pd
from alpaca_trade_api.rest import REST
import os

# === CONFIGURACI√ìN ===
ALPACA_API_KEY = os.getenv("ALPACA_API_KEY") or "TU_API_KEY"
ALPACA_API_SECRET = os.getenv("ALPACA_API_SECRET") or "TU_SECRET"
ALPACA_BASE_URL = "https://paper-api.alpaca.markets"

SYMBOL = "AAPL"
EVENT_DATE = "2024-06-11"  # fecha de an√°lisis

# === CONEXI√ìN ===
api = REST(ALPACA_API_KEY, ALPACA_API_SECRET, ALPACA_BASE_URL, api_version="v2")

# === FUNCIONES ===
def get_price_on(date_str):
    date = datetime.strptime(date_str, "%Y-%m-%d")
    start = date.strftime("%Y-%m-%d")
    end = (date + timedelta(days=1)).strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars.iloc[0]['close'] if not bars.empty else None


def get_ytd_mean_price(year):
    start = f"{year}-01-01"
    end = EVENT_DATE
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].mean() if not bars.empty else None

def get_min_12m_price():
    end_dt = datetime.strptime(EVENT_DATE, "%Y-%m-%d")
    start_dt = end_dt - timedelta(days=365)
    start = start_dt.strftime("%Y-%m-%d")
    end = end_dt.strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].min() if not bars.empty else None


def get_ma200():
    end_dt = datetime.strptime(EVENT_DATE, "%Y-%m-%d")
    start_dt = end_dt - timedelta(days=300)
    start = start_dt.strftime("%Y-%m-%d")
    end = end_dt.strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].rolling(window=200).mean().iloc[-1] if len(bars) >= 200 else None


# === EJECUCI√ìN ===
price_event_day = get_price_on(EVENT_DATE)
ytd_avg = get_ytd_mean_price(EVENT_DATE[:4])
min_12m = get_min_12m_price()
ma_200 = get_ma200()

# === MOSTRAR RESULTADOS ===
print("üìä KPIs desde Alpaca para", SYMBOL, "en", EVENT_DATE)
print("Precio d√≠a evento:", price_event_day)
print("Media YTD:", ytd_avg)
print("M√≠nimo √∫ltimos 12M:", min_12m)
print("Media m√≥vil 200 d√≠as:", ma_200)

# Opcional: exportar a dict o CSV para usar en prompt


üìä KPIs desde Alpaca para AAPL en 2024-06-11
Precio d√≠a evento: 207.15
Media YTD: 181.22437499999998
M√≠nimo √∫ltimos 12M: 165.0
Media m√≥vil 200 d√≠as: 181.93985


In [64]:
from datetime import datetime, timedelta
import pandas as pd
from alpaca_trade_api.rest import REST
import os
import requests

# === CONFIGURACI√ìN ===
ALPACA_API_KEY = os.getenv("ALPACA_API_KEY") or "TU_API_KEY"
ALPACA_API_SECRET = os.getenv("ALPACA_API_SECRET") or "TU_SECRET"
ALPACA_BASE_URL = "https://paper-api.alpaca.markets"
ALPHA_VANTAGE_API_KEY = os.getenv("ALPHA_VANTAGE_API_KEY") or "TU_ALPHA_KEY"

SYMBOL = "AAPL"
EVENT_DATE = "2024-06-04"

# === CONEXI√ìN ===
api = REST(ALPACA_API_KEY, ALPACA_API_SECRET, ALPACA_BASE_URL, api_version="v2")

# === FUNCIONES ===
def get_price_on(date_str):
    date = datetime.strptime(date_str, "%Y-%m-%d")
    start = date.strftime("%Y-%m-%d")
    end = (date + timedelta(days=1)).strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars.iloc[0]['close'] if not bars.empty else None

def get_ytd_mean_price(year):
    start = f"{year}-01-01"
    end = EVENT_DATE
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].mean() if not bars.empty else None

def get_min_12m_price():
    end_dt = datetime.strptime(EVENT_DATE, "%Y-%m-%d")
    start_dt = end_dt - timedelta(days=365)
    start = start_dt.strftime("%Y-%m-%d")
    end = end_dt.strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].min() if not bars.empty else None

def get_ma200():
    end_dt = datetime.strptime(EVENT_DATE, "%Y-%m-%d")
    start_dt = end_dt - timedelta(days=300)
    start = start_dt.strftime("%Y-%m-%d")
    end = end_dt.strftime("%Y-%m-%d")
    bars = api.get_bars(SYMBOL, timeframe="1Day", start=start, end=end).df
    return bars['close'].rolling(window=200).mean().iloc[-1] if len(bars) >= 200 else None

def get_fundamentals(symbol):
    url = f"https://www.alphavantage.co/query?function=OVERVIEW&symbol={symbol}&apikey={ALPHA_VANTAGE_API_KEY}"
    response = requests.get(url).json()
    return {
        "PER": response.get("PERatio"),
        "EPS": response.get("EPS"),
        "FCF": response.get("FreeCashFlow"),
        "NetIncome": response.get("NetIncomeTTM"),
        "ROE": response.get("ReturnOnEquityTTM"),
        "ROIC": response.get("ReturnOnAssetsTTM"),
        "DebtToEBITDA": response.get("EVToEBITDA"),
        "GrossMargin": response.get("GrossProfitTTM"),
        "OperatingMargin": response.get("OperatingMarginTTM"),
        "CAGR": response.get("RevenueTTM"),  # Placeholder si no hay CAGR
        "AnalystEstimates": response.get("AnalystTargetPrice"),
    }

# === EJECUCI√ìN ===
price_event_day = get_price_on(EVENT_DATE)
ytd_avg = get_ytd_mean_price(EVENT_DATE[:4])
min_12m = get_min_12m_price()
ma_200 = get_ma200()
fundamentals = get_fundamentals(SYMBOL)

# === CREAR DATAFRAME ===
data = {
    "Fecha evento": EVENT_DATE,
    "Ticker": SYMBOL,
    "Precio evento": price_event_day,
    "Media YTD": ytd_avg,
    "M√≠nimo 12M": min_12m,
    "Media 200 d√≠as": ma_200,
    **fundamentals
}

df_kpis = pd.DataFrame([data])
print(df_kpis)

# Guardar si se desea
df_kpis.to_csv("kpis_AAPL_2024-06-04.csv", sep=";", index=False)


  Fecha evento Ticker  Precio evento   Media YTD  M√≠nimo 12M  Media 200 d√≠as  \
0   2024-06-04   AAPL         194.35  180.463738       165.0        181.4276   

     PER   EPS   FCF NetIncome    ROE   ROIC DebtToEBITDA   GrossMargin  \
0  31.76  6.29  None      None  1.365  0.225        21.44  184102994000   

  OperatingMargin          CAGR AnalystEstimates  
0           0.345  395760009000           237.87  


In [67]:
import pandas as pd

# === Cargar KPIs (reemplaza si ya tienes el DataFrame en memoria) ===
df = pd.read_csv("kpis_AAPL_2024-06-04.csv", sep=";")
row = df.iloc[0]

# === Par√°metros noticia ===
titulo = "Apple anuncia integraci√≥n con ChatGPT en todos sus dispositivos"
resumen = "Apple present√≥ una integraci√≥n directa con ChatGPT como parte de su estrategia de inteligencia artificial durante la WWDC 2024, provocando un aumento del 7.2% en su cotizaci√≥n burs√°til."
url = "https://www.apple.com/newsroom/2024/06/apple-integrates-chatgpt"

# === Plantilla de prompt ===
prompt_value = f"""
Act√∫a como un analista financiero experto. Quiero que analices si una inversi√≥n en la acci√≥n {row['Ticker']} era una buena decisi√≥n en la fecha {row['Fecha evento']}, combinando an√°lisis fundamental (value investing) con el impacto de una noticia relevante.

---

üìä Datos fundamentales del momento:
- PER: {row['PER']}
- EPS: {row['EPS']}
- FCF: {row['FCF']}
- Net Income: {row['NetIncome']}
- ROE: {row['ROE']}
- ROIC: {row['ROIC']}
- Deuda/EBITDA: {row['DebtToEBITDA']}
- Margen Bruto: {row['GrossMargin']}
- Margen Operativo: {row['OperatingMargin']}
- CAGR de ingresos (estimado): {row['CAGR']}
- Estimaci√≥n analistas: {row['AnalystEstimates']}
- Precio evento: {row['Precio evento']}
- Media YTD: {row['Media YTD']}
- M√≠nimo 12M: {row['M√≠nimo 12M']}
- Media m√≥vil 200 d√≠as: {row['Media 200 d√≠as']}

---

üì∞ Noticia del d√≠a:
T√≠tulo: {titulo}
Resumen: {resumen}
Fuente: {url}

---

üîç An√°lisis requerido:

1. Interpreta cada m√©trica: ¬øqu√© indica sobre la empresa?
2. ¬øQu√© sugiere la noticia sobre el futuro de la empresa?
3. ¬øEst√°n los fundamentos alineados con el optimismo/pesimismo de la noticia?
4. ¬øLa empresa estaba infravalorada, sobrevalorada o correctamente valorada?
5. ¬øEra una buena decisi√≥n comprar ese d√≠a seg√∫n el enfoque value?
6. ¬øQu√© indicador tuvo m√°s peso en tu conclusi√≥n (PER bajo, FCF, ROIC, etc.)?
7. Concluye con una recomendaci√≥n: Comprar / Mantener / Vender.

El an√°lisis debe ser claro, justificado y estructurado para un inversor de largo plazo.
""".strip()

print(prompt_value)


Act√∫a como un analista financiero experto. Quiero que analices si una inversi√≥n en la acci√≥n AAPL era una buena decisi√≥n en la fecha 2024-06-04, combinando an√°lisis fundamental (value investing) con el impacto de una noticia relevante.

---

üìä Datos fundamentales del momento:
- PER: 31.76
- EPS: 6.29
- FCF: nan
- Net Income: nan
- ROE: 1.365
- ROIC: 0.225
- Deuda/EBITDA: 21.44
- Margen Bruto: 184102994000
- Margen Operativo: 0.345
- CAGR de ingresos (estimado): 395760009000
- Estimaci√≥n analistas: 237.87
- Precio evento: 194.35
- Media YTD: 180.46373831775696
- M√≠nimo 12M: 165.0
- Media m√≥vil 200 d√≠as: 181.4276

---

üì∞ Noticia del d√≠a:
T√≠tulo: Apple anuncia integraci√≥n con ChatGPT en todos sus dispositivos
Resumen: Apple present√≥ una integraci√≥n directa con ChatGPT como parte de su estrategia de inteligencia artificial durante la WWDC 2024, provocando un aumento del 7.2% en su cotizaci√≥n burs√°til.
Fuente: https://www.apple.com/newsroom/2024/06/apple-integrates-cha

In [68]:

response = client.chat.completions.create(
    model="gpt-4.1-nano",
    messages=[{"role": "user", "content": prompt_value}],
    temperature=0.3
)

print(response.choices[0].message.content)


An√°lisis financiero y estrat√©gico de Apple (AAPL) al 2024-06-04

---

**1. Interpretaci√≥n de las m√©tricas fundamentales**

- **PER (31.76):**  
  Un PER de 31.76 indica que los inversores est√°n pagando aproximadamente 32 veces las ganancias por acci√≥n. Esto es relativamente alto en comparaci√≥n con empresas tradicionales, pero en tecnolog√≠a y especialmente en Apple, puede considerarse en l√≠nea con su perfil de crecimiento y valor de marca. Sin embargo, no es un PER bajo, lo que sugiere que la acci√≥n no est√° claramente infravalorada desde un enfoque de value investing.

- **EPS (6.29):**  
  La ganancia por acci√≥n es s√≥lida, pero sin un contexto comparativo con hist√≥ricos o con el mercado, su valor en s√≠ mismo es solo un dato m√°s. Sin embargo, en relaci√≥n con el PER, indica que la valoraci√≥n del mercado est√° considerando un crecimiento futuro significativo.

- **FCF (nan), Net Income (nan):**  
  La ausencia de datos de flujo de caja libre y beneficios netos puede ser 

In [69]:
df_resultado = pd.DataFrame([{
    "fecha": row["Fecha evento"],
    "ticker": row["Ticker"],
    "analisis_value": response.choices[0].message.content
}])

df_resultado.to_csv("analisis_value_aapl.csv", sep=";", index=False)

### **EXTRA.** Downloading TS Data for autoamted Pipeline

In [11]:
import os
import pandas as pd
import requests
from datetime import datetime

ALPHA_VANTAGE_API_KEY = os.getenv("ALPHA_VANTAGE_API_KEY")
BASE_URL = "https://www.alphavantage.co/query"
SYMBOL = "AAPL"
START_YEAR = 2022
TODAY = datetime.today().strftime("%Y-%m-%d")

# === FUNCIONES DE DESCARGA ===
def fetch_data(params, filename):
    params["apikey"] = ALPHA_VANTAGE_API_KEY
    response = requests.get(BASE_URL, params=params)
    data = response.json()
    if "Error Message" in data or "Note" in data:
        print(f"‚ö†Ô∏è Error o l√≠mite alcanzado para {filename}")
        return

    if "Time Series (Daily)" in data:
        df = pd.DataFrame.from_dict(data["Time Series (Daily)"], orient='index')
    elif "Monthly Adjusted Time Series" in data:
        df = pd.DataFrame.from_dict(data["Monthly Adjusted Time Series"], orient='index')
    elif "Weekly Adjusted Time Series" in data:
        df = pd.DataFrame.from_dict(data["Weekly Adjusted Time Series"], orient='index')
    elif "Time Series (5min)" in data:
        df = pd.DataFrame.from_dict(data["Time Series (5min)"], orient='index')
    elif "Technical Analysis: SMA" in data:
        df = pd.DataFrame.from_dict(data["Technical Analysis: SMA"], orient='index')
    elif "Technical Analysis: RSI" in data:
        df = pd.DataFrame.from_dict(data["Technical Analysis: RSI"], orient='index')
    elif "Meta Data" in data:
        df = pd.DataFrame(data.items(), columns=["Field", "Value"])
    else:
        df = pd.DataFrame.from_dict(data, orient='index')
    
    df.to_csv(f"{SYMBOL}_{filename}.csv")
    print(f"‚úÖ {filename} guardado")

# === LLAMADAS ===
fetch_data({"function": "TIME_SERIES_DAILY_ADJUSTED", "symbol": SYMBOL, "outputsize": "full"}, "daily_adjusted")
fetch_data({"function": "TIME_SERIES_WEEKLY_ADJUSTED", "symbol": SYMBOL}, "weekly_adjusted")
fetch_data({"function": "TIME_SERIES_MONTHLY_ADJUSTED", "symbol": SYMBOL}, "monthly_adjusted")
fetch_data({"function": "INCOME_STATEMENT", "symbol": SYMBOL}, "income_statement")
fetch_data({"function": "BALANCE_SHEET", "symbol": SYMBOL}, "balance_sheet")
fetch_data({"function": "CASH_FLOW", "symbol": SYMBOL}, "cash_flow")
fetch_data({"function": "OVERVIEW", "symbol": SYMBOL}, "overview")
fetch_data({"function": "EARNINGS", "symbol": SYMBOL}, "earnings")
fetch_data({"function": "SMA", "symbol": SYMBOL, "interval": "daily", "time_period": 200, "series_type": "close"}, "sma_200")
fetch_data({"function": "RSI", "symbol": SYMBOL, "interval": "daily", "time_period": 14, "series_type": "close"}, "rsi_14")


‚úÖ daily_adjusted guardado
‚úÖ weekly_adjusted guardado
‚úÖ monthly_adjusted guardado
‚úÖ income_statement guardado
‚úÖ balance_sheet guardado
‚úÖ cash_flow guardado
‚úÖ overview guardado
‚úÖ earnings guardado
‚úÖ sma_200 guardado
‚úÖ rsi_14 guardado


### Intrinsic VALUE - Benjamin Graham

#### üìå 1. ¬øQu√© es el crecimiento esperado (g) en la f√≥rmula de Graham?
En el m√©todo de Graham, el crecimiento esperado **g** se refiere al **crecimiento anual estimado de los beneficios (EPS)** durante los pr√≥ximos 5 a√±os.

**üí° T√©cnicamente s√≠**, se interpreta como el **CAGR (Compound Annual Growth Rate)** del EPS a 5 a√±os:

- **g = CAGR de EPS estimado a 5 a√±os**
Es decir, cu√°nto se espera que crezca el beneficio anual de la empresa cada a√±o durante los pr√≥ximos 5 a√±os.

**üìç¬øDe d√≥nde se saca?**
- De sitios financieros como:

    - Yahoo Finance ‚Üí pesta√±a Analysis

    - Finbox, Morningstar, Simply Wall St

    - O informes de analistas

- En APIs: no siempre est√° disponible directamente, pero algunos ofrecen EarningsGrowth o Growth5Y.

**üß† Si no est√° disponible, se suele asumir un valor est√°ndar:**
- 5% si es conservador

- 10% como moderado

- 15‚Äì20% para empresas de crecimiento

#### üìå 2. ¬øQu√© es el Bond Yield (Y) en la f√≥rmula de Graham?
En la f√≥rmula cl√°sica de Graham:

    Y representa el rendimiento actual del bono del tesoro AAA a 10 a√±os (usado como tasa libre de riesgo)

üß† En la f√≥rmula original se usaba el valor de 4.4 como referencia del rendimiento promedio de los bonos en los a√±os de Graham (1950s), por eso el ajuste con el valor actual de Y.

**üìç ¬øDe d√≥nde se obtiene el rendimiento del bono AAA (Y)?**
**Fuentes confiables:**

- Moody's AAA Bond Yield

- US Treasury Yield Curve

- Google: ‚ÄúAAA bond yield today‚Äù

- FRED (Federal Reserve Economic Data)

**Ejemplo:**
En abril 2025, el AAA corporate bond yield ronda el 3.8%‚Äì4.0%, as√≠ que:

In [25]:
import pandas as pd
from datetime import datetime

# ‚úÖ Diccionario con el crecimiento estimado a 5 a√±os (CAGR EPS) para las 7 Magn√≠ficas
crecimientos_5y = {
    "AAPL": 12.0,
    "MSFT": 14.0,
    "GOOGL": 15.0,
    "AMZN": 25.0,
    "META": 18.0,
    "NVDA": 30.0,
    "TSLA": 27.0
}

BONO_YIELD = 3.8  # rendimiento actual de bonos AAA

# üì• Funciones
def cargar_overview(path):
    df = pd.read_csv(path)
    return dict(zip(df.iloc[:, 0], df.iloc[:, 1]))

def obtener_precio_mas_reciente(path):
    df = pd.read_csv(path)
    df['date'] = pd.to_datetime(df['date'])
    df = df.sort_values(by='date', ascending=False)
    fila = df.iloc[0]
    return float(fila.get('5. adjusted close', fila.get('4. close')))

def calcular_valor_intrinseco(eps, g, bono_yield):
    return round((eps * (8.5 + 2 * g) * 4.4) / bono_yield, 2)

# üîÅ Pedimos el ticker por input
ticker = input("Introduce el ticker de la empresa (ej. AAPL, MSFT, GOOGL): ").upper()

# ‚úÖ Configuramos paths y valores
overview_path = f"C:/Users/Victor/Downloads/MSc DataScience/MasterThesis/data/{ticker}/fundamentals/{ticker}_overview.csv"
price_path = f"C:/Users/Victor/Downloads/MSc DataScience/MasterThesis/data/{ticker}/prices/{ticker}_daily_adjusted.csv"
CRECIMIENTO_ESTIMADO_5Y = crecimientos_5y.get(ticker, 10.0)  # valor por defecto si no est√° en la lista

# üìà Proceso
try:
    overview = cargar_overview(overview_path)
    eps = float(overview.get("EPS", 0))
    per = float(overview.get("PERatio", 0))
    precio_actual = obtener_precio_mas_reciente(price_path)

    valor_intrinseco = calcular_valor_intrinseco(eps, CRECIMIENTO_ESTIMADO_5Y, BONO_YIELD)

    # üßæ Resultados
    print(f"\nüßÆ Ticker: {ticker}")
    print(f"üßÆ EPS: {eps}")
    print(f"üìà PER: {per}")
    print(f"üìâ Precio actual (ajustado): {precio_actual}")
    print(f"üìê Valor intr√≠nseco (Graham): {valor_intrinseco}")
    print(f"üìä CAGR 5Y usado: {CRECIMIENTO_ESTIMADO_5Y}%")

    if valor_intrinseco > precio_actual:
        print("‚úÖ La acci√≥n podr√≠a estar INFRAVALORADA.")
    else:
        print("‚ùå La acci√≥n podr√≠a estar SOBREVALORADA.")

except FileNotFoundError:
    print(f"‚ùå No se encontr√≥ alguno de los archivos para {ticker}. Verifica que exista la ruta correcta.")
except Exception as e:
    print(f"‚ùå Error procesando los datos de {ticker}: {e}")



üßÆ Ticker: NVDA
üßÆ EPS: 2.94
üìà PER: 36.2
üìâ Precio actual (ajustado): 106.43
üìê Valor intr√≠nseco (Graham): 233.19
üìä CAGR 5Y usado: 30.0%
‚úÖ La acci√≥n podr√≠a estar INFRAVALORADA.
