# R√©sum√© automatique de documents financiers
Objectif : transformer rapidement un **rapport financier** en un **r√©sum√© clair et chiffr√©**.

In [None]:
!pip install openai PyMuPDF python-dotenv

In [None]:
import os
import fitz  # PyMuPDF
from dotenv import load_dotenv, find_dotenv
from openai import OpenAI
from IPython.display import Markdown, display
import pathlib

print("Dossier courant :", pathlib.Path.cwd())

# Charger le .env
env_path = find_dotenv(filename=".env", usecwd=True)
load_dotenv(dotenv_path=env_path, override=True)

api_key = os.getenv("OPENAI_API_KEY")
print(api_key[:4] + "...****")

In [None]:
chemin_pdf = "./data/teslafinancialreport.pdf"

pdf = fitz.open(chemin_pdf)
texte = ""
for i, page in enumerate(pdf, start=1):
    texte_page = page.get_text()
    texte += f"\n\n=== [PAGE {i}] ===\n" + texte_page.strip()

texte = "\n".join(l.strip() for l in texte.splitlines())

# Limite de longueur
LONGUEUR_MAX = 120_000
if len(texte) > LONGUEUR_MAX:
    texte = texte[:LONGUEUR_MAX]

print("Aper√ßu du d√©but du texte :\n")
print(texte[:800])

In [None]:
consignes = (
    "Tu es analyste financier et expert-comptable. On te fournit le texte d'un document financier (rapport annuel, trimestriel, comptes, bilan, annexes).\n\n"
    "Produis une synth√®se pr√©cise et chiffr√©e en Markdown selon ce cadre :\n"
    "- Soci√©t√© / P√©riode / Devise : (si rep√©rable)\n"
    "- R√©sum√© ex√©cutif (5‚Äì8 lignes)\n"
    "- Chiffres cl√©s (tableau) : | Indicateur | Valeur | Statut | M√©thode / Contexte | P√©riode | Page |\n"
    "|---|---:|---|---|---|---:|\n"
    "- Analyse : performance, structure financi√®re, risques, outlook\n"
    "- R√©f√©rences internes : pages/sections √† relire\n"
    "Exigences : N'invente aucun chiffre. Si absent : non pr√©cis√©. 6 √† 12 indicateurs maximum. Reste concis : 200‚Äì350 mots."
)

In [None]:
client = OpenAI(api_key=api_key)
modele = "gpt-4o-mini"

reponse = client.responses.create(
    model=modele,
    input=[
        {"role": "system", "content": consignes},
        {"role": "user", "content": texte},
    ],
)

resume = reponse.output_text
print("\n=== R√âSUM√â FINANCIER G√âN√âR√â ===\n")
print(resume)
display(Markdown(resume))

## Questions interactives sur le PDF
Posez des questions sp√©cifiques sur le PDF et obtenez des r√©ponses pr√©cises avec r√©f√©rences de page si possible.

In [ ]:
consignes_questions = (
    "Tu es analyste financier et expert-comptable. On te donne le texte d‚Äôun rapport financier. "
    "R√©ponds uniquement √† la question pos√©e, sans inventer de donn√©es. "
    "Si la r√©ponse n‚Äôest pas claire dans le texte, √©cris : 'non pr√©cis√©'. "
    "Quand c‚Äôest possible, indique la page d‚Äôorigine (rep√®re '=== [PAGE X] ===')."
)

while True:
    ma_question = input("\nPosez votre question (ou tapez 'bye' pour quitter) : ")
    if ma_question.strip().lower() == "bye":
        print("üëã Fin de l‚Äôinteraction. Merci !")
        break
    reponse_question = client.responses.create(
        model=modele,
        input=[
            {"role": "system", "content": consignes_questions},
            {"role": "user", "content": f"Question : {ma_question}\n\nTexte PDF :\n{texte}"},
        ],
    )
    print("\n=== R√âPONSE ===\n")
    print(reponse_question.output_text)
    display(Markdown(reponse_question.output_text))