<img src="entete-datathon.jpg" width=640/>

# Bienvenue dans l‚Äôaventure !
Pr√©pare-toi √† vivre **36 heures intenses de collaboration, d‚Äôanalyse et d‚Äôinnovation** o√π se rencontrent **finance, data science et intelligence artificielle.**

Le Datathon 2025, c‚Äôest bien plus qu‚Äôune comp√©tition : c‚Äôest **une immersion dans la r√©alit√© de la finance,** o√π tes id√©es et ton esprit analytique feront la diff√©rence.

## Rappel du d√©fi

**Contexte :** Dans un environnement financier marqu√© par une r√©glementation complexe et des sanctions √©conomiques croissantes, votre d√©fi est de transformer cette complexit√© r√©glementaire en opportunit√© d'aide √† la d√©cision pour la gestion de portefeuilles d'actions.

**Objectif :** Concevoir un outil d'analyse et de simulation utilisant l'IA g√©n√©rative pour analyser automatiquement les textes r√©glementaires, extraire les √©l√©ments cl√©s, √©valuer l'impact sur le S&P 500, et transformer ces r√©sultats en recommandations strat√©giques concr√®tes.

**Livrables attendus :**
- Simulation de diff√©rents sc√©narios
- Mesure des risques par entreprise, secteur ou zone g√©ographique
- Propositions d'ajustements concrets (r√©allocation, rotation sectorielle, etc.)
- Outil flexible capable de traiter diff√©rents formats de documents r√©glementaires

**Il est fortement recommand√© de lire attentivement l'√©nonc√© complet dans le document DATATHON POLYFINANCES 2025 CHALLENGE qui a √©t√© partag√© avec tous les participants pour comprendre tous les d√©tails et crit√®res d'√©valuation.**

---

## Votre environnement SageMaker Unified Studio

Cet environnement SageMaker Unified Studio est mis √† votre disposition pour le Datathon. Il vous offre un acc√®s aux outils d'analyse et d'IA d'AWS dans un environnement Jupyter int√©gr√©.

Le fichier [getting_started.ipynb](getting_started.ipynb) contient une introduction aux fonctionnalit√©s de SageMaker Unified Studio et vous guidera dans la prise en main de l'environnement.

**Important:** L'utilisation de cet environnement SageMaker n'est pas obligatoire. Vous disposez de droits d'administration sur votre compte AWS et √™tes libres d'utiliser les services et outils de votre choix pour d√©velopper votre solution.



---

## Les donn√©es et documents de r√©f√©rence

Le jeu de donn√©es comprend plusieurs fichiers et dossiers contenant les informations n√©cessaires √† la r√©solution du cas. Vous pouvez √©galement utiliser des sources externes (Yahoo Finance, SEC, etc.).

**IMPORTANT** : Un nouveau document sera transmis dimanche matin pour l'√©valuation finale.

**Contenu du jeu de donn√©es :**
- `2025-08-15_composition_sp500.csv` : Composition du S&P 500 (ticker, nom, poids, prix)
- `2025-09-26_stocks-performance.csv` : M√©triques de performance (valorisation, EPS, FCF, etc.)
- **Dossier directives** : Documents l√©gislatifs et r√©glementaires (UE, US, Japon, Chine, Canada)
- **Dossier fillings** : Rapports 10-K 2024 par ticker (exposition r√©glementaire d√©taill√©e)


### T√©l√©chargement des donn√©es


In [3]:
import pandas as pd
import requests
import zipfile
import os
from tqdm import tqdm
from IPython.display import Markdown, display

In [4]:
# T√©l√©charger le fichier zip
url = 'https://d38aa0udflevgr.cloudfront.net/datathon/jeu_de_donnees.zip'
response = requests.get(url)
with open('jeu_de_donnees.zip', 'wb') as f:
    f.write(response.content)

# Extraire le fichier zip
with zipfile.ZipFile('jeu_de_donnees.zip', 'r') as zip_ref:
    for file in tqdm(zip_ref.infolist(), desc="Extraction"):
        zip_ref.extract(file, '.')

Extraction: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1010/1010 [01:39<00:00, 10.11it/s]


### Pr√©visualisation des donn√©es 

In [5]:
%%local
# Composition du S&P 500
composition_sp500 = pd.read_csv("2025-08-15_composition_sp500.csv")
composition_sp500

Unnamed: 0,#,Company,Symbol,Weight,Price
0,1,Nvidia,NVDA,00765,18199
1,2,Microsoft,MSFT,00667,52099
2,3,"Apple Inc,",AAPL,00597,23328
3,4,Amazon,AMZN,00427,23214
4,5,Meta Platforms,META,00339,78378
...,...,...,...,...,...
498,499,APA Corporation,APA,00001,2048
499,500,MarketAxess,MKTX,00001,1879
500,501,News Corp (Class B),NWS,00001,344
501,502,Caesars Entertainment,CZR,00001,253


Connection: project.iam | Run start time: 2025-11-01 16:43:43.449740 | Run duration : 0:00:00.075361s.


In [7]:
# M√©triques de performance
stocks_performance = pd.read_csv('2025-09-26_stocks-performance.csv')
stocks_performance

Unnamed: 0,Symbol,Company Name,Market Cap,Revenue,Op. Income,Net Income,EPS,FCF
0,NVDA,NVIDIA Corporation,4.338392e+12,1.652180e+11,9.598100e+10,8.659700e+10,3.520000e+00,7.202300e+10
1,MSFT,Microsoft Corporation,3.801767e+12,2.817240e+11,1.285280e+11,1.018320e+11,1.364000e+01,7.161100e+10
2,AAPL,Apple Inc.,3.791126e+12,4.086250e+11,1.302140e+11,9.928000e+10,6.590000e+00,9.618400e+10
3,GOOG,Alphabet Inc.,2.989536e+12,3.713990e+11,1.213700e+11,1.155730e+11,9.370000e+00,6.672800e+10
4,GOOGL,Alphabet Inc.,2.981796e+12,3.713990e+11,1.213700e+11,1.155730e+11,9.380000e+00,6.672800e+10
...,...,...,...,...,...,...,...,...
5503,BINI,"Bollinger Innovations, Inc.",1.395297e+06,9.340063e+06,-2.686874e+08,-4.729417e+08,8.832306e+13,-1.147141e+08
5504,LGHL,Lion Group Holding Ltd.,1.356020e+05,-4.866081e+06,-2.671823e+07,-2.787850e+07,-1.250000e+02,-1.911124e+07
5505,EZGO,EZGO Technologies Ltd.,9.301610e+05,1.912450e+07,-1.968105e+06,-4.368242e+06,-1.440000e+00,-1.106789e+06
5506,CETX,"Cemtrex, Inc.",1.885400e+07,7.609555e+07,1.373271e+06,-2.048252e+07,2.194160e+03,-7.655020e+05


## L'IA g√©n√©rative avec Amazon Bedrock

Exemple d'utilisation simple:

In [None]:
import boto3

client = boto3.client("bedrock-runtime")

response = client.converse(
    modelId="global.anthropic.claude-sonnet-4-5-20250929-v1:0",
    messages=[
        {
            "role": "user",
            "content": [{"text": "Say hello in 3 different languages"}]
        }
    ],
    inferenceConfig={
        "temperature": 0.5,
    }
)

display(Markdown(response["output"]["message"]["content"][0]["text"]))


## Liste de tous les mod√®les de Bedrock

_√Ä noter que pas tous les mod√®les sont disponible_

In [2]:
# Create Bedrock client
bedrock = boto3.client('bedrock')

# List all foundation models
response = bedrock.list_foundation_models()

# Extract and display model IDs
model_ids = [model['modelId'] for model in response['modelSummaries']]

# Print all model IDs
for model_id in sorted(model_ids):
    print(model_id)

NameError: name 'boto3' is not defined

## Certains mod√®les sont uniquement disponibles via un profil d'inf√©rence global

In [None]:
import boto3

client = boto3.client('bedrock')

response = client.list_inference_profiles(typeEquals='SYSTEM_DEFINED')

# Filter for global profiles
global_profiles = [
    profile for profile in response['inferenceProfileSummaries']
    if profile['inferenceProfileId'].startswith('global.')
]

for profile in global_profiles:
    print(f"Global Profile ID: {profile['inferenceProfileId']}")



## Exemple d'extraction de donn√©es non-structur√©es en donn√©es structur√©es 

In [None]:
%pip install "instructor[bedrock]"

In [None]:
import boto3
import instructor
import os
from pydantic import BaseModel


bedrock_client = boto3.client('bedrock-runtime')
client = instructor.from_bedrock(bedrock_client)


class Company10K(BaseModel):
    company_name: str
    trading_symbol: str
    commission_file_no: str
    fiscal_year_end: str
    state_of_incorporation: str
    employer_id_no: str
    address: str
    phone_number: str
    exchange: str


company10k = client.chat.completions.create(
    modelId="global.anthropic.claude-haiku-4-5-20251001-v1:0",
    messages=[
        {
            "role": "user", 
             "content": f"Extract: {open('fillings/AMZN/2025-02-07-10k-AMZN.html').read(64000)}" 
        },
    ],
    response_model=Company10K,
    inferenceConfig={
        "maxTokens": 64000,
    }
)

display(company10k)

---

## Interagir avec vos donn√©es gr√¢ce aux Agents

Les Agents sont une excellente fa√ßon d'interagir avec vos donn√©es de mani√®re conversationnelle. Voici un exemple simple avec Strands Agent:

In [None]:
%pip install strands-agents strands-agents-tools

In [None]:
from strands import Agent
from strands_tools import file_read


# Create an agent with default settings
agent = Agent(tools=[file_read])

# Ask the agent a question
agent("D√©crit les fichiers qui se trouve dans le dossier directives")
agent("Souhaite bonne chance aux participants du Datathon PolyFinances")

---

## √Ä vous de jouer maintenant !

**F√©licitations !** Vous avez maintenant les outils en main pour relever ce d√©fi passionnant.

**Il est temps de cr√©er votre propre notebook** et de laisser libre cours √† votre cr√©ativit√© et votre expertise technique. 

**Bonne chance, et que le meilleur gagne !** üöÄ

