In [1]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait, Select
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import time

# Dates souhaitées
date_from = "15/01/2025"
date_to = "11/04/2025"

# Lancement du navigateur
driver = webdriver.Chrome()
wait = WebDriverWait(driver, 10)

# Accès à la page principale
driver.get("https://www.sikafinance.com/marches/historiques/SDSC.ci")
time.sleep(3)  # chargement initial

# Récupération des options du menu déroulant
select_element = wait.until(EC.presence_of_element_located((By.ID, "dpShares")))
select_html = Select(select_element)

# Récupération des paires (nom affiché, valeur)
options = [(opt.text.strip(), opt.get_attribute("value").strip())
           for opt in select_html.options if opt.get_attribute("value").strip()]

# Stockage des données globales
all_data = []

for nom_action, valeur in options:
    print(f"🔍 Traitement de {nom_action} ({valeur})...")

    # Recharger la page pour éviter les conflits JS
    driver.get(f"https://www.sikafinance.com/marches/historiques/{valeur}")
    time.sleep(3)

    try:
        # Renseigner les dates
        datefrom_input = wait.until(EC.presence_of_element_located((By.ID, "datefrom")))
        dateto_input = driver.find_element(By.ID, "dateto")

        datefrom_input.clear()
        datefrom_input.send_keys(date_from)
        dateto_input.clear()
        dateto_input.send_keys(date_to)

        # Cliquer sur "OK"
        btn = driver.find_element(By.ID, "btnChange")
        btn.click()

        time.sleep(5)  # attendre le chargement des données

        # Parser la page après clic
        soup = BeautifulSoup(driver.page_source, "html.parser")
        table = soup.find("table", id="tblhistos")

        if table:
            headers = [th.text.strip() for th in table.find_all("th")]
            rows = []
            for tr in table.find_all("tr")[1:]:
                cols = [td.text.strip() for td in tr.find_all("td")]
                if cols:
                    rows.append(cols)

            df = pd.DataFrame(rows, columns=headers)
            df["Action"] = nom_action
            all_data.append(df)
        else:
            print(f"❌ Tableau non trouvé pour {nom_action}.")

    except Exception as e:
        print(f"⚠️ Erreur pour {nom_action}: {e}")

    time.sleep(2)


# Fermeture du navigateur
driver.quit()


🔍 Traitement de AFRICA GLOBAL LOGISTICS (SDSC.ci)...
🔍 Traitement de AIR LIQUIDE CI (SIVC.ci)...
🔍 Traitement de BANK OF AFRICA BENIN (BOAB.bj)...
🔍 Traitement de BANK OF AFRICA BURKINA FASO (BOABF.bf)...
🔍 Traitement de BANK OF AFRICA CI (BOAC.ci)...
🔍 Traitement de BANK OF AFRICA MALI (BOAM.ml)...
🔍 Traitement de BANK OF AFRICA NIGER (BOAN.ne)...
🔍 Traitement de BANK OF AFRICA SENEGAL (BOAS.sn)...
🔍 Traitement de BERNABE (BNBC.ci)...
🔍 Traitement de BICICI (BICC.ci)...
🔍 Traitement de BRVM - AGRICULTURE (BRVMAG)...
🔍 Traitement de BRVM - AUTRES SECTEURS (BRVMAS)...
🔍 Traitement de BRVM - CONSOMMATION DE BASE (BRVM-CB)...
🔍 Traitement de BRVM - CONSOMMATION DISCRETIONNAIRE (BRVM-CD)...
🔍 Traitement de BRVM - DISTRIBUTION (BRVMDI)...
🔍 Traitement de BRVM - ENERGIE (BRVM-EN)...
🔍 Traitement de BRVM - FINANCE (BRVMFI)...
🔍 Traitement de BRVM - INDUSTRIE (BRVMIN)...
🔍 Traitement de BRVM - INDUSTRIELS (BRVM-IN)...
🔍 Traitement de BRVM - PRESTIGE (BRVMPR)...
🔍 Traitement de BRVM - PRINCIPAL

In [1]:
from pymongo import MongoClient

# Connexion au cluster MongoDB Atlas
client = MongoClient("mongodb+srv://amedbah2000:NQerjnFDI1xA8Dc1@cluster0.vbt1opf.mongodb.net/?retryWrites=true&w=majority")


In [None]:

# Sélection de la base de données et de la collection
db = client["sika_finance"]
collection = db["historique_actions"]

# Structure des données par action
if all_data:
    final_df = pd.concat(all_data, ignore_index=True)

    grouped = final_df.groupby("Action")
    for nom_action, df_action in grouped:
        historique = df_action.drop(columns=["Action"]).to_dict(orient="records")

        # Vérifie si l'action existe déjà dans la base
        existing = collection.find_one({"action": nom_action})
        if existing:
            # Mettre à jour les données existantes (fusionner les historiques si besoin)
            collection.update_one(
                {"action": nom_action},
                {"$set": {"historique": historique}}
            )
        else:
            # Insérer une nouvelle action
            collection.insert_one({
                "action": nom_action,
                "historique": historique
            })

    print("✅ Données envoyées à MongoDB avec succès.")
else:
    print("❌ Aucune donnée à envoyer.")


✅ Données envoyées à MongoDB avec succès.


## Actu et communiqué

In [None]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import time

base_url = "https://www.sikafinance.com"
cot_url = base_url + "/marches/cotation_"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"
}

# Étape 1 : Récupérer toutes les valeurs du sélecteur
homepage = requests.get(cot_url + "SDSC.ci", headers=headers)
soup_home = BeautifulSoup(homepage.content, "html.parser")

select = soup_home.select_one("#dpShares")
options = select.find_all("option")
actions = [(opt.text.strip(), opt["value"].strip()) for opt in options if opt["value"].strip()]


all_news = []
all_communiques = []

for nom_action, valeur in actions:
    print(f"🔍 Scraping {nom_action} ({valeur})...")

    url = cot_url + valeur
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.content, "html.parser")

    
    # 📰 Actualités
    actualites_div = soup.find("div", class_="home_content")
    if actualites_div:
        spans = actualites_div.find_all("span", class_="sp1")
        links = actualites_div.find_all("a", class_="lks")
        for span, link in zip(spans, links):
            all_news.append({
                "Action": nom_action,
                "Date": span.text.strip(),
                "Titre": link.text.strip(),
                "URL": base_url + link["href"]
            })

    # 📑 Communiqués (section suivante sur la page)
    communiques_section = actualites_div.find_next("div", class_="home_content")
    if communiques_section:
        spans = communiques_section.find_all("span", class_="sp1")
        links = communiques_section.find_all("a", class_="lks")
        for span, link in zip(spans, links):
            all_communiques.append({
                "Action": nom_action,
                "Date": span.text.strip(),
                "Titre": link.text.strip(),
                "URL": base_url + link["href"]
            })

    time.sleep(1)


🔍 Scraping AFRICA GLOBAL LOGISTICS (SDSC.ci)...
🔍 Scraping AIR LIQUIDE CI (SIVC.ci)...
🔍 Scraping BANK OF AFRICA BENIN (BOAB.bj)...
🔍 Scraping BANK OF AFRICA BURKINA FASO (BOABF.bf)...
🔍 Scraping BANK OF AFRICA CI (BOAC.ci)...
🔍 Scraping BANK OF AFRICA MALI (BOAM.ml)...
🔍 Scraping BANK OF AFRICA NIGER (BOAN.ne)...
🔍 Scraping BANK OF AFRICA SENEGAL (BOAS.sn)...
🔍 Scraping BERNABE (BNBC.ci)...
🔍 Scraping BICICI (BICC.ci)...
🔍 Scraping BRVM - AGRICULTURE (BRVMAG)...
🔍 Scraping BRVM - AUTRES SECTEURS (BRVMAS)...
🔍 Scraping BRVM - CONSOMMATION DE BASE (BRVM-CB)...
🔍 Scraping BRVM - CONSOMMATION DISCRETIONNAIRE (BRVM-CD)...
🔍 Scraping BRVM - DISTRIBUTION (BRVMDI)...
🔍 Scraping BRVM - ENERGIE (BRVM-EN)...
🔍 Scraping BRVM - FINANCE (BRVMFI)...
🔍 Scraping BRVM - INDUSTRIE (BRVMIN)...
🔍 Scraping BRVM - INDUSTRIELS (BRVM-IN)...
🔍 Scraping BRVM - PRESTIGE (BRVMPR)...
🔍 Scraping BRVM - PRINCIPAL (BRVMPA)...
🔍 Scraping BRVM - SERVICES FINANCIERS (BRVM-SF)...
🔍 Scraping BRVM - SERVICES PUBLICS (BRVMS

In [None]:
# 👉 Résultats
df_news = pd.DataFrame(all_news)
df_communiques = pd.DataFrame(all_communiques)


In [20]:
from pymongo import MongoClient
import pandas as pd


# Sélection de la base et de la collection
db = client["sika_finance"]
collection = db["actus_communiques"]

# 👉 Création des DataFrames
df_news = pd.DataFrame(all_news)
df_communiques = pd.DataFrame(all_communiques)

# Regrouper par action dans df_news
actions_uniques = df_news["Action"].unique()

# Parcours de chaque action
for action in actions_uniques:
    # Filtrer les actualités et communiqués pour cette action
    actualites = df_news[df_news["Action"] == action].drop(columns=["Action"]).to_dict(orient="records")
    communiques = df_communiques[df_communiques["Action"] == action].drop(columns=["Action"]).to_dict(orient="records")

    # Supprimer l'existant si besoin
    collection.delete_one({"action": action})

    # Insertion dans MongoDB
    collection.insert_one({
        "action": action,
        "actualites": actualites,
        "communiques": communiques
    })

print("✅ Données insérées avec succès dans la collection 'actus_communiques'.")


✅ Données insérées avec succès dans la collection 'actus_communiques'.


In [None]:
import requests
from bs4 import BeautifulSoup
from pymongo import MongoClient
from datetime import datetime, timedelta
import time
import pandas as pd

# Connexion MongoDB
db = client["sika_finance"]
collection = db["cotations"]

def extraire_cotations(soup):
    cot1 = soup.find("div", id="cot1c")
    if not cot1:
        return None

    try:
        prix = float(cot1.select_one(".cot1u").text.split()[0].replace('\xa0', '').replace('XOF', '').replace(',', '.'))
        variation = cot1.select_one(".quote_up, .quote_down").text.strip()
        tables = cot1.find_all("table")

        values = [td.text.replace('\xa0', '').strip() for table in tables for td in table.find_all("td")[1::2]]

        return {
            "timestamp": datetime.now(),
            "prix": prix,
            "variation": variation,
            "volume_titres": float(values[0].replace(' ', '').replace(',', '.')),
            "volume_xof": float(values[1].replace(' ', '').replace(',', '.')),
            "ouverture": float(values[2].replace(' ', '').replace(',', '.')),
            "plus_haut": float(values[3].replace(' ', '').replace(',', '.')),
            "plus_bas": float(values[4].replace(' ', '').replace(',', '.')),
            "cloture_veille": float(values[5].replace(' ', '').replace(',', '.')),
            "beta": float(values[6].replace(',', '.')),
            "rsi": float(values[7].replace(',', '.')),
            "capital_echange": values[8],
            "valorisation": values[9]
        }

    except Exception as e:
        print("Erreur extraction cotations:", e)
        return None


base_url = "https://www.sikafinance.com"
cot_url = base_url + "/marches/cotation_"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"
}

# Étape 1 : Récupérer toutes les valeurs du sélecteur
homepage = requests.get(cot_url + "SDSC.ci", headers=headers)
soup_home = BeautifulSoup(homepage.content, "html.parser")

select = soup_home.select_one("#dpShares")
options = select.find_all("option")
actions = [(opt.text.strip(), opt["value"].strip()) for opt in options if opt["value"].strip()]

# Définir l'heure d'ouverture et de fermeture du marché
start = datetime.now().replace(hour=8, minute=0, second=0, microsecond=0)
end = datetime.now().replace(hour=18, minute=30, second=0, microsecond=0)

# Liste pour stocker les cotations pendant la journée
all_cotations = []

while datetime.now() < end:
    if datetime.now() >= start:
        print("⌛ Récupération des cotations...")

        # Liste temporaire pour les cotations de cette période
        cotations_period = []

        for nom_action, valeur in actions:
            try:
                url = cot_url + valeur
                response = requests.get(url, headers=headers)
                soup = BeautifulSoup(response.content, "html.parser")

                cotation = extraire_cotations(soup)
                if cotation:
                    cotations_period.append({
                        "action": nom_action,
                        **cotation  # Ajoute les cotations extraites à l'entrée
                    })
                    print(f"✅ {nom_action} mis à jour")
            except Exception as e:
                print(f"⚠️ Erreur lors de la mise à jour de {nom_action}: {e}")

        if cotations_period:
            # Ajouter les cotations de la période dans le DataFrame
            df = pd.DataFrame(cotations_period)
            all_cotations.append(df)
        
        # Attendre 15 minutes
        print("⏳ Pause 15 minutes...")
#     "time.sleep(15 * 60)
    else:
        print("🕗 Attente de 8h...")
        time.sleep(60)

⌛ Récupération des cotations...
✅ AFRICA GLOBAL LOGISTICS mis à jour
Erreur extraction cotations: invalid literal for int() with base 10: '460,00'
✅ BANK OF AFRICA BENIN mis à jour
✅ BANK OF AFRICA BURKINA FASO mis à jour
✅ BANK OF AFRICA CI mis à jour
✅ BANK OF AFRICA MALI mis à jour
✅ BANK OF AFRICA NIGER mis à jour
✅ BANK OF AFRICA SENEGAL mis à jour
Erreur extraction cotations: invalid literal for int() with base 10: '865,00'
✅ BICICI mis à jour
Erreur extraction cotations: invalid literal for int() with base 10: '222,91'
Erreur extraction cotations: invalid literal for int() with base 10: '661,74'
Erreur extraction cotations: invalid literal for int() with base 10: '117,46'
Erreur extraction cotations: invalid literal for int() with base 10: '98,55'
Erreur extraction cotations: invalid literal for int() with base 10: '404,35'
Erreur extraction cotations: invalid literal for int() with base 10: '126,51'
Erreur extraction cotations: invalid literal for int() with base 10: '115,18'
E

KeyboardInterrupt: 

In [28]:
# Une fois la période terminée, concaténer les DataFrames collectés
if all_cotations:
    final_df = pd.concat(all_cotations, ignore_index=True)

    # Insérer dans la base de données MongoDB
    for _, row in final_df.iterrows():
        collection.update_one(
            {"action": row["action"]},
            {"$push": {"cotations": row.to_dict()}},  # Ajouter chaque cotation à l'action correspondante
            upsert=True
        )
    print("✅ Toutes les cotations ont été insérées dans la base de données.")

✅ Toutes les cotations ont été insérées dans la base de données.


# ACTIONS

In [2]:
import os
import time
import pandas as pd
from bs4 import BeautifulSoup
from pymongo import MongoClient
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait, Select
from selenium.webdriver.support import expected_conditions as EC
from datetime import datetime, timedelta

# Connexion MongoDB
client = MongoClient(os.getenv("MONGO_URI"))
db = client["sika_finance"]
collection = db["historique_actions"]

def get_last_record_date():
    last_record = collection.find_one(sort=[("historique.Date", -1)])
    if last_record and "historique" in last_record and last_record["historique"]:
        last_date_str = last_record["historique"][-1]["Date"]
        try:
            return datetime.strptime(last_date_str, "%Y-%m-%d")
        except ValueError:
            print(f"Erreur de format pour la date: {last_date_str}")
            return None
    return None

# Calcul des dates pour la récupération des données
last_date = get_last_record_date()
if last_date:
    date_from = (last_date + timedelta(days=1))
else:
    date_from = datetime.strptime("01/01/2025", "%d/%m/%Y")

date_to = datetime.now()

print(f"📅 Récupération des données de {date_from.strftime('%d/%m/%Y')} à {date_to.strftime('%d/%m/%Y')}")

# Configuration Selenium
chrome_options = Options()
chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-dev-shm-usage")

driver = webdriver.Chrome(options=chrome_options)
wait = WebDriverWait(driver, 10)

driver.get("https://www.sikafinance.com/marches/historiques/SDSC.ci")
time.sleep(3)

# Liste des actions
select_element = wait.until(EC.presence_of_element_located((By.ID, "dpShares")))
select_html = Select(select_element)
options = [(opt.text.strip(), opt.get_attribute("value").strip()) for opt in select_html.options if opt.get_attribute("value").strip()]

for nom_action, valeur in options:
    print(f"\n🔍 Traitement de {nom_action} ({valeur})...")

    driver.get(f"https://www.sikafinance.com/marches/historiques/{valeur}")
    time.sleep(3)

    try:
        datefrom_input = wait.until(EC.presence_of_element_located((By.ID, "datefrom")))
        dateto_input = driver.find_element(By.ID, "dateto")

        datefrom_input.clear()
        datefrom_input.send_keys(date_from.strftime("%d/%m/%Y"))
        dateto_input.clear()
        dateto_input.send_keys(date_to.strftime("%d/%m/%Y"))

        driver.find_element(By.ID, "btnChange").click()
        time.sleep(5)

        soup = BeautifulSoup(driver.page_source, "html.parser")
        table = soup.find("table", id="tblhistos")

        if table:
            headers = [th.text.strip() for th in table.find_all("th")]
            rows = [[td.text.strip() for td in tr.find_all("td")] for tr in table.find_all("tr")[1:] if tr.find_all("td")]
            df = pd.DataFrame(rows, columns=headers)

            # Nettoyage + conversions
            colonnes_numeriques = ["Clôture", "Plus bas", "Plus haut", "Ouverture", "Volume Titres", "Volume FCFA", "Variation %"]
            for col in colonnes_numeriques:
                df[col] = df[col].str.replace(",", "").str.replace("%", "").str.replace("\xa0", "").astype(float)

            df["Date"] = pd.to_datetime(df["Date"], format="%d/%m/%Y")
            df = df.sort_values("Date").reset_index(drop=True)
            df["Action"] = nom_action

            # Extraction des dates déjà présentes
            record = collection.find_one({"action": nom_action}, {"historique.Date": 1})
            dates_existantes = set()
            if record and "historique" in record:
                dates_existantes = set(h["Date"] for h in record["historique"])

            # Construction des nouveaux enregistrements
            new_records = []
            for _, row in df.iterrows():
                date_iso = row["Date"].strftime("%Y-%m-%d")
                if date_iso not in dates_existantes:
                    new_records.append({
                        "Date": date_iso,
                        "Clôture": row["Clôture"],
                        "Plus bas": row["Plus bas"],
                        "Plus haut": row["Plus haut"],
                        "Ouverture": row["Ouverture"],
                        "Volume Titres": row["Volume Titres"],
                        "Volume FCFA": row["Volume FCFA"],
                        "Variation %": row["Variation %"],
                        "Action": nom_action
                    })

            if new_records:
                collection.update_one(
                    {"action": nom_action},
                    {"$push": {"historique": {"$each": new_records}}},
                    upsert=True
                )
                print(f"✅ {len(new_records)} nouvelles lignes insérées pour {nom_action}")
            else:
                print(f"ℹ️ Aucune nouvelle donnée à insérer pour {nom_action}")
        else:
            print(f"❌ Aucun tableau trouvé pour {nom_action}")
    except Exception as e:
        print(f"⚠️ Erreur lors du traitement de {nom_action}: {e}")

    time.sleep(2)

driver.quit()
print("🚀 Scraping terminé et données mises à jour.")


📅 Récupération des données de 01/01/2025 à 20/04/2025

🔍 Traitement de AFRICA GLOBAL LOGISTICS (SDSC.ci)...
✅ 63 nouvelles lignes insérées pour AFRICA GLOBAL LOGISTICS

🔍 Traitement de AIR LIQUIDE CI (SIVC.ci)...
✅ 63 nouvelles lignes insérées pour AIR LIQUIDE CI

🔍 Traitement de BANK OF AFRICA BENIN (BOAB.bj)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA BENIN

🔍 Traitement de BANK OF AFRICA BURKINA FASO (BOABF.bf)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA BURKINA FASO

🔍 Traitement de BANK OF AFRICA CI (BOAC.ci)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA CI

🔍 Traitement de BANK OF AFRICA MALI (BOAM.ml)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA MALI

🔍 Traitement de BANK OF AFRICA NIGER (BOAN.ne)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA NIGER

🔍 Traitement de BANK OF AFRICA SENEGAL (BOAS.sn)...
✅ 63 nouvelles lignes insérées pour BANK OF AFRICA SENEGAL

🔍 Traitement de BANQUE INTERNATIONALE POUR LE COMMERCE DU BENIN (BICB.bj)...