In [2]:
import sqlite3
import csv

# Chemin du fichier CSV
csv_file_path = "raw_data/sales.csv"

# Connexion √† la base de donn√©es SQLite
conn = sqlite3.connect("sales.db")
cursor = conn.cursor()

# Cr√©ation de la table avec des types adapt√©s
cursor.execute('''
CREATE TABLE IF NOT EXISTS sales (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    date TEXT,           -- Format YYYY-MM-DD
    datetime TEXT,       -- Format YYYY-MM-DD HH:MM:SS.sss
    cash_type TEXT,
    card TEXT,
    money REAL,
    coffee_name TEXT
)
''')

# Lecture et insertion des donn√©es du fichier CSV
with open(csv_file_path, mode='r', encoding='utf-8') as file:
    reader = csv.reader(file)
    
    # Ignorer les en-t√™tes
    headers = next(reader)
    
    # Ins√©rer les lignes dans la table SQLite
    for row in reader:
        cursor.execute('''
        INSERT INTO sales (date, datetime, cash_type, card, money, coffee_name)
        VALUES (?, ?, ?, ?, ?, ?)
        ''', row)

# Sauvegarder les changements et fermer la connexion
conn.commit()
conn.close()

print("Les donn√©es ont √©t√© import√©es dans la base de donn√©es 'sales.db'.")

Les donn√©es ont √©t√© import√©es dans la base de donn√©es 'sales.db'.


In [3]:
import sqlite3
import pandas as pd

# Connexion √† la base de donn√©es SQLite
conn = sqlite3.connect("sales.db")

# Charger les donn√©es de la table 'sales' dans un DataFrame Pandas
query = "SELECT * FROM sales"
data = pd.read_sql_query(query, conn)

# Conversion des colonnes 'date' et 'datetime' en type datetime
data['date'] = pd.to_datetime(data['date'], format='%Y-%m-%d')
data['datetime'] = pd.to_datetime(data['datetime'], format='%Y-%m-%d %H:%M:%S.%f')

# Afficher des informations g√©n√©rales sur les donn√©es
print("Informations g√©n√©rales sur les donn√©es :")
print(data.info())

# Afficher les 5 premi√®res lignes des donn√©es
print("\nPremi√®res lignes des donn√©es :")
print(data.head())

# Fermeture de la connexion
conn.close()

Informations g√©n√©rales sur les donn√©es :
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 15738 entries, 0 to 15737
Data columns (total 7 columns):
 #   Column       Non-Null Count  Dtype         
---  ------       --------------  -----         
 0   id           15738 non-null  int64         
 1   date         15738 non-null  datetime64[ns]
 2   datetime     15738 non-null  datetime64[ns]
 3   cash_type    15738 non-null  object        
 4   card         15738 non-null  object        
 5   money        15738 non-null  float64       
 6   coffee_name  15738 non-null  object        
dtypes: datetime64[ns](2), float64(1), int64(1), object(3)
memory usage: 860.8+ KB
None

Premi√®res lignes des donn√©es :
   id       date                datetime cash_type                 card  \
0   1 2024-03-01 2024-03-01 10:15:50.520      card  ANON-0000-0000-0001   
1   2 2024-03-01 2024-03-01 12:19:22.539      card  ANON-0000-0000-0002   
2   3 2024-03-01 2024-03-01 12:20:18.089      card  ANON-000

In [4]:
import sqlite3
import pandas as pd
from datetime import datetime

# Connexion √† la base de donn√©es SQLite
conn = sqlite3.connect("sales.db")

# Charger les donn√©es de la table 'sales' dans un DataFrame Pandas
query = "SELECT * FROM sales"
data = pd.read_sql_query(query, conn)

# Conversion des colonnes 'date' et 'datetime' en type datetime
data['date'] = pd.to_datetime(data['date'], format='%Y-%m-%d')
data['datetime'] = pd.to_datetime(data['datetime'], format='%Y-%m-%d %H:%M:%S.%f')

# Trouver la derni√®re date dans les donn√©es
derniere_date = data['date'].max()
dernier_mois = derniere_date.month
derniere_annee = derniere_date.year

# D√©terminer le mois et l'ann√©e du mois pr√©c√©dent
if dernier_mois == 1:  # Si janvier, alors le mois pr√©c√©dent est d√©cembre de l'ann√©e pr√©c√©dente
    mois_precedent = 12
    annee_precedente = derniere_annee - 1
else:
    mois_precedent = dernier_mois - 1
    annee_precedente = derniere_annee

# Filtrer les donn√©es pour le dernier mois
data_dernier_mois = data[(data['date'].dt.month == dernier_mois) & (data['date'].dt.year == derniere_annee)]

# Filtrer les donn√©es pour le mois pr√©c√©dent
data_mois_precedent = data[(data['date'].dt.month == mois_precedent) & (data['date'].dt.year == annee_precedente)]

# Calcul des KPIs pour le dernier mois
total_ca_dernier_mois = round(data_dernier_mois['money'].sum(), 0)
nombre_transactions_dernier_mois = len(data_dernier_mois)
moyenne_ca_dernier_mois = round(data_dernier_mois['money'].mean(), 0)
produit_populaire_dernier_mois = data_dernier_mois['coffee_name'].mode()[0]

# Calcul des KPIs pour le mois pr√©c√©dent
total_ca_mois_precedent = round(data_mois_precedent['money'].sum(), 0)
nombre_transactions_mois_precedent = len(data_mois_precedent)
moyenne_ca_mois_precedent = round(data_mois_precedent['money'].mean(), 0)
produit_populaire_mois_precedent = data_mois_precedent['coffee_name'].mode()[0]

# Calcul des pourcentages de variation
pourcentage_variation_ca = ((total_ca_dernier_mois - total_ca_mois_precedent) / total_ca_mois_precedent) * 100 if total_ca_mois_precedent != 0 else 0
pourcentage_variation_transactions = ((nombre_transactions_dernier_mois - nombre_transactions_mois_precedent) / nombre_transactions_mois_precedent) * 100 if nombre_transactions_mois_precedent != 0 else 0
pourcentage_variation_moyenne_ca = ((moyenne_ca_dernier_mois - moyenne_ca_mois_precedent) / moyenne_ca_mois_precedent) * 100 if moyenne_ca_mois_precedent != 0 else 0

# Stocker les r√©sultats dans une variable texte
resultats_kpis = f"""
KPIs pour le dernier mois :
- Total du chiffre d'affaires : {total_ca_dernier_mois}
- Nombre de transactions : {nombre_transactions_dernier_mois}
- Moyenne du chiffre d'affaires par transaction : {moyenne_ca_dernier_mois}
- Produit le plus populaire : {produit_populaire_dernier_mois}

KPIs pour le mois pr√©c√©dent :
- Total du chiffre d'affaires : {total_ca_mois_precedent}
- Nombre de transactions : {nombre_transactions_mois_precedent}
- Moyenne du chiffre d'affaires par transaction : {moyenne_ca_mois_precedent}
- Produit le plus populaire : {produit_populaire_mois_precedent}

Tendances en pourcentage par rapport au mois pr√©c√©dent :
- Variation du chiffre d'affaires : {pourcentage_variation_ca:.2f}%
- Variation des transactions : {pourcentage_variation_transactions:.2f}%
- Variation de la moyenne du chiffre d'affaires : {pourcentage_variation_moyenne_ca:.2f}%
"""

# Afficher les r√©sultats
print(resultats_kpis)

# Fermeture de la connexion
conn.close()



KPIs pour le dernier mois :
- Total du chiffre d'affaires : 36318.0
- Nombre de transactions : 1134
- Moyenne du chiffre d'affaires par transaction : 32.0
- Produit le plus populaire : Americano with Milk

KPIs pour le mois pr√©c√©dent :
- Total du chiffre d'affaires : 51543.0
- Nombre de transactions : 1554
- Moyenne du chiffre d'affaires par transaction : 33.0
- Produit le plus populaire : Latte

Tendances en pourcentage par rapport au mois pr√©c√©dent :
- Variation du chiffre d'affaires : -29.54%
- Variation des transactions : -27.03%
- Variation de la moyenne du chiffre d'affaires : -3.03%



In [5]:
import json
from openai import OpenAI

# Charger la configuration
with open('config.json', 'r') as f:
    config = json.load(f)

# Initialiser le client
client = OpenAI(
    base_url=config["base_url"],
    api_key=config["api_key"]
)

# Prompt simplifi√©
question = f"""
R√©dige un message d'√©quipe motivant bas√© sur ces KPIs :
{resultats_kpis}

Ton r√¥le : Manager encourageant
Ton style : Professionnel et humain
Format : Message court et structur√©
Ton objectif : Analyser, expliquer et motiver
"""

# Utilisation
response = client.chat.completions.create(
    extra_headers=config["headers"],
    model="deepseek/deepseek-r1:free",
    messages=[{
        "role": "user",
        "content": question
    }]
)

print(response.choices[0].message.content)

**Message √† l'√©quipe**  
üåü **Chers tous,**  

**Analyse des r√©sultats** :  
Ce mois-ci, nous avons g√©n√©r√© **36 318‚Ç¨** de CA (vs 51 543‚Ç¨ le mois dernier) avec **1 134 transactions** (vs 1 554). L‚ÄôAmericano with Milk a √©t√© notre star produit, rempla√ßant le Latte en t√™te des ventes !  

**Contexte** :  
La baisse du CA (-29,5%) et des transactions (-27%) refl√®te un contexte exigeant, mais souligne aussi des opportunit√©s. La l√©g√®re baisse du panier moyen (-3%) montre que chaque client compte plus que jamais.  

**Leviers d'action** :  
1Ô∏è‚É£ **Capitalisons sur l‚ÄôAmericano with Milk** : Promouvons des combinaisons gagnantes (viennoiseries, snacks) pour augmenter le panier moyen.  
2Ô∏è‚É£ **Ciblons la fid√©lit√©** : Relan√ßons les clients peu actifs via des offres personnalis√©es.  
3Ô∏è‚É£ **Restons agiles** : Observons les tendances et adaptons nos promotions en temps r√©el.  

**Motivation** :  
Les d√©fis sont des tremplins pour innover ! Chaque sourire, chaqu

In [6]:
analyse_reunion = """
**Transcription Brainstorming - 15/11 - Caf√© "Les Grains d'Or"**

**Participants** : 
- Sophie (Manager)
- Marc (Barista chef)
- Thomas (Responsable appro)
- Laura (Marketing)

**Sophie** : "On a vu -18% de CA ce mois-ci, c'est s√©rieux. Marc, tes observations en salle ?"

**Marc** : "Clairement moins de monde entre 14h-16h. Les √©tudiants venaient avant avec leurs ordis, maintenant je les vois au nouveau Bean Brothers. Leur wifi est gratuit en plus..."

**Laura** : "Justement, j'ai check√© leurs prix : leur latte est √† 4,20‚Ç¨ contre nos 4,80‚Ç¨. Et ils font des cookies offerts apr√®s 15h."

**Thomas** : "On a eu un souci technique aussi - la machine √† lait a fui du 15 au 18 octobre. J'ai d√ª servir des caf√©s noirs √† des clients qui voulaient des lattes..."

**Marc** : "Oui, et 3 clients m'ont dit qu'ils trouvaient nos nouvelles tasses trop petites. La taille 'grand' passe de 350 √† 300ml."

**Sophie** : "Thomas, des insights sur les appros ?"

**Thomas** : "Le prix du lait bio a augment√© de 12% ce mois-ci. Et notre fournisseur de p√¢tisseries a eu 5 jours de retard."

**Laura** : "Par contre, bonne nouvelle : nos posts Instagram sur le latte art ont g√©n√©r√© +320 leads. Mais √ßa convertit pas assez..."

**√âchanges cl√©s** :
1. "Bean Brothers nous pique la client√®le √©tudiante avec des prix agressifs" ‚Üí Marc
2. "La panne machine + taille des tasses = double peine sur les caf√©s cr√®meux" ‚Üí Thomas
3. "On communique sur la qualit√© mais sans preuve tangible" ‚Üí Laura

**Id√©es spontan√©es** :
- "Et si on faisait des ateliers latte art le mercredi apr√®s-midi ?" ‚Üí Marc
- "Proposer un tarif √©tudiant avec carte U ?" ‚Üí Laura
- "Recalibrer nos tailles de tasses pour garder la marge mais para√Ætre plus g√©n√©reux" ‚Üí Thomas
"""

In [7]:
import json
from openai import OpenAI

# Charger la configuration
with open('config.json', 'r') as f:
    config = json.load(f)

# Initialiser le client
client = OpenAI(
    base_url=config["base_url"],
    api_key=config["api_key"]
)


# Construction du prompt RAG
prompt_analyse = f"""
Analysez ces r√©sultats KPI en tenant compte des insights de notre derni√®re r√©union d'analyse.
Fournissez une synth√®se actionable pour l'√©quipe.

CONTEXTE (extrait de la r√©union du 15/11) :
{analyse_reunion}

DONN√âES ACTUELLES √Ä ANALYSER :
{resultats_kpis}

Consignes :
1. Faites des liens concrets entre les tendances actuelles et nos conclusions pass√©es
2. Ton style : synth√©tique, orient√© solutions, avec donn√©es cl√©s en √©vidence
"""

# Requ√™te au mod√®le
response = client.chat.completions.create(
    extra_headers=config["headers"],
    model="deepseek/deepseek-r1:free",
    messages=[{
        "role": "user",
        "content": prompt_analyse
    }]
)

print("ANALYSE CONTEXTUALIS√âE DES KPIs\n")
print(response.choices[0].message.content)

ANALYSE CONTEXTUALIS√âE DES KPIs

**Synth√®se Actionnable - Caf√© "Les Grains d'Or"**  
*Liens entre donn√©es et insights :*  

1. **Chute de 29.5% du CA** ‚Üí Caus√©e par :  
   - **27% moins de transactions** : Migration des √©tudiants vers Bean Brothers (wifi gratuit, prix bas).  
   - **Probl√®me machine √† lait** (15-18 oct) ‚Üí Clients refus√©s pour lattes ‚Üí **Americano with Milk** nouveau best-seller.  

2. **Baisse de 3% du panier moyen** ‚Üí Associ√©e √† :  
   - R√©duction taille des tasses (300ml vs 350ml) ‚Üí Per√ßue comme moins g√©n√©reuse.  
   - Offres promotionnelles concurrentielles (ex: cookie offert √† 15h chez Bean Brothers).  

3. **Opportunit√© non exploit√©e** :  
   - **+320 leads Instagram** non convertis ‚Üí Manque d'incitation claire (ex: promo cibl√©e).  

---

**Actions Prioritaires (Owner) :**  

**üü¢ Recapture √âtudiants (Marc/Laura)**  
- Tester **tarif r√©duit √©tudiant (4‚Ç¨ le latte) 14h-16h** avec pr√©sentation de carte √©tudiante.  
- **WiFi gra