In [2]:
import json

def extract_cells_from_notebook(notebook_path, include_code=True, include_markdown=True, output_path=None):
    """
    Extracts code and/or markdown cells from a Jupyter notebook and returns them as a single text block.
    
    Parameters:
        notebook_path (str): Path to the input .ipynb file
        include_code (bool): Whether to include code cells
        include_markdown (bool): Whether to include markdown cells
        output_path (str or None): Path to save output (e.g., .py or .txt), or None to just return string

    Returns:
        str: Combined source content of selected cell types
    """
    with open(notebook_path, 'r', encoding='utf-8') as f:
        notebook = json.load(f)

    extracted_lines = []

    for cell in notebook.get('cells', []):
        cell_type = cell.get('cell_type')
        if cell_type == 'code' and include_code:
            extracted_lines.append("# --- Code Cell ---\n")
            extracted_lines.extend(cell.get('source', []))
            extracted_lines.append('\n')
        elif cell_type == 'markdown' and include_markdown:
            extracted_lines.append("# --- Markdown Cell ---\n")
            # Convert Markdown to commented lines (optional)
            md_lines = cell.get('source', [])
            commented_md = ['# ' + line if not line.startswith('#') else line for line in md_lines]
            extracted_lines.extend(commented_md)
            extracted_lines.append('\n')

    output = ''.join(extracted_lines)

    if output_path:
        with open(output_path, 'w', encoding='utf-8') as f:
            f.write(output)

    return output

# Example usage
code_and_md = extract_cells_from_notebook(
    notebook_path="redaction.ipynb",
    include_code=True,
    include_markdown=True,
    output_path="readction.txt"
)

print(code_and_md)


# --- Markdown Cell ---
# Prédiction de la direction des prix sur les marchés financiers

# --- Markdown Cell ---
## 1. Introduction et présentation du problème

# --- Markdown Cell ---
# 
### 1.1 Contexte et enjeux
# 
# Dans le cadre de ce challenge (issu du Collège de France ou du Lab Banque de France), nous disposons de données de marché avec pour objectif de prédire la direction du prix (baisse, stable, hausse) en fin de journée, à partir des rendements du matin.
# 
# Ce marché américain étant particulièrement liquide, l'enjeu est de pouvoir estimer la tendance entre 14h et 16h pour prendre des décisions d'investissement ou d'arbitrage.

# --- Markdown Cell ---
# 
### 1.2 Description des données
# 
# - **Index des données**
#   - Chaque ligne représente un jour donné et une action donnée (identifiants : `day` et `equity`).
#   - Les colonnes `r0` à `r52` correspondent aux rendements (en points de base) toutes les 5 minutes entre 9h30 et 14h.
# 
# - **Variables explicatives**
#   - 