# üìñ Chapitre 1 : Parsing - Lire et Transformer les Donn√©es

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/VOTRE_USER/LearnByAoC/blob/main/notebooks/01_parsing.ipynb)

---

## üéØ Objectifs
- Lire des fichiers texte
- D√©couper des cha√Ænes avec `split()`
- Convertir des types (string ‚Üí int)
- Parser des grilles 2D

## üìö L'Histoire

Imagine que tu re√ßois une lettre cod√©e. Avant de pouvoir comprendre le message, tu dois d'abord **d√©coder** les symboles. C'est exactement ce qu'on fait en programmation : transformer du texte brut en donn√©es utilisables.

---
## 1. Lire un fichier

In [None]:
# Cr√©ons d'abord un fichier exemple
exemple = """123
456
789"""

with open("exemple.txt", "w") as f:
    f.write(exemple)

print("Fichier cr√©√© !")

In [None]:
# M√©thode 1 : Lire tout le fichier
with open("exemple.txt") as f:
    contenu = f.read()

print("Contenu brut:")
print(repr(contenu))  # repr() montre les \n

In [None]:
# M√©thode 2 : Lire ligne par ligne
with open("exemple.txt") as f:
    lignes = f.readlines()

print("Liste de lignes:")
print(lignes)

In [None]:
# M√©thode 3 : It√©ration directe (recommand√©)
with open("exemple.txt") as f:
    for i, ligne in enumerate(f, 1):
        print(f"Ligne {i}: {ligne.strip()}")

### üí° Concept cl√©

Le mot-cl√© `with` garantit que le fichier sera ferm√© automatiquement, m√™me en cas d'erreur. C'est une bonne pratique √† toujours utiliser.

---
## 2. Nettoyer les donn√©es

In [None]:
ligne = "  Hello World  \n"

print(f"Original:  {repr(ligne)}")
print(f"strip():   {repr(ligne.strip())}")
print(f"rstrip():  {repr(ligne.rstrip())}")
print(f"lstrip():  {repr(ligne.lstrip())}")

---
## 3. D√©couper avec split()

In [None]:
# D√©couper par espaces (d√©faut)
print("a b c".split())

# D√©couper par un caract√®re
print("a,b,c".split(","))

# D√©couper par une cha√Æne
print("a->b->c".split("->"))

### ‚ö†Ô∏è Pi√®ge √† √©viter

In [None]:
# Diff√©rence importante !
print("a  b".split())      # ['a', 'b'] - espaces multiples ignor√©s
print("a  b".split(" "))   # ['a', '', 'b'] - √©l√©ment vide !

---
## 4. Convertir les types

In [None]:
# String vers entier
print(int("42"))
print(int("  42  "))  # strip automatique !

# String vers flottant  
print(float("3.14"))

# Conversion en masse
nombres = [int(x) for x in ["1", "2", "3"]]
print(nombres)

---
## üèãÔ∏è Exercice 1 : Parser une liste de nombres

Transforme ce texte en liste d'entiers :

In [None]:
texte = """10
25
42
7
99"""

# TODO: Transforme en liste [10, 25, 42, 7, 99]
nombres = ???

print(nombres)
print(f"Somme: {sum(nombres)}")

In [None]:
# Solution (ne regarde qu'apr√®s avoir essay√© !)
nombres = [int(x) for x in texte.strip().split("\n")]
print(nombres)
print(f"Somme: {sum(nombres)}")

---
## üèãÔ∏è Exercice 2 : Parser des coordonn√©es

Transforme ce texte en liste de tuples :

In [None]:
texte = """3,5
7,2
1,9"""

# TODO: Transforme en [(3, 5), (7, 2), (1, 9)]
coords = ???

print(coords)

In [None]:
# Solution
coords = []
for ligne in texte.strip().split("\n"):
    x, y = ligne.split(",")
    coords.append((int(x), int(y)))

# Ou en une ligne :
coords = [tuple(map(int, l.split(","))) for l in texte.strip().split("\n")]
print(coords)

---
## üèãÔ∏è Exercice 3 : Parser une grille

Parse cette grille et compte les `#` :

In [None]:
grille_txt = """..#..
.#.#.
#...#
.#.#.
..#.."""

# TODO: 
# 1. Parse en liste de listes
# 2. Compte les '#'

grille = ???
count = ???

print(f"Grille {len(grille)}x{len(grille[0])}")
print(f"Nombre de #: {count}")

In [None]:
# Solution
grille = [list(ligne) for ligne in grille_txt.strip().split("\n")]

count = sum(row.count('#') for row in grille)
# Ou : count = grille_txt.count('#')

print(f"Grille {len(grille)}x{len(grille[0])}")
print(f"Nombre de #: {count}")

# Afficher la grille
for row in grille:
    print(''.join(row))

---
## üéÆ Challenge AoC : 2015 Day 1 - Not Quite Lisp

Le P√®re No√´l est dans un immeuble. Les instructions lui disent :
- `(` = monter d'un √©tage
- `)` = descendre d'un √©tage

Il commence √† l'√©tage 0. √Ä quel √©tage finit-il ?

In [None]:
instructions = "(()(()("  # Exemple simple

# TODO: Calcule l'√©tage final
etage = ???

print(f"√âtage final: {etage}")

In [None]:
# Solution 1 : Boucle
etage = 0
for c in instructions:
    if c == '(':
        etage += 1
    elif c == ')':
        etage -= 1

print(f"√âtage final: {etage}")

In [None]:
# Solution 2 : Comptage direct
etage = instructions.count('(') - instructions.count(')')
print(f"√âtage final: {etage}")

---
## üîê Application Cyber

Le parsing est **fondamental** en cybers√©curit√© :
- **Analyse de logs** : Parser les logs Apache, auth.log
- **Parsing de packets** : Extraire les headers HTTP
- **OSINT** : Extraire des donn√©es de pages web

In [None]:
# Exemple : Parser un log Apache
log = '192.168.1.1 - - [07/Dec/2025:10:00:00] "GET /admin HTTP/1.1" 403 287'

# Extraire l'IP
ip = log.split()[0]
print(f"IP: {ip}")

# Extraire le code HTTP
code = log.split('" ')[1].split()[0]
print(f"Code HTTP: {code}")

---
## üìã R√©sum√©

| M√©thode | Usage |
|---------|-------|
| `open() / with` | Lire un fichier |
| `.strip()` | Nettoyer les espaces |
| `.split()` | D√©couper une cha√Æne |
| `int() / float()` | Convertir en nombre |
| `[x for x in ...]` | Compr√©hension de liste |