# Parsing - Lire et transformer les donnees

Le parsing c'est la base. Sans ca, tu peux rien faire. C'est comme savoir ouvrir une porte avant d'entrer dans une maison.

Dans ce notebook on va voir comment transformer du texte brut en quelque chose d'utilisable.

---

## Lire un fichier

Premiere etape : ouvrir un fichier. Y'a plusieurs facons de faire, mais une seule est vraiment propre.

In [None]:
# On cree un fichier exemple pour jouer avec
with open("test.txt", "w") as f:
    f.write("42\n7\n13\n99")

print("Fichier cree.")

In [None]:
# La bonne facon : with open()
# Le fichier se ferme tout seul, meme si ca plante

with open("test.txt") as f:
    contenu = f.read()

print(contenu)
print("---")
print(repr(contenu))  # repr() montre les caracteres invisibles comme \n

Tu vois les `\n` ? C'est les retours a la ligne. Faut les gerer.

---

## split() - Le couteau suisse

90% du parsing c'est juste savoir utiliser `split()` correctement.

In [None]:
# Decouper par retour a la ligne
lignes = contenu.split("\n")
print(lignes)

In [None]:
# Autres exemples de split

print("a,b,c".split(","))      # par virgule
print("a->b->c".split("->"))   # par fleche
print("a  b   c".split())      # par espaces (intelligent)

### Piege classique

Attention a la difference entre `split()` et `split(" ")`

In [None]:
texte = "mot1  mot2   mot3"  # espaces multiples

print(texte.split())       # ['mot1', 'mot2', 'mot3'] - propre
print(texte.split(" "))    # ['mot1', '', 'mot2', '', '', 'mot3'] - bordel

---

## Convertir en nombres

Les fichiers contiennent du texte. "42" c'est pas pareil que 42.

In [None]:
# String vs int
print("42" + "42")   # concatenation de strings
print(42 + 42)       # addition de nombres

In [None]:
# Conversion
nombre = int("42")
print(nombre + 1)

In [None]:
# Convertir une liste entiere
textes = ["1", "2", "3", "4"]

# Methode 1 : boucle classique
nombres = []
for t in textes:
    nombres.append(int(t))
print(nombres)

# Methode 2 : comprehension (plus pythonique)
nombres = [int(t) for t in textes]
print(nombres)

---

## Exercice : Parser une liste de nombres

Transforme ce texte en liste d'entiers et calcule la somme.

In [None]:
data = """10
25
42
7
99"""

# A toi de jouer
# nombres = ???
# print(sum(nombres))

In [None]:
# Solution
nombres = [int(x) for x in data.split("\n")]
print(nombres)
print(f"Somme: {sum(nombres)}")

---

## Exercice : Coordonnees

Chaque ligne contient des coordonnees x,y. Transforme en liste de tuples.

In [None]:
data = """3,5
7,2
1,9"""

# Resultat attendu: [(3, 5), (7, 2), (1, 9)]
# coords = ???

In [None]:
# Solution
coords = []
for ligne in data.split("\n"):
    x, y = ligne.split(",")
    coords.append((int(x), int(y)))

print(coords)

---

## Parser une grille

Les grilles 2D c'est super courant en AoC. Faut savoir les parser vite fait.

In [None]:
grille_txt = """..#..
.#.#.
#...#
.#.#.
..#.."""

# Parser en liste de listes
grille = [list(ligne) for ligne in grille_txt.split("\n")]

# Afficher
for row in grille:
    print(row)

In [None]:
# Acceder a une case
print(f"Case [0][2] = {grille[0][2]}")
print(f"Case [2][0] = {grille[2][0]}")

# Dimensions
hauteur = len(grille)
largeur = len(grille[0])
print(f"Taille: {hauteur}x{largeur}")

---

## Challenge AoC : 2015 Day 1

Le Pere Noel suit des instructions:
- `(` = monter d'un etage
- `)` = descendre d'un etage

Il part de l'etage 0. A quel etage il finit?

In [None]:
instructions = "(()(()(((())))))(()((()))"  # exemple

# Methode 1 : boucle
etage = 0
for c in instructions:
    if c == '(':
        etage += 1
    elif c == ')':
        etage -= 1

print(f"Etage final: {etage}")

In [None]:
# Methode 2 : one-liner
# Chaque ( vaut +1, chaque ) vaut -1
# Donc etage = nombre de ( - nombre de )

etage = instructions.count('(') - instructions.count(')')
print(f"Etage final: {etage}")

---

## En cyber

Le parsing c'est partout:
- Lire des logs (Apache, auth.log, syslog)
- Analyser des paquets reseau
- Extraire des donnees de pages web
- Parser des formats binaires

Un mauvais parsing = des failles (injection, overflow...).

In [None]:
# Exemple: extraire l'IP d'un log Apache
log = '192.168.1.1 - - [07/Dec/2025:10:00:00] "GET /admin HTTP/1.1" 403 287'

ip = log.split()[0]
code_http = log.split('" ')[1].split()[0]

print(f"IP: {ip}")
print(f"Code: {code_http}")

---

## Resume

| Truc | Usage |
|------|-------|
| `with open()` | Ouvrir un fichier proprement |
| `.strip()` | Virer les espaces/newlines |
| `.split()` | Decouper une string |
| `int()` | Convertir en nombre |
| `[x for x in ...]` | Transformer une liste |