# 📚 Extraction d'un PID avec des Regex en Python

### 🔹 Introduction

Un **PID** (Process ID) est un identifiant numérique attribué à un processus par le système d’exploitation.
Il est souvent utilisé dans les logs système pour identifier l’origine des messages.

💡 Dans ce cours, nous allons :
✅ Comprendre la forme d’un PID.
✅ Écrire une regex pour l’extraire.
✅ Tester sur des exemples pratiques.

## 🔹 Exemple de log contenant un PID

```log
May 29 12:00:00 myserver systemd[1]: Started Session 1 of user root.
May 29 12:01:00 myserver sshd[1234]: Accepted password for user from 192.168.0.1 port 22 ssh2
May 29 12:02:00 myserver kernel: [98765.4321] INFO: task process_name(5678) blocked for more than 120 seconds.

### 🔹 Exemple de log contenant un PID

```log
May 29 12:00:00 myserver systemd[1]: Started Session 1 of user root.
May 29 12:01:00 myserver sshd[1234]: Accepted password for user from 192.168.0.1 port 22 ssh2
May 29 12:02:00 myserver kernel: [98765.4321] INFO: task process_name(5678) blocked for more than 120 seconds.

```markdown
## 🔹 Importer les modules

In [None]:
import re

### 🔹 Exemple 1 : Extraire un PID entre crochets `[]`

In [None]:
log_line = "May 29 12:01:00 myserver sshd[1234]: Accepted password for user"

# Regex : un nombre entre crochets
pattern = r"\[(\d+)\]"

match = re.search(pattern, log_line)
if match:
    print("PID trouvé :", match.group(1))
else:
    print("Pas de PID trouvé.")

## 🔹 Exemple 2 : Extraire un PID entre parenthèses `()`

In [None]:
log_line2 = "May 29 12:02:00 myserver kernel: [98765.4321] INFO: task process_name(5678) blocked"

# Regex : un nombre entre parenthèses
pattern2 = r"\((\d+)\)"

match2 = re.search(pattern2, log_line2)
if match2:
    print("PID trouvé :", match2.group(1))
else:
    print("Pas de PID trouvé.")

### 🔹 Exemple 3 : Extraire tous les PID d'un texte

Si le log contient plusieurs PID, on peut les trouver avec `re.findall()`.

In [None]:
log_text = """
May 29 12:00:00 myserver systemd[1]: Started Session 1 of user root.
May 29 12:01:00 myserver sshd[1234]: Accepted password for user
May 29 12:02:00 myserver kernel: [98765.4321] INFO: task process_name(5678) blocked
"""

# Trouver tous les nombres entre crochets et parenthèses
pattern_all = r"\[(\d+)\]|\((\d+)\)"

matches = re.findall(pattern_all, log_text)

# Comme on a deux groupes de capture, chaque élément est un tuple : (groupe1, groupe2)
pids = []
for g1, g2 in matches:
    if g1:
        pids.append(g1)
    elif g2:
        pids.append(g2)

print("Tous les PID trouvés :", pids)