**Author:**       Jensy Gregorio Gómez 
---------------------------------------
**Profession:**  IT Support Analyst and Automatation with Python

**Date:**         13 March 2024     

**Location:**     Vila Izabel, Curitiba/PR  


---

**Contacto:**

- **Email:** [contact@jensygomez.us](mailto:contact@jensygomez.us)
- **YouTube:** [Tu Canal de YouTube](https://www.youtube.com/@systechcwb826)
- **LinkedIn:** [Tu Perfil de LinkedIn](https://www.linkedin.com/in/jensygomez/)





# Review: Extracting a PID using regexes in Python

This reading contains the code used in the instructional videos from [**Extracting a PID Using regexes in Python**](https://www.coursera.org/learn/python-operating-system/lecture/0f10b/extracting-a-pid-using-regexes-in-python)

## Introduction

This follow-along reading is organized to match the content in the video that follows. It contains the same code shown in the next video. These code blocks will provide you with the opportunity to see how the code is written, allow you to practice running it, and can be used as a reference to refer back to.

You can follow along in the reading as the instructor discusses the code or review the code after watching the video.



```python
import re

log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"

# Define a regular expression pattern to search for numbers enclosed in square brackets
regex = r"\[(\d+)\]"

# Search for the pattern in the log string
result = re.search(regex, log)

# If a match is found, print the extracted number
if result:
    print(result[1])
```

Documentación:

1. `import re`: Importa el módulo de expresiones regulares `re`, que proporciona funciones para trabajar con expresiones regulares en Python.
   
2. `log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"`: Define una cadena de registro que contiene información sobre un evento, incluido un número entre corchetes que se desea extraer.

3. `regex = r"\[(\d+)\]"`: Define una expresión regular que busca números entre corchetes en una cadena. Explicación:
   - `\[\]`: Coincide con los corchetes literales `[` y `]`.
   - `(\d+)`: Coincide con uno o más dígitos (`\d+`) y los captura en un grupo (`()`).

4. `result = re.search(regex, log)`: Busca la primera ocurrencia de la expresión regular `regex` en la cadena `log` utilizando la función `re.search()` y almacena el resultado en `result`.

5. `if result:`: Verifica si se encontró una coincidencia en el paso anterior.

6. `print(result[1])`: Si se encuentra una coincidencia, imprime el contenido del primer grupo capturado (los dígitos entre corchetes) utilizando `result[1]`.

Esta documentación proporciona una explicación básica del código y su funcionalidad. Si necesitas más detalles o alguna aclaración adicional, no dudes en preguntar.

In [None]:
import re

# Se importa el módulo re para trabajar con expresiones regulares en Python.

log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"
# Se define una cadena de registro que contiene información sobre un evento, incluido un número entre corchetes que se desea extraer.

regex = r"\[(\d+)\]"
# Se define una expresión regular para buscar números entre corchetes en una cadena. Explicación:
#   - \[\]: Coincide con los corchetes literales '[' y ']'.
#   - (\d+): Coincide con uno o más dígitos (\d+) y los captura en un grupo (()).

result = re.search(regex, log)
# Se busca la primera ocurrencia de la expresión regular 'regex' en la cadena 'log' utilizando la función re.search() y se almacena el resultado en 'result'.

result = re.search(regex, "A completely different string that also has numbers [34567]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en una cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

print(result[1])
# Se imprime el contenido del primer grupo capturado (los dígitos entre corchetes) de la última coincidencia encontrada en 'result'.


In [None]:
import re

# Se importa el módulo re para trabajar con expresiones regulares en Python.

log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"
# Se define una cadena de registro que contiene información sobre un evento, incluido un número entre corchetes que se desea extraer.

regex = r"\[(\d+)\]"
# Se define una expresión regular para buscar números entre corchetes en una cadena. Explicación:
#   - \[\]: Coincide con los corchetes literales '[' y ']'.
#   - (\d+): Coincide con uno o más dígitos (\d+) y los captura en un grupo (()).

result = re.search(regex, log)
# Se busca la primera ocurrencia de la expresión regular 'regex' en la cadena 'log' utilizando la función re.search() y se almacena el resultado en 'result'.

result = re.search(regex, "A completely different string that also has numbers [34567]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en una cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

result = re.search(regex, "99 elephants in a [cage]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en otra cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

print(result[1])
# Se intenta imprimir el contenido del primer grupo capturado (los dígitos entre corchetes) de la última coincidencia encontrada en 'result'.
# Nota: Este comando de impresión resultará en un error, como se muestra en el video.


In [None]:
import re

# Se importa el módulo re para trabajar con expresiones regulares en Python.

log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"
# Se define una cadena de registro que contiene información sobre un evento, incluido un número entre corchetes que se desea extraer.

regex = r"\[(\d+)\]"
# Se define una expresión regular para buscar números entre corchetes en una cadena. Explicación:
#   - \[\]: Coincide con los corchetes literales '[' y ']'.
#   - (\d+): Coincide con uno o más dígitos (\d+) y los captura en un grupo (()).

result = re.search(regex, log)
# Se busca la primera ocurrencia de la expresión regular 'regex' en la cadena 'log' utilizando la función re.search() y se almacena el resultado en 'result'.

result = re.search(regex, "A completely different string that also has numbers [34567]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en una cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

result = re.search(regex, "99 elephants in a [cage]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en otra cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

def extract_pid(log_line):
    # Esta función toma una línea de registro y devuelve el ID de proceso (PID) si se encuentra dentro de corchetes.
    regex = r"\[(\d+)\]"
    # Se define la expresión regular para buscar el PID dentro de corchetes en la línea de registro.
    
    result = re.search(regex, log_line)
    # Se busca la coincidencia utilizando la expresión regular definida en la línea de registro dada.
    
    if result is None:
        return ""
    # Si no se encuentra ninguna coincidencia, se devuelve una cadena vacía.

    return result[1]
    # Si se encuentra una coincidencia, se devuelve el PID capturado del grupo 1.

print(extract_pid(log))
# Se imprime el PID extraído de la cadena de registro 'log' utilizando la función 'extract_pid'.


In [None]:
import re

# Se importa el módulo re para trabajar con expresiones regulares en Python.

log = "July 31 07:51:48 mycomputer bad_process[12345]: ERROR Performing package upgrade"
# Se define una cadena de registro que contiene información sobre un evento, incluido un número entre corchetes que se desea extraer.

regex = r"\[(\d+)\]"
# Se define una expresión regular para buscar números entre corchetes en una cadena. Explicación:
#   - \[\]: Coincide con los corchetes literales '[' y ']'.
#   - (\d+): Coincide con uno o más dígitos (\d+) y los captura en un grupo (()).

result = re.search(regex, log)
# Se busca la primera ocurrencia de la expresión regular 'regex' en la cadena 'log' utilizando la función re.search() y se almacena el resultado en 'result'.

result = re.search(regex, "A completely different string that also has numbers [34567]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en una cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

result = re.search(regex, "99 elephants in a [cage]")
# Se busca la primera ocurrencia de la expresión regular 'regex' en otra cadena diferente utilizando la función re.search() y se actualiza el valor de 'result'.

def extract_pid(log_line):
    # Esta función toma una línea de registro y devuelve el ID de proceso (PID) si se encuentra dentro de corchetes.
    regex = r"\[(\d+)\]"
    # Se define la expresión regular para buscar el PID dentro de corchetes en la línea de registro.
    
    result = re.search(regex, log_line)
    # Se busca la coincidencia utilizando la expresión regular definida en la línea de registro dada.
    
    if result is None:
        return ""
    # Si no se encuentra ninguna coincidencia, se devuelve una cadena vacía.

    return result[1]
    # Si se encuentra una coincidencia, se devuelve el PID capturado del grupo 1.

print(extract_pid(log))
# Se imprime el PID extraído de la cadena de registro 'log' utilizando la función 'extract_pid'.

print(extract_pid("99 elephants in a [cage]"))
# Se imprime el PID extraído de la cadena "99 elephants in a [cage]" utilizando la función 'extract_pid'.
