<!--NAVIGATION-->


<a href="https://colab.research.google.com/github/msantana0612/TFG/blob/main/notebooks/notebookProcesos.ipynb" target="_blank" rel="noopener noreferrer"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>

<h1>Procesos</h1>

<div style="font-size: 17px">

Un **proceso** en un sistema *Linux* es una instancia en ejecución de un programa. Cada vez que se ejecuta un programa, el *kernel* del sistema operativo crea un proceso que gestiona su ejecución, asignándole los recursos necesarios, como *CPU* y memoria.

Dado que en un sistema pueden ejecutarse múltiples procesos simultáneamente, el sistema operativo emplea un **planificador** (*scheduler*) para determinar cuánto tiempo asignar a cada proceso y cómo distribuir los recursos de manera eficiente.

Para gestionar estos procesos, cada uno recibe un identificador único llamado ***PID*** (*Process ID*), que permite al sistema y a los usuarios **referenciar**, **controlar** y **administrar** cada proceso de manera individual.

En *Linux*, un proceso puede ejecutarse en primer plano o en segundo plano. Un proceso en primer plano es aquel que ocupa la terminal hasta que finaliza, impidiendo al usuario ejecutar otros comandos en esa sesión mientras esté activo. Por ejemplo, cuando se ejecuta un comando simple como <code>cat archivo.txt</code>, este se ejecuta en primer plano. En cambio, un proceso en segundo plano se ejecuta sin bloquear la terminal, permitiendo al usuario seguir trabajando.

Los procesos forman una jerarquía, donde cada uno es creado por otro proceso, que es llamado su **padre**. El *PID* identifica al proceso, y el ***PPID*** (*Parent Process ID*) identifica a su proceso padre. Esta relación permite organizar los procesos y rastrear su origen. Un proceso **huérfano** es aquel cuyo proceso padre ha terminado antes que él. En ese caso, el sistema lo asigna automáticamente como nuevo padre al proceso <code>init</code> o <code>systemd</code>.

Un proceso ***zombie*** es un proceso que ya ha finalizado, pero su entrada sigue en la tabla de procesos porque su padre aún no ha recogido su estado. Aunque no consumen recursos como *CPU* o memoria, muchos *zombies* pueden afectar al sistema si no se gestionan correctamente.
</div>

<h2>Estado de los procesos</h2>

<div style="font-size: 17px">

Para gestionar eficientemente los recursos del sistema, *Linux* asigna a cada proceso un estado que refleja su situación actual. Estos estados indican si el proceso está ejecutándose, esperando recursos o si ha finalizado. Esto permite al sistema operativo gestionar de manera eficiente la *CPU*, la memoria y otros recursos, tomando decisiones sobre cómo manejar cada proceso según su estado.

  | Estado | Descripción | Constante en el Kernel |
|--------|------------|----------------------|
| **Ejecutando (*Running*)** | En ejecución o esperando CPU. | `TASK_RUNNING` |
| **Listo (*Ready*)** | Preparado para ejecutarse cuando haya CPU disponible. | `TASK_RUNNING` |
| **Dormido Interrumpible (*Sleeping*)** | Espera un evento y puede ser despertado por señales. | `TASK_INTERRUPTIBLE` |
| **Dormido No Interrumpible (*Waiting* / *Uninterruptible Sleep*)** | Espera una operación de E/S y **no puede** ser interrumpido. | `TASK_UNINTERRUPTIBLE` |
| **Detenido (*Stopped*)** | Pausado por una señal (`SIGSTOP`, `SIGTSTP`). | `TASK_STOPPED` |
| ***Zombie*** | Ha terminado, pero su padre aún no ha leído su estado de salida. | `TASK_ZOMBIE` |
| **Muerto (*Dead* / *Exit Dead*)** | Eliminado del sistema tras `wait()`. | `TASK_DEAD` |
</div>

<div style="text-align: center;">
    <img src="https://raw.githubusercontent.com/msantana0612/TFG/gh-pages/images/estadoProcesos.png" alt="Estado de los procesos" width="822" height="582">
</div>

<h2>Monitorizar procesos</h2>

<div style="font-size: 17px">

La monitorización de procesos es una tarea fundamental para mantener el sistema en buen estado y asegurarse de que todo funcione correctamente. Al monitorizar los procesos, podemos obtener información esencial de los procesos como su *PID*, su estado, los recursos utilizados y, en general, tener un mayor control sobre lo que sucede en el sistema. Existen diferentes órdenes que cumplen esta función:

  - **<code>ps</code>**: Muestra información de los procesos en ejecución en un momento determinado. Tiene muchas opciones que permiten adaptar la información obtenida. Entre las más habituales destacan las siguientes:

    - **<code>aux</code>**: Es una combinación de las opciones <code>-a</code> (muestra todos los procesos de todos los usuarios a excepción de aquellos que no están asociados a una terminal), <code>-u</code> (muestra información como el nombre de usuario, uso de CPU y memoria, etc) y <code>-x</code> (incluye procesos que no están asociados a una terminal)

    - **<code>-ef</code>**: Combina las opciones <code>-e</code> (todos los procesos en ejecución del sistema, similar a <code>-a</code>) y <code>-f</code> (información en forma de árbol, reflejando las relaciones entre procesos)
</div>

In [None]:
%%shell
ps aux

USER         PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root           1  0.0  0.0   1076     8 ?        Ss   12:15   0:00 /sbin/docker-init -- /datalab/run
root           7  0.4  0.4 897488 58160 ?        Rl   12:15   0:03 /tools/node/bin/node /datalab/web
root           9  0.0  0.0   7376  3532 ?        S    12:15   0:00 /bin/bash -e /usr/local/colab/bin
root          11  0.0  0.0   7376  1984 ?        S    12:15   0:00 /bin/bash -e /datalab/run.sh
root          12  0.0  0.0 1236580 12828 ?       Sl   12:15   0:00 /usr/colab/bin/kernel_manager_pro
root          39  0.0  0.0   5808   996 ?        Ss   12:15   0:00 tail -n +0 -F /root/.config/Googl
root          45  0.0  0.0   5808  1016 ?        Ss   12:15   0:00 tail -n +0 -F /root/.config/Googl
root          72  2.0  0.0      0     0 ?        Z    12:15   0:14 [python3] <defunct>
root          73  0.1  0.3  67744 52396 ?        S    12:15   0:00 python3 /usr/local/bin/colab-file
root          94  0.9  1.3 577488 1



In [None]:
%%shell
ps -ef

UID          PID    PPID  C STIME TTY          TIME CMD
root           1       0  0 12:15 ?        00:00:00 /sbin/docker-init -- /datalab/run.sh
root           7       1  0 12:15 ?        00:00:03 /tools/node/bin/node /datalab/web/app.js
root           9       7  0 12:15 ?        00:00:00 /bin/bash -e /usr/local/colab/bin/oom_monitor.sh
root          11       1  0 12:15 ?        00:00:00 /bin/bash -e /datalab/run.sh
root          12      11  0 12:15 ?        00:00:00 /usr/colab/bin/kernel_manager_proxy --listen_por
root          39       0  0 12:15 ?        00:00:00 tail -n +0 -F /root/.config/Google/DriveFS/Logs/
root          45       0  0 12:15 ?        00:00:00 tail -n +0 -F /root/.config/Google/DriveFS/Logs/
root          72       7  2 12:15 ?        00:00:14 [python3] <defunct>
root          73       7  0 12:15 ?        00:00:00 python3 /usr/local/bin/colab-fileshim.py
root          94       7  0 12:15 ?        00:00:06 /usr/bin/python3 /usr/local/bin/jupyter-notebook
root       



<div style="font-size: 17px">

  - **<code>top</code>**: Es un comando interactivo que muestra la información de los procesos en tiempo real. Esta información se actualiza cada pocos segundos (en general, 3 segundos). Permite gestionar procesos, por ejemplo, matar procesos desde la propia interfaz pulsando la tecla "k". Para salir de la interfaz de <code>top</code>, hay que pulsar la tecla "q". Existe una versión actualizada de este comando (<code>htop</code>) con una interfaz más atractiva y mayor interactividad. También cuenta con diferentes opciones:

    - **<code>-n</code>**: Permite indicar un número de actualizaciones concreto hasta pararse. Si no se indica, se actualizará hasta que se indique la salida del proceso.
    - **<code>-p PID</code>**: Con esta opción y un *PID*, se muestra solo la información de un proceso concreto.
    - **<code>-b</code>**: Indica al proceso que se debe ejecutar en segundo plano (*background*). Esto permite, por ejemplo, redirigir la salida a un archivo.

**Ejemplo**: Se muestra la información de los procesos del sistema en tiempo real usando <code>top</code> dos veces:
</div>

In [None]:
%%shell
top -n 2

[?1h=[H[2J[mtop - 12:40:48 up 25 min,  0 users,  load average: 0.30, 0.32, 0.33[m[m[m[m[K
Tasks:[m[m[1m  17 [m[mtotal,[m[m[1m   1 [m[mrunning,[m[m[1m  15 [m[msleeping,[m[m[1m   0 [m[mstopped,[m[m[1m   1 [m[mzombie[m[m[m[m[K
%Cpu(s):[m[m[1m  6.2 [m[mus,[m[m[1m  3.1 [m[msy,[m[m[1m  0.0 [m[mni,[m[m[1m 87.5 [m[mid,[m[m[1m  0.0 [m[mwa,[m[m[1m  0.0 [m[mhi,[m[m[1m  0.0 [m[msi,[m[m[1m  3.1 [m[mst[m[m[m[m[K
MiB Mem :[m[m[1m  12979.0 [m[mtotal,[m[m[1m   9379.3 [m[mfree,[m[m[1m    916.1 [m[mused,[m[m[1m   2683.6 [m[mbuff/cache[m[m[m[m[K
MiB Swap:[m[m[1m      0.0 [m[mtotal,[m[m[1m      0.0 [m[mfree,[m[m[1m      0.0 [m[mused.[m[m[1m  11740.2 [m[mavail Mem [m[m[m[m[K
[K
[7m    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND                      [m[m[K
[m     12 root      20   0 1236580  12884   8156 S   6.2   0.1   0:00.68 kernel_mana



<div style="font-size: 17px">

- <code>strace</code>: Permite rastrear las llamadas al sistema y señales realizadas por un proceso. Es una herramienta muy útil para depurar, analizar el comportamiento de programas y entender cómo interactúan con el sistema operativo. Entre sus opciones más comunes se encuentran:

    - <code>-p</code>: Permite adjuntar strace a un proceso ya en ejecución especificando su *PID*. Muy útil para observar el comportamiento de un proceso en tiempo real sin tener que reiniciarlo.

    - <code>-e trace=</code>: Restringe la salida a un tipo específico de llamadas al sistema, como file, process, network, etc. Por ejemplo, <code>-e trace=network</code> muestra solo las llamadas relacionadas con la red.

    - <code>-o</code>: Redirige la salida de strace a un archivo en lugar de mostrarla por pantalla. Ideal para analizar con calma o compartir con otros para depuración.

    - <code>-c</code>: Muestra un resumen de las llamadas al sistema: cuántas veces se invocaron, cuánto tiempo consumieron, y qué porcentaje del total representan.

**Ejemplo**: Se muestra la cantidad de veces que se han invocado a diferentes llamadas al sistema al usar el comando <code>ls</code>:

</div>

In [3]:
%%shell
#apt-get install strace #Necesario instalar el comando primero -> Se verá más adelante
strace -c ls

sample_data
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
 26.26    0.000307          17        18           mmap
 22.07    0.000258         258         1           execve
 20.96    0.000245           9        27        20 openat
 16.42    0.000192           6        28        20 newfstatat
  3.85    0.000045           6         7           mprotect
  3.25    0.000038           4         9           close
  2.82    0.000033           8         4           pread64
  1.28    0.000015           3         5           read
  1.03    0.000012           6         2         1 arch_prctl
  0.77    0.000009           4         2         2 access
  0.43    0.000005           5         1           set_tid_address
  0.34    0.000004           4         1           set_robust_list
  0.34    0.000004           4         1           rseq
  0.17    0.000002           0         3           brk
  0.00    0.000000           0



<h2>Control de ejecución de procesos</h2>

<div style="font-size: 17px">

Los comandos de control de ejecución de procesos permiten gestionar cómo y cuándo se ejecutan los procesos en el sistema. Estos comandos son útiles para cambiar el comportamiento de los procesos, asignarles prioridades, ejecutarlos en segundo plano o introducir pausas entre las operaciones. Son muy importantes en la automatización de tareas y en la gestión eficiente de los recursos del sistema.

A continuación se presentan algunos de los comandos más comunes utilizados para controlar la ejecución de procesos en Linux:

- <code>sleep</code>: Se utiliza para suspender temporalmente la ejecución de un proceso durante un período de tiempo determinado. Es muy útil cuando se necesita espaciar acciones o cuando se quiere retrasar la ejecución de algún comando.

**Ejemplo**: Se imprime el primer mensaje inmediatamente, pero el segundo espera a que pasen 2 segundos:
</div>

In [4]:
%%shell
echo "Primer comentario al instante."
sleep 2
echo "Segundo comentario después de 2 segundos."

Primer comentario al instante.
Segundo comentario después de 2 segundos.




<div style="font-size: 17px">

- <code>fg</code>: Reanuda un trabajo detenido o en segundo plano y lo coloca en primer plano. Es muy útil cuando se necesita volver a interactuar con un proceso suspendido o que estaba corriendo en segundo plano.

- <code>bg</code>: Reanuda un trabajo detenido, pero lo deja ejecutándose en segundo plano. Permite seguir usando la terminal mientras el proceso continúa ejecutándose sin bloquear la entrada.

Para <code>fg</code> y <code>bg</code>, se puede indicar qué proceso se desea reanudar utilizando el identificador del trabajo en formato <code>%n</code> (por ejemplo, <code>%1</code>), o simplemente omitirlo para actuar sobre el trabajo más reciente. Para ver los identificadores de trabajo, es útil la orden <code>jobs</code>:

**Ejemplo**: Se muestra el identificador de trabajo de los dos siguientes procesos:
</div>

In [5]:
%%shell
sleep 6 &
sleep 4 &
jobs

[1]-  Running                 sleep 6 &
[2]+  Running                 sleep 4 &




<div style="font-size: 17px">

Pese a no ser un comando, es útil conocer el operador <code>&</code>. Este operador se añade a los comandos para indicar que han de ser ejecutados en segundo plano
</div>

<div style="font-size: 17px">

- <code>nohup</code>: Ejecuta un comando de forma que no se detenga incluso si se cierra la sesión o se cierra la terminal (<code>SIGHUP</code>). Es especialmente útil para ejecutar procesos largos o persistentes en segundo plano.

**Ejemplo**: Simular cerrar una terminal (mandando la señal <code>SIGHUP</code>) mientras se ejecuta un comando con <code>nohup</code>:
</div>

In [65]:
%%shell
#Se ejecuta un bucle que muestra un mensaje cada segundo CON nohup
nohup bash -c 'for i in {1..10}; do echo "Paso $i"; sleep 1; done' &
sleep 2
PID=$!
sleep 3
kill -SIGHUP $PID #Se manda la señal SIGHUP pasados 5 segundos (se ignora por nohup)
sleep 2
cat nohup.out #Se muestra pasados 7 segundos (7 mensajes esperados)
rm nohup.out

nohup: appending output to 'nohup.out'
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Paso 7




<div style="font-size: 17px">

**Ejemplo**: Simular cerrar una terminal (mandando la señal <code>SIGHUP</code>) mientras se ejecuta un comando sin <code>nohup</code>:
</div>

In [64]:
%%shell
#Se ejecuta un bucle que muestra un mensaje cada segundo SIN nohup
bash -c 'for i in {1..10}; do echo "Paso $i"; sleep 1; done' > salida.txt &
sleep 2
PID=$!
sleep 3
kill -SIGHUP $PID #Se manda la señal SIGHUP pasados 5 segundos
sleep 2
cat salida.txt #Se muestra pasados 7 segundos (5 mensajes esperados)
rm salida.txt

/bin/bash: line 7:  5955 Hangup                  bash -c 'for i in {1..10}; do echo "Paso $i"; sleep 1; done' > salida.txt
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5




<div style="font-size: 17px">

**Ejemplo**: Para mostrar un proceso en estado *zombie*:
  - Ejecutamos un <code>sleep</code> (duerme el proceso durante unos segundos) junto con el operador <code>&</code> para que se ejecute en segundo plano
  - Obtenemos su *PID* mediante la variable <code>$!</code> (almacena el *PID* del último programa que se ejecutó en segundo plano) y lo guardamos en una variable shell
  - Mostramos el *PID*, el estado y la orden del proceso anterior mediante la orden <code>ps</code> (muestra información sore los procesos en eejcución) con el modificador <code>-p</code> junto con la variable SHELL, y el modificador <code>-o</code> para indicar qué campos mostrar
  - Esperamos unos segundos
  - Con la orden <code>kill</code> (envía una señal a un proceso) finalizamos el proceso inicial
  - Volvemos a mostrar los datos del proceso
</div>

In [None]:
%%shell
sleep 100 &
PID=$!
echo "Process ID (PID): $PID"
ps -p $PID -o pid,stat,command
sleep 5
kill $PID
echo "Process $PID killed"
ps -p $PID -o pid,stat,command

Process ID (PID): 8316
    PID STAT COMMAND
   8316 S    sleep 100
Process 8316 killed
    PID STAT COMMAND
   8316 Z    [sleep] <defunct>




<div style="font-size: 17px">

En el campo *STAT*, se muestra como mientras se está ejecutando está en el estado "S" (*Sleep*), pero al matar el proceso queda en el estado "Z" (*Zombie*).
</div>

<h3>Ejercicio</h3>

<div style="font-size: 17px">

Usa un comando que muestre por pantalla el uso de CPU de todos los procesos del sistema:
</div>

In [None]:
%%shell
#Borra este comentario e introduce aquí el/los comando/s necesario/s

<div style="font-size: 17px">

El comando <code>yes "Hola!"</code> muestra infinitamente el mensaje "Hola!", pero con <code>> /dev/null</code> (se explicará más adelante) suprimimos su salida y con <code>kill -9 $PID</code> lo terminamos (se explicará más adelante). Obtén el *PID* del proceso y muestra su información durante 4 veces:
</div>

In [None]:
%%shell
yes "Hola!"> /dev/null &
#Borra este comentario e introduce aquí el/los comando/s necesario/s
kill -9 $PID