<!--NAVIGATION-->


<a href="https://colab.research.google.com/github/msantana0612/TFG/blob/main/notebooks/notebookFiltros.ipynb" target="_blank" rel="noopener noreferrer"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>

<h1>Uso de filtros</h1>

<div style="font-size: 17px">

Los **filtros** son comandos que procesan datos: reciben información desde la entrada estándar (normalmente el teclado o la salida de otro comando), aplican alguna transformación o análisis, y envían el resultado a la salida estándar (normalmente la pantalla o la entrada de otro comando).  

Son herramientas que realizan funcionalidades sencillas y específicas, diseñadas por lo tanto para hacer bien una sola tarea, pero su verdadero potencial consiste en que se pueden combinar usando redirecciones (<code>></code>, <code><</code>) y tuberías (<code>|</code>), construyendo flujos de procesamiento complejos a partir de operaciones simples.  Los filtros más utilizados son:

  - **<code>cat</code>**: Muestra por la salida estándar el contenido de uno o varios archivos.  Si no se especifica ningún archivo, lee desde la entrada estándar, lo que permite usarlo de forma interactiva o entre tuberías. Se pueden usar las siguientes opciones:
    - <code>-n</code>: Numera las líneas.
    - <code>-b</code>: Numera las líneas, **sin contar las líneas vacías**.

**Ejemplo**: Muestra las líneas del archivo "cat.txt" numeradas, ignorando las líneas vacías:
</div>

In [1]:
%%shell
echo -e "Prueba para comando cat\n\nUltima línea" > cat.txt
cat -b cat.txt
rm cat.txt

     1	Prueba para comando cat

     2	Ultima línea




<div style="font-size: 17px">

  - **<code>tee</code>**: Transcribe su entrada estándar tanto a la salida estándar como a uno o varios archivos. Por defecto, sobrescribe el archivo de destino. Si se usa la opción <code>-a</code>, añade la información al final del archivo en lugar de sobrescribirlo.

**Ejemplo**: Muestra el usuario actual y lo añade al archivo "tee.txt" sin sobreescribirlo, y se muestra su contenido:
</div>

In [2]:
%%shell
echo "Prueba para comando tee:" > tee.txt
whoami | tee -a tee.txt
cat tee.txt
rm tee.txt

root
Prueba para comando tee:
root




<div style="font-size: 17px">

- **<code>wc</code>**: Cuenta líneas, palabras y caracteres de uno o varios archivos, mostrando los resultados por pantalla. Se pueden usar opciones para mostrar sólo un tipo de conteo:
  - `-l`: cuenta solo líneas.
  - `-w`: cuenta solo palabras.
  - `-c`: cuenta solo caracteres.

**Ejemplo**: Muestra la cantidad de líneas, palabras y caracteres del archivo "NGC-DL-CONTAINER-LICENSE":
</div>

In [3]:
%%shell
wc /NGC-DL-CONTAINER-LICENSE

  285  2678 17294 /NGC-DL-CONTAINER-LICENSE




<div style="font-size: 17px">

- **<code>sort</code>**: Ordena las líneas de texto de un archivo. Por defecto, realiza una ordenación alfabética ascendente. Se puede modificar su comportamiento con las siguientes opciones:
  - <code>-n</code>: Ordena numéricamente.
  - <code>-r</code>: invierte el orden (orden descendente).
  - <code>-o archivo</code>: guarda el resultado en un archivo.

**Ejemplo**: Ordena el archivo "passwd", guarda el resultado en el archivo "ordenado.txt" y se muestra:
</div>

In [4]:
%%shell
sort /etc/passwd -o ordenado.txt
cat ordenado.txt

_apt:x:100:65534::/nonexistent:/usr/sbin/nologin
backup:x:34:34:backup:/var/backups:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
games:x:5:60:games:/usr/games:/usr/sbin/nologin
gnats:x:41:41:Gnats Bug-Reporting System (admin):/var/lib/gnats:/usr/sbin/nologin
irc:x:39:39:ircd:/run/ircd:/usr/sbin/nologin
list:x:38:38:Mailing List Manager:/var/list:/usr/sbin/nologin
lp:x:7:7:lp:/var/spool/lpd:/usr/sbin/nologin
mail:x:8:8:mail:/var/mail:/usr/sbin/nologin
man:x:6:12:man:/var/cache/man:/usr/sbin/nologin
messagebus:x:103:104::/nonexistent:/usr/sbin/nologin
news:x:9:9:news:/var/spool/news:/usr/sbin/nologin
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
proxy:x:13:13:proxy:/bin:/usr/sbin/nologin
root:x:0:0:root:/root:/bin/bash
sync:x:4:65534:sync:/bin:/bin/sync
systemd-network:x:101:102:systemd Network Management,,,:/run/systemd:/usr/sbin/nologin
systemd-resolve:x:102:103:systemd Resolver,,,:/run/systemd:/usr/sbin/nologin
sys



<div style="font-size: 17px">

  - **<code>cut</code>**: Extrae una cantidad variable de caracteres de cada línea de un archivo. Se puede indicar de dos formas:
    - **Por delimitador y campos**:  
      Usar la opción `-f` para seleccionar campos y `-d` para indicar el carácter delimitador (por ejemplo, espacios, comas, etc.).  
      La opción `-s` evita mostrar líneas que no contengan el delimitador.

    - **Por posición de caracteres**:  
      Usa la opción `-c` para indicar un rango o conjunto de posiciones de caracteres a extraer.

**Ejemplo**: Tomando como separadores los espacios, coge la segunda y tercera columna.

</div>

In [5]:
%%shell
echo -e "Esta es una prueba\ncon dos lineas diferentes" | cut -d ' ' -f 2,3

es una
dos lineas




<div style="font-size: 17px">

**Ejemplo**: Extrae los caracteres en las posiciones 1 a 5, luego el 7, y del 8 al 10 de cada línea
</div>

In [6]:
%%shell
echo -e "Esta es una prueba\ncon dos lineas diferentes" | cut -c 1-5,7,8-10

Esta s un
con ds li




<div style="font-size: 17px">

- **<code>uniq</code>**: Elimina líneas duplicadas consecutivas en un archivo o entrada de texto. Se usa generalmente junto con `sort`, ya que `uniq` solo elimina duplicados si están **uno detrás de otro**. Algunas de sus principales opciones son las siguientes:

    - `-c`: muestra el número de repeticiones de cada línea.
    - `-d`: muestra solo las líneas que están duplicadas.
    - `-u`: muestra solo las líneas únicas (no repetidas).

**Ejemplo**: Ordena las líneas y luego elimina los duplicados consecutivos con <code>uniq</code>:
</div>

In [7]:
%%shell
echo -e "Tarea1 Pendiente\nTarea2 En Progreso\nTarea1 Pendiente\nTarea3 Completada\nTarea2 En Progreso" | sort | uniq

Tarea1 Pendiente
Tarea2 En Progreso
Tarea3 Completada




<div style="font-size: 17px">

  - **<code>tr</code>**: Reemplaza los caracteres de la entrada estándar indicados en el primer conjunto por los caracteres indicados en el segundo conjunto, e imprime el resultado por la salida estándar: <br>
    - <code>tr [opciones] CONJUNTO1 CONJUNTO2</code>
  
    Algunas de las principales opciones son las siguientes:  

    - <code>-d</code>: Elimina los caracteres que se encuentren en el primer conjunto (<code>CONJUNTO1</code>). No es necesario especificar un segundo conjunto.

    - <code>-s</code>: Comprime las repeticiones consecutivas de un carácter, reemplazándolas por una sola instancia de ese carácter.

**Ejemplo**: Convierte todas las letras minúsculas (a-z) a mayúsculas (A-Z), y luego elimina todas las "E":
</div>

In [8]:
%%shell
echo "Prueba para el comando tr" | tr 'a-z' 'A-Z' > tr.txt
cat tr.txt | tr -d "E"
rm tr.txt

PRUBA PARA L COMANDO TR




<div style="font-size: 17px">

  - **<code>grep</code>**: Busca líneas que coincidan con un patrón dentro de un archivo o la entrada estándar. Entre otros, se le pueden introducir los siguientes modificadores:
    - <code>-i</code>: Ignora la diferencia entre mayúsculas y minúsculas
    - <code>-n</code>: Muestra el número de línea junto con la línea con el patrón
    - <code>-v</code>: Muestra las líneas que **NO** coinciden con el patrón
    - <code>-c</code>: Cuenta el número de líneas que coinciden con el patrón y muestra el número
    - <code>-e</code>: Permite especificar varios patrones a la vez
    - <code>-f</code>: Indica en qué archivo se encuentran los patrones a buscar
</div>    

<div style="font-size: 17px">

**Ejemplo**: Se crea un archivo con el patrón a buscar y con la opción -f se indica que el patrón se encuentra en ese archivo:
</div>

In [9]:
%%shell
echo "palabra" > busqueda.txt
echo -e "Busco las lineas \n que contengan la palabra \n y solo muestro las que NO la tengan" | grep -vf busqueda.txt

Busco las lineas 
 y solo muestro las que NO la tengan




<h3>Ejercicio</h3>

<div style="font-size: 17px">
Dado el archivo "ejercicio.txt", muestra por pantalla el número de líneas en las que sus dos primeros caracteres sean "la" o "La" usando varios filtros:
</div>

In [None]:
%%shell
echo -e "La terminal de Linux \nes una herramienta muy util para \nla programacion." > ejercicio.txt
#Borra este comentario e introduce aquí el/los comando/s necesario/s

<div style="font-size: 17px">
Dado el archivo "empleados.txt", que muestra los datos de los empleados de una empresa, muestra el nombre y el departamento de los empleados cuyo departamento es IT usando filtros:
</div>

In [None]:
%%shell
echo "ID,Nombre,Departamento,Salario" >> empleados.txt
echo "1,Juan Pérez,Administración,50000" >> empleados.txt
echo "2,Ana López,Recursos Humanos,60000" >> empleados.txt
echo "3,Fernando Fernandez,IT,70000" >> empleados.txt
echo "4,Paula Garcia,Administración,55000" >> empleados.txt
echo "5,Rodrigo Rodriguez,IT,72000" >> empleados.txt

#Borra este comentario e introduce aquí el/los comando/s necesario/s

rm empleados.txt