# Explicación General del Dataset de Registros de Apache

Este conjunto de datos parece ser un archivo de registro (_log file_) de un servidor web Apache. Los registros contienen información sobre eventos que ocurren en el servidor, organizados por líneas que corresponden a diferentes tipos de eventos.

## Componentes del Log

### 1. **Marca de Tiempo**
Cada línea comienza con una fecha y hora exactas del evento, por ejemplo, `[Thu Jun 09 06:07:04 2005]`. Esto indica cuándo ocurrió un evento en el servidor.

### 2. **Niveles de Gravedad**
- `[notice]`: Eventos informativos que no necesariamente indican problemas, pero pueden ser útiles para monitoreo.
- `[error]`: Indica que ocurrió un problema en el servidor.

### 3. **Mensajes LDAP y SSL**
Algunas líneas indican que el servidor fue configurado con soporte para LDAP pero no tiene soporte SSL habilitado:


### 4. **Errores en la Creación de "Beans" o Instancias**
Errores como:

- ##### `[env.createBean2(): Factory error creating channel.jni]`

Indican que el servidor no pudo crear correctamente algunas instancias de ciertos módulos o componentes, probablemente relacionados con la integración de Java (JNI) y procesos virtuales (VM).

### 5. **Errores de Configuración**
Se mencionan problemas como:
- ##### `[Can't create channel.jni]`
- ##### `[Can't create vm]`

Esto apunta a problemas al inicializar configuraciones relacionadas con canales y máquinas virtuales.

### 6. **Errores de Índice de Directorio Prohibido**
Muchas líneas como:

- ##### `[Directory index forbidden by rule: /var/www/html/]`

Indican que los usuarios intentaron acceder a directorios en el servidor que no tienen un índice de directorio disponible. Esto ocurre cuando no hay un archivo predeterminado (como `index.html`), y el servidor está configurado para no mostrar el contenido del directorio.

### 7. **Errores de Archivo Inexistente**
Líneas como:

- ##### `[File does not exist: /var/www/html/sumthin]`

Indican que los usuarios solicitaron archivos que no existen en el servidor.

### 8. **Solicitudes Maliciosas**
Varias entradas como:

- ##### `[Invalid method in request get /scripts/.../winnt/system32/cmd.exe?/c+dir]`

Sugerieren intentos de explotación de vulnerabilidades conocidas en el servidor. Estas solicitudes buscan archivos del sistema o intentan ejecutar comandos peligrosos, lo que podría ser un intento de hackeo.

### 9. **Mod_JK y Mod_Python**
Se mencionan módulos como `mod_jk` y `mod_python`, usados para integrar Apache con aplicaciones Java (Tomcat) y Python, respectivamente. También se menciona el archivo `workers2.properties`, que es parte de la configuración para la integración de Apache con aplicaciones Java.

## Resumen
Este archivo de registro contiene una combinación de:
- Información sobre el estado del servidor (inicio de servicios, creación de componentes).
- Varios errores relacionados con configuraciones incorrectas, solicitudes de acceso prohibidas.
- Potenciales intentos de explotación del sistema.


# Explicación del Log de Sistema Linux

Este archivo de log registra los eventos que ocurren durante el arranque y la operación inicial del sistema. Estos eventos provienen de diversos componentes del sistema, como el núcleo (kernel), servicios del sistema y hardware.

## Componentes Principales

### 1. **Syslog y klogd**
- **syslogd**: Este es el demonio de registro de sistema que recopila los mensajes generados por diferentes procesos.
- **klogd**: Se encarga de registrar mensajes del kernel.

### 2. **Información del Kernel**
El kernel del sistema se inicia y proporciona detalles importantes:
- Versión de Linux: 2.6.5-1.358
- Fecha de compilación: Sat May 8 09:04:50 EDT 2004
- Información sobre la memoria física (RAM) disponible y reservada:

### 3. **Configuración de IRQ y Hardware**
- **irqbalance**: Un demonio que balancea las interrupciones de hardware en el sistema
- **Configuración PCI y manejo de IRQ**: El log muestra cómo el kernel detecta y configura el hardware PCI y las interrupciones del sistema.

### 4. **CPU y Cache**
El sistema detecta la CPU:
- Procesador: 731.214 MHz Intel Pentium III (Coppermine)
- Cache L1 y L2:

### 5. **SELinux (Security-Enhanced Linux)**
El sistema SELinux se inicializa en modo permisivo:

### 6. **Servicios y Demonios**
El sistema inicia varios servicios esenciales:
- **rpc.statd**: Servicio RPC relacionado con NFS (Network File System).
-  **nfslock**: Servicio de bloqueo de archivos NFS.
- **portmap**: Servicio que asigna puertos para RPC.

### 7. **Hardware de Disco**
El sistema detecta los dispositivos de almacenamiento conectados:
- Disco ATA: `IBM-DTLA-307015` detectado y configurado con **UDMA(66)**
- Unidad de CD-ROM: **SAMSUNG CD-ROM SN-124** detectada, pero con soporte UDMA deshabilitado (en la lista negra)


### 8. **Sistema de Archivos**
- El sistema de archivos se monta y las cuotas de disco se habilitan

### 9. **Automontaje y Smartmontools**
- El sistema configura el automontaje de los sistemas de archivos con `autofs` y monitorea los dispositivos con `smartd` (SMART monitoring):

## Resumen
Este log captura el proceso de arranque del sistema, desde la inicialización del kernel hasta la activación de servicios clave, configuraciones de hardware y control de seguridad. La información detallada sobre la CPU, memoria, disco y el sistema de archivos refleja un sistema Linux basado en un núcleo 2.6 con soporte para módulos de seguridad y hardware variado.

# Funcionamiento de `cut -d' ' -f 1-5 linux.log`
El comando `cut -d' ' -f 1-5` se utiliza para extraer campos de un archivo o de la entrada estándar, donde los campos están delimitados por un carácter específico.
- `-d' '`: Especifica el delimitador de campos. En este caso, el delimitador es un espacio en blanco **(' ')**.
- `-f 1-5`: Indica que se quieren extraer los campos **1 al 5** de cada línea.

### Linux.log

Numero de lineas  
- wc -l ./Linux.log  
**25567**

Numero de palabras  
- wc -w < Linux.log  
**308039**

Numero de caracteres  
- wc -c ./Linux.log  
**2375013**

Numero de Eventos por mes  
- awk '{print $1}' Linux.log | sort | uniq -c  
   **1208 Aug  
   4750 Dec  
   1222 Feb  
   2439 Jan  
   1659 Jul  
   1605 Jun  
   9315 Nov  
   1540 Oct  
   1829 Sep**


De los eventos con el string "authentication failure" obtener el listado de usuarios, y cuantos eventos tienen  
- grep "authentication failure" ./Linux.log | grep -oP 'user=\K\S+' | sort | uniq -c  
     **10 adm  
     26 amanda  
     29 fax  
     21 ftp  
     23 guest  
      1 info  
     96 nobody  
      5 postfix  
   2258 root  
    412 test  
     16 webmaster**

Lista de ips que establecieron conexion via FTP y cuantas conexiones realizaron
- grep "FTP" ./Linux.log | grep -oP '\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}' | sort | uniq -c  
      **8 81.240.142.171  
      2 84.102.20.2  
      1 84.102.20.91**

# Apache.log

Numero de lineas  
- wc -l ./Apache.log  
**56481 ./Apache.log**

Numero de Eventos por mes  
- awk '{print $2}' Apache.log | grep -v "script" | sort | uniq -c | awk '{sum[$2]+=$1} END {for (month in sum) print month, sum[month]}' | sort -k2 -nr  
**Nov 15862  
Jan 10905  
Feb 8790  
Dec 6086  
not 4478  
Jul 3335  
Jun 2580  
Sep 1839  
Aug 1448  
Oct 1159**

Numero de eventos por categoria: notice, error, warn  
- grep -oE '\[(notice|error|warn)\]' Apache.log | sort | uniq -c   
  **38081 [error]  
  13755 [notice]  
    168 [warn]**