# Elasticsearch

**ACLARACIÓN:**

El cuaderno no está preparado para ser ejecutado dentro de Colab. En su lugar, hay que seguir las instrucciones que se detallan en los respectivos apartados para instalar y ejecutar Elasticsearch en un entorno local.

## Implementación de ElasticSearch

Para la instalación de Elasticsearch se ha usdo el contenido del resopositorio [docker-elk](https://github.com/deviantony/docker-elk?tab=readme-ov-file). Cualquier duda sobre la instalación que no aparezca en este documento se puede consultar en el repositorio.

### Instalación del repositorio

Lo primero de todo es clonar el repositorio en el directorio de trabajo:

```bash
git clone https://github.com/deviantony/docker-elk?tab=readme-ov-file
```

Una vez tenemos el direcotorio clonado, nos movemos a la carpeta `docker-elk`. Podemos ver en esta carpeta dos archivos importantes:
- `docker-compose.yml`: Archivo de configuración de docker-compose.
- `.env`: Archivo de configuración del cluster.

### Modificación de credenciales <a id="modificacion-de-credenciales"></a>

Para modificar las credenciales de acceso a la interfaz web, debemos modificar el archivo `.env`. En este archivo podemos encontrar las siguientes líneas:

```bash
## Passwords for stack users
#

# User 'elastic' (built-in)
#
# Superuser role, full access to cluster management and data indices.
# https://www.elastic.co/guide/en/elasticsearch/reference/current/built-in-users.html
ELASTIC_PASSWORD='changeme'

# User 'logstash_internal' (custom)
#
# The user Logstash uses to connect and send data to Elasticsearch.
# https://www.elastic.co/guide/en/logstash/current/ls-security.html
LOGSTASH_INTERNAL_PASSWORD='changeme'

# User 'kibana_system' (built-in)
#
# The user Kibana uses to connect and communicate with Elasticsearch.
# https://www.elastic.co/guide/en/elasticsearch/reference/current/built-in-users.html
KIBANA_SYSTEM_PASSWORD='changeme'
```

De esta forma se pueden modificar los valores de las contraseñas antes de instalar e iniciar el cluster. Sin embargo, los usuarios son los que hay por defecto y no se pueden cambiar.

### Instalación de Elasticsearch

Para iniciar la instlación de Elasticsearch, simplemente ejecutamos el siguiente comando dentro de la carpeta `docker-elk`:

```bash
docker-compose up setup
```

Luego, una vez se haya terminado de instalar, iniciamos el docker-compose de forma normal:

```bash
docker-compose up
```

Para comprobar que todo ha ido bien y está el cluster funcionando, podemos acceder a la dirección `http://localhost:9200` y veremos la información del cluster (hay que meterse con las credenciales: `elastic` y `changeme`, en el caso de no haber cambiaddo la contraseña como se indica enel [apartado anterior](#modificacion-de-credenciales)). Se puede ejeccutar en Bash como:

```bash
# En el caso de Powershell "curl.exe" en vez de solo "curl"
curl -u elastic:changeme http://localhost:9200
```

Debería devolver algo similar a lo siguiente:

```json
{
  "name": "elasticsearch",
  "cluster_name": "docker-cluster",
  "cluster_uuid": "CeqMQi1oRvqLxuKa9Lejlg",
  "version": {
    "number": "8.17.0",
    "build_flavor": "default",
    "build_type": "docker",
    "build_hash": "2b6a7fed44faa321997703718f07ee0420804b41",
    "build_date": "2024-12-11T12:08:05.663969764Z",
    "build_snapshot": false,
    "lucene_version": "9.12.0",
    "minimum_wire_compatibility_version": "7.17.0",
    "minimum_index_compatibility_version": "7.0.0"
  },
  "tagline": "You Know, for Search"
}
```

## Uso de Elasticsearch

### Instalación de librerías

Para poder usar Elasticsearch necesitaremos instalar la librería elastisearch de Python. Para ello, simplemente ejecutamos el siguiente comando:

```bash
pip install elasticsearch
```

Comprobamos que está ejecutándose correctamente:

In [27]:
from elasticsearch import Elasticsearch, helpers
import uuid

# Conexión a Elasticsearch con autenticación
client = Elasticsearch(
    ['http://localhost:9200'],
    basic_auth=('elastic', 'changeme')
)

def obtener_informacion_cluster():
    try:
        # Obtener información sobre el clúster de Elasticsearch
        info_cluster = client.cluster.health()
        print("Información del clúster:")
        for element in info_cluster:
            print("\t-", element, ":", info_cluster[element])
    except Exception as e:
        print("Error al obtener información del clúster:", e)

# Llamar a la función para obtener información del clúster
obtener_informacion_cluster();

Información del clúster:
	- cluster_name : docker-cluster
	- status : green
	- timed_out : False
	- number_of_nodes : 1
	- number_of_data_nodes : 1
	- active_primary_shards : 33
	- active_shards : 33
	- relocating_shards : 0
	- initializing_shards : 0
	- unassigned_shards : 0
	- unassigned_primary_shards : 0
	- delayed_unassigned_shards : 0
	- number_of_pending_tasks : 0
	- number_of_in_flight_fetch : 0
	- task_max_waiting_in_queue_millis : 0
	- active_shards_percent_as_number : 100.0
