# elassandra on docker documentation 


## introduction
### cassandra
Cassandra adalah penyimpanan data yang terdistribusi dan bersifat *high availability.*
Cassandra memiliki *throughput* tinggi dan dapat menulis di *node* manapun di dalam *cluster.*
Cassandra tidak mensupport *full text search*

### elasticsearch
Elasticsearch adalah API pencarian yang tangguh (*lucene index based*).
*Documents* disimpan sebagai *JSON object* dan memfasilitasi *full text search*.
Memetakan setiap *field* dalam *document* kedalam bentuk yang terindeksi saat proses penyimpanan kedalam *documents*.
Elasticsearch hanya mensupport penulisan ke *master node*.
Tidak cocok untuk penyimpanan utama. Sering mengalami *lose writes* ketika melakukan *update* atau bahakan ketika *insert* yang tidak memiliki *conflict*.
Bukan *multi datacenter clustering* (memerlukan tool tambahan seperti *kafka*)

### elassandra
##### cassandra + elasticsearch = elassandra
Elasticsearch ditanam ke cassandra sebagai plugin.
Sehingga bisa mendapatkan kedua fitur dan mengatasi kekurangan dari cassandra dan elasticsearch di dalam cassandra.
Sehingga untuk memanipulasi data dapat dilakukan melalui antarmuka *cqlsh query* (cassandra) atau menggunakan *REST API* (elasticsearch)

- *Full text search* pada cassandra data
- *JSON REST API* untuk mengakses cassandra data
- dapat melakukan pencarian kedalam lebih dari satu *keyspace* dalam satu *query*
- *Real-time aggregation* (tidak memerlukan Spark atau Hadoop untuk melakukan GROUP BY)

![elassandra_architecture](ElassandraArchitecture.jpg)
![concepts_mapping](ConceptsMapping.png)


baca lebih lanjut [disini](https://elassandra.readthedocs.io/en/latest/architecture.html)





## install elassandra

### pull image elassandra ke docker
```bash
docker pull strapdata/elassandra:{VERSION}
```
- versi 6.8.4.0 digunakan pada tutorial ini
- docker selalu memerlukan permission sehingga tambahkan ```
sudo
``` di awal

```bash
docker image ls
```

### membuat container elassandra

```bash 
docker run -p 9200:9200 -p 9042:9042 -e CASSANDRA_START_RPC=true --name {CONTAINER_NAME} -d {IMAGE_NAME:VERSION | ID}
```

- ```-p {port untuk akses ke sistem diluar container}:{exposed port}```
    - exposed port:
    - 7000: Intra-node communication
    - 7001: TLS intra-node communication
    - 7199: JMX
    - 9042: CQL
    - 9142: encrypted CQL
    - 9160: thrift service
    - 9200: ElasticSearch HTTP
    - 9300: ElasticSearch transport
- ```-e CASSANDRA_START_RPC=true``` > secara default rpc pada config bernilai false sehingga ```cqlsh```(interface cassandra) tidak berfungsi sepenuhnya
- ```--name {CONTAINER_NAME}``` > beri nama container jika dikosongkan maka akan diberi nama secara random
- -```d``` > proses pembuatan container berjalan di background

### starting elassandra container
```bash
docker container ls
```
- menampilkan container yang berjalan

```bash
docker container ls -a
```
- menampilkan semua container

```bash
docker start {CONTAINER_NAME}
```
- menjalankan container

```bash
docker exec -it {CONTAINER_NAME} /bin/bash
```
- mengecek apakah container telah berjalan 
- masuk kedalam terminal container

```bash
docker logs {CONTAINER_NAME} 
```
- tampilkan logs dari docker ketika container tidak berjalan

```bash
sysctl -w vm.max_map_count={LOGS}
```
- biasanya terjadi error ketika container memerlukan memori yang lebih sehingga isikan sesuai yang muncul pada ```docker logs``` pada kasus sistem pada tutorial ini butuh 262144
- kemudian start lagi container dan cek apakah sudah berjalan dengan baik

### check elasticsearch di container elassandra
```bash
docker exec -it {CONTAINER_NAME} /bin/bash 
```
- masuk kedalam terminal container

```bash
curl http://localhost:9200
```
- tunggu beberapa detik setelah container dialankan karena elasticsearch masih proses berjalan

```bash
curl -XPUT 'http://localhost:9200/twitter/_doc/1?pretty' -H 'Content-Type: application/json' -d '{
    "user": "Poulpy",
    "post_date": "2017-10-04T13:12:00Z",
    "message": "Elassandra adds dynamic mapping to Cassandra"
}'```
- membuat document twitter dan membuat kolom user, post_date, message dan mengisi value kedalam document tersebut

### check cassandra di container elassandra
```bash
cqlsh -e "SELECT * from twitter.\"_doc\""
```
- melihat data yang telah dibuat melalui elasticsearch di cassandra

```bash
cqlsh
```
- masuk ke interface cassandra

```bash
INSERT INTO twitter."_doc" ("_id", user, post_date, message)
VALUES ( '2', ['Jimmy'], [dateof(now())], ['New data is indexed automatically']);
```
- insert data ke document 
- gunakan ```exit``` untuk keluar dari interface cassandra

```bash
curl "localhost:9200/twitter/_search?q=user:Jimmy&pretty"
```
- dapat dilihat data yang di insert melalui cassandra juga dapat dilihat di elasticsearch







