# Лекция 2. Организация хранилищ "ключ-значение" на примере Redis

- Общая справка по Redis
- Установка, конфигурирование Redis
- Основные команды и типы данных
- Настройка взаимодействия с Redis через Python

## Общая справка по Redis

В данной лекции мы рассмотрим установку, настройку и использование хранилища ключ-значение **Redis**.

**Redis** - Remote Dictionary Server – это быстрое хранилище данных типа «ключ‑значение», которое хранит значения непосредственно в оперативной памяти и периодически сохраняет его на диск. Данное хранилище часто используется для организации быстрого доступа к данным и по сути относится к классу AP систем. Весь программный код данного хранилища написан на C и является открытым.

Официальный сайт всего проекта: 

https://redis.io/.

https://github.com/redis/redis

<img src="logo.png">

Проект был первоначально разработан  Сальватором Санфилиппо.

<img src="filipo.jpeg">

«Когда я начал проект Redis более десяти лет назад, это был один из самых захватывающих моментов моей карьеры, — пишет Сальваторе. — Мой соучредитель и я успешно запустили два основных сервиса web 2.0 в итальянской сети. Чтобы сделать их масштабируемыми, нам пришлось изобрести много новых концепций, которые в большинстве случаев уже были известны в этой области, но мы не знали, да и не хотели проверять. Проблема? Давайте найдем решение. Мы хотели решать проблемы, но ещё больше — получать удовольствие. Это была игровая среда, в которой родился Redis»


Redis обеспечивает время отклика на уровне долей миллисекунды и позволяет приложениям, работающим в режиме реального времени, выполнять миллионы запросов в секунду. Такие приложения востребованы в сферах игр, рекламных технологий, финансовых сервисов, здравоохранения. 

Redis предоставляет следующие преимущества:

- Производительность: поскольку все данные Redis хранятся в памяти - это обеспечивает низкую задержку и высокую пропускную способность доступа к данным. В отличие от традиционных баз данных, хранилища данных в памяти не требуют перемещения на диск, что сокращает задержку до микросекунд. Благодаря этому хранилища данных в памяти могут многократно увеличивать количество выполняемых операций и сокращать время отклика. В результате обеспечивается чрезвычайно высокая производительность. Операции чтения и записи в среднем занимают менее миллисекунды, скорость работы достигает миллионов операций в секунду.

- Гибкие структуры данных - в отличие от других хранилищ на основе пар «ключ – значение», которые поддерживают ограниченный набор структур данных, Redis поддерживает огромное разнообразие структур данных, позволяющее удовлетворить потребности разнообразных приложений. Типы данных Redis включают:
 1. строки – текстовые или двоичные данные размером до 512 МБ;
 2. списки – коллекции строк, упорядоченные в порядке добавления;
 3. множества – неупорядоченные коллекции строк с возможностью пересечения, объединения и сравнения с другими типами множеств;
 4. сортированные множества – множества, упорядоченные по значению;
 5. хэш‑таблицы – структуры данных для хранения списков полей и значений;
 6. битовые массивы – тип данных, который дает возможность выполнять операции на уровне битов;
 7. структуры HyperLogLog – вероятностные структуры данных, служащие для оценки количества уникальных элементов в наборе данных;
 8. потоки – очереди сообщений со структурой журналов данных;
 9. пространственные данные – записи карт на основе долготы/широты, «поблизости».

- Репликация и постоянное хранение:  в redis применяется архитектура узлов «ведущий‑подчиненный» и поддерживается асинхронная репликация, при которой данные могут копироваться на несколько подчиненных серверов. Это обеспечивает как улучшенные характеристики чтения (так как запросы могут быть распределены между серверами), так и ускоренное восстановление в случае сбоя основного сервера. Для обеспечения постоянного хранения Redis поддерживает снимки состояния на момент времени (копирование наборов данных Redis на диск).


## Установка, конфигурирование

Для установки Redis в системах GNU/Linux следует скачать архив с официального репозитория https://download.redis.io/releases/redis-6.2.6.tar.gz



Далее его нужно разархивировать в каталог /usr/local/lib/. Затем, зайдя в каталог redis, нужно выполнить две команды:
    
> make

> make install


В результате будет выполнена компиляция всех модулей на языке C, создание всех требуемых исполняемых файлов. Подробный алгоритм установки можно получить из файла Read.me каталога Redis.

После успешной установки становятся доступны две команды: redis-server, которая запускает сервер, а также redis-cli, которая является клиентом взаимодействия c сервером.

В принципе можно выполнить все эти команды и вне системного каталога /usr/local/lib, но тогда последнюю команду make install выполнять не нужно, и все исполняемые файлы нужно искать в каталоге src каталога redis.

После установки в принципе Redis готов к использованию, нужно лишь запустить сервер:

>redis-server

Однако можно провести и более тонкое конфигурирование. Пример конфигурационного файла представлен в redis.conf, который находится в корне каталога redis. Чтобы запустить сервер с определенными настройками не по умолчанию, нужно выполнить команду:

> redis-server (путь к файлу конфигурации/имя файла конфигурации)

Например:

>redis-server /etc/redis/redis.conf

Рассмотрим некоторые элементы конфигурирования:




    

**bind** - По умолчанию, если директива конфигурации «bind» не указана, Redis прослушивает все сетевые интерфейсы на хост-компьютере. Можно прослушивать только один или несколько выбранных интерфейсов, используя директиву конфигурации «bind», за которой следует один или несколько IP-адресов. Например,
> bind 127.0.0.1

**port** чтобы сервер слушал определенный порт, по умолчанию используется порт 6379. Например,
> port 6379



**save <seconds> <changes>** - позволяет настроить сохранение данных из памяти на диск, если прошло заданное количество секунд или заданное количество записей.

Например,
> save 60 1


**daemonize** - для того, чтобы запустить redis в режиме демона, нужно у данного параметра указать yes.
По умолчанию redis не запускается в режиме демона. Например, 
> daemonize yes


**dbfilename** - позволяет настроить имя файла, в который сохраняются данные на диск. Например, 

> dbfilename dump.rdb

**dir** указывает местоположения сохраненных данных на диске. Например,
> dir ./


**rdbcompression** - задает режим компрессии строк при сохранении, по умолчанию этот режим включен, поскольку почти всегда дает выигрыш.
> rdbcompression yes


## Основные команды и типы данных

Чтобы запустить сервер redis на определенном порту нужно использовать:
>redis-server --port 6379

Чтобы остановить сервер на этом порту, можно использовать:
>redis-cli -p 6379 shutdown

Redis хранит в себе пары ключ-значение. Ключом должен быть строковый литерал, но в качестве значения можно использовать один из шести доступных типов.

Ключ — всегда строка. Тем не менее есть несколько важных моментов и рекомендаций, которые нужно знать при работе с ключами:

Не следует использовать очень длинные ключи. Чем ключ длиннее, тем дольше производится поиск по нему.  В имени ключа целесообразно использовать читаемые имена, чтобы можно было понять, какую сущность хранит этот ключ.

Можно разделять сущности в названии двоеточиями, а названия из нескольких слов – дефисами или точками. 

Пример: users:1000:best-friends.

На ключ есть ограничение по размеру: 512 Mb.


***Строки***

В качестве строк может использоваться все, что угодно -  числа, JSON, байты изображения или что-нибудь еще. Тем не менее набор операций для работы с этим типом данных ограничен, поэтому, например, извлечь нужное значение из JSON вам не удастся.

Чтобы добавить в хранилище новое строковое значение, нужно использовать команду set.
> set key value

Чтобы получить значение по заданному ключу, нужно использовать команду get
> get key

set обновит значение, если такой ключ существует, причем вне зависимости от того, значение какого типа хранилось до этого. 

Это поведение можно изменить, используя опции:

nx — создать только, если такого ключа нет, 

xx — создать (обновить) только, если ключ существует.

Если в качестве строки используется число, то можно использовать команды incr, decr и incrby, decrby. Первая пара увеличивает и уменьшает число на единицу, вторая делает это на заданное число.

> incr key

> incrby key 10

Если строка не является числом, то операция вернет ошибку.

***Списки***

Список в Redis реализован как связанный список, в отличие от многих других реализаций, использующих массив. В связи с этим, со списками быстро работают команды добавления элементов в начало или конец и извлечения последовательных элементов. Если есть необходимость в доступе к элементам из середины большой коллекции, то лучше использовать упорядоченные множества.

С помощью команд lpush и rpush элементы добавляются в начало и конец списка. Если ключ не существует, то сначала создается пустой список с таким ключом, а затем в него добавляется элемент. Такое поведение предусмотрено для всех видов коллекций.

>lpush key 1 2 3

>rpush key 77 

Чтобы извлечь значение по индексу используется команда lrange:

> lrange key start end

Где start, end указывают начальный и конечный индексы. Например, чтобы получить все элементы списка, можно использовать:

> lrange key 0 -1

Чтобы извлечь, при этом удалив элемент, используются команды lpop и rpop. При удалении последнего элемента из коллекции список также удаляется. Если после этого использовать команду llen, которая возвращает длину списка, то она вернет такое значение, как если бы коллекция была пустой.

>lpop key

>rpop key

>llen key

Команда ltrim —  принимает аргументы, так же как и lrange, но не возвращает, а обрезает список. 

> ltrim key 0 2

Полный перечень команд можно посмотреть по адресу https://redis.io/commands#list

***Хэши***

С помощью хешей можно хранить объекты в виде наборов пар ключ-значение. 

В роли ключей могут использоваться только строковые значения. Для добавления элементов в хеш используйте команду hmset вместе с набором пар.
> hmset key a 10 b 20

Получение значения по ключу осуществляется с помощью команды hget

>hget key a


Получить все пары можно командой hgetall
> hgetall key

Полный перечень команд можно посмотреть по адресу https://redis.io/commands#hash

***Множества***

Множества в Redis — неупорядоченные наборы строк. Они поддерживают стандартные операции между множествами, такие как пересечение, объединение, разность и другие. Для добавления элементов в множество используется  команда sadd.

> sadd a 1 2 3

> saad b 2 3 4 5 6


Некоторые операции над множествами:

Получает все элементы множества:
> smembers a

Объединение множеств:

> sunion store a b

Возвращает число элементов в множестве:

> scard a

Определяет, содержится ли элемент в множестве:

> sismember a 2

Полный перечень команд можно посмотреть по адресу https://redis.io/commands#set


***Упорядоченные множества***

Упорядоченные множества — это соединение обычных множеств и списков.  Они содержат только уникальные значения, но каждому значению соответствуют число (score), задающего порядок. 

A > B, если A.score > B.score

если A.score = B.score, то A и B упорядочиваются в соответствии с лексикографическим порядком значений. 

Равенство двух различных элементов в упорядоченном множестве невозможно.

Чтобы добавить новые элементы можно использовать команду zadd, а для получения всех элементов в порядке возрастания — zrange:

> zadd authors 1902 Tolkien
> zrange authors 0 -1

Если нужен обратный порядок для элементов упорядоченного множества, то есть команда zrevrange:

> zrevrange authors 0 -1

Остальные команды можно посмотреть по ссылке https://redis.io/commands#sorted-set

***Общие команды***

В Redis есть набор команд, которые можно применять к любому типу данных:

> exists — возвращает 1, если ключ существует и 0, если нет.

> del - удаляет ключ.

> type - возвращает тип значения по ключу.

> expire - удаляет ключ по прошествии указанного времени.

>ttl - возвращает число: сколько времени осталось ключу до удаления.

Вы можете объединить SET и EXPIRE, используя команду SETEX.

> SETEX key 10 value

В этом примере ключ - «key», значение - «value», а время жизни (TTL) - 10. Этот ключ будет сброшен через 10 секунд.

Чтобы получить список всех ключей, нужно использовать команду:

> keys *

Чтобы получить тип ключа, можно использовать команду:

> type key

Redis может поддерживать одновременную работу с несколькими базами данных. По умолчанию максимальное количество равно 16.

Для того, чтобы подключиться к нужно базе с помощью redis-cli, нужно использовать флаг -n number:

> redis-cli -n 5

Так подключаемся к базе данных под номером 5.

> FLUSHDB - очищает все ключи текущей базы 

> FLUSHALL очищает все существующие базы данных
 
С полным перечнем команд Redis можно ознакомиться на официальном сайте https://redis.io/commands#

## Настройка взаимодействия с Redis через Python

Для настройки взаимодействия с redis через Python  можно использовать библиотеку redis

> pip3 install redis

In [35]:
import redis

Чтобы подключиться к базе данных по умолчанию к серверу redis, можно использовать команду:

In [12]:
r=redis.Redis()

Можно ввести уточнения подключения:

In [15]:
r=redis.Redis(host='localhost',port=7777, db=0) 

Здесь мы подключаемся к базе данных под номером 0. 
Посмотрим функционал объекта r

In [36]:
dir(r)

['RESPONSE_CALLBACKS',
 '__class__',
 '__contains__',
 '__del__',
 '__delattr__',
 '__delitem__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_disconnect_raise',
 '_georadiusgeneric',
 '_geosearchgeneric',
 '_send_command_parse_response',
 '_zaggregate',
 '_zrange',
 'acl_cat',
 'acl_deluser',
 'acl_genpass',
 'acl_getuser',
 'acl_help',
 'acl_list',
 'acl_load',
 'acl_log',
 'acl_log_reset',
 'acl_save',
 'acl_setuser',
 'acl_users',
 'acl_whoami',
 'append',
 'bf',
 'bgrewriteaof',
 'bgsave',
 'bitcount',
 'bitfield',
 'bitop',
 'bitpos',
 'blmove',
 'blpop',
 'brpop',
 'brpoplpush',
 'bzpopmax',
 'bzpopmin',
 'cf',
 'client',
 'clie

Получим список ключей:

In [29]:
r.keys()

[b'b', b'rrr', b'Bahamas', b'Croatia', b'a', b'www', b'#453']

Получим тип ключа:

In [30]:
r.type('#453')

b'string'

Получим значение ключа:

In [31]:
r.get("#453")

b'99'

Еще примеры:

In [32]:
r.type('www')

b'list'

In [33]:
r.lrange('www',0,-1)

[b'753', b'777', b'3']

Как видно из примеров, практически во всех случаях методы совпадают с названием команды Redis, которая выполняет ту же функцию.