# Sistemas de armazenamento

A escolha de sistemas de armazenamento é uma passo fundamental do gerenciamento eficiente em Big Data. Produzimos uma quantidade cada vez maior de dados diariamente, logo é imprescindível ter uma solução escalável e duradoura para armazenar tais informações, previnindo problemas tanto de performance quanto de proteção de dados sensíveis.

## RAID

RAID (**R**edundant **A**rray of **I**nexpensive **D**isks) é uma tecnologia de armazenamento que consiste na combinação de vários discos rígidos em um único sistema. O RAID pode ser configurado de várias maneiras diferentes, chamadas de níveis RAID, que oferecem diferentes benefícios e compromissos entre capacidade de armazenamento, velocidade de leitura/gravação e tolerância a falhas. O objetivo principal do RAID é fornecer um meio mais seguro e **confiável** de armazenar **grandes quantidades de dados**, com **redundância** para minimizar a perda de dados em caso de falha do hardware.

Vamos ver alguns níveis RAID.

### RAID `0`

O RAID 0 distribui os dados uniformemente em dois ou mais discos, sem informações de paridade, redundância ou tolerância a falhas. É normalmente usado para aumentar o desempenho, embora também possa ser usado como uma forma de criar um grande volume lógico a partir de dois ou mais discos físicos.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9b/RAID_0.svg/300px-RAID_0.svg.png">

Fonte: https://upload.wikimedia.org/wikipedia/commons/thumb/9/9b/RAID_0.svg/300px-RAID_0.svg.png

Como o RAID 0 não fornece tolerância a falhas ou redundância, a falha de uma unidade fará com que todo o array falhe; como resultado da distribuição de dados em todos os discos, a falha resultará na perda total de dados.

### RAID `1`

O RAID 1 é um tipo de configuração de armazenamento em que os dados são copiados (produz *mirror* ou clone) para dois ou mais discos rígidos separados, oferecendo uma solução de backup imediata caso um dos discos falhe.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/b/b7/RAID_1.svg/300px-RAID_1.svg.png">

Fonte: https://upload.wikimedia.org/wikipedia/commons/thumb/b/b7/RAID_1.svg/300px-RAID_1.svg.png

Nesta configuração, as solicitações de leitura podem ser atendidas e tratadas por qualquer unidade na matriz. Dependendo da natureza da carga de E/S, o desempenho de leitura aleatória de uma matriz RAID 1 pode ser igual à soma do desempenho de cada membro, enquanto o desempenho de gravação permanece no nível de um único disco.

### RAID `5`

O RAID 5 é um tipo de configuração de armazenamento que utiliza **três ou mais** discos rígidos para oferecer uma solução de armazenamento com desempenho e tolerância a falhas. Nessa configuração, os dados são distribuídos por todos os discos rígidos, o que permite que a leitura e gravação de dados ocorra de forma mais rápida.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/6/64/RAID_5.svg/600px-RAID_5.svg.png">

Fonte: https://upload.wikimedia.org/wikipedia/commons/thumb/6/64/RAID_5.svg/600px-RAID_5.svg.png

Além disso, o RAID 5 possui um esquema de paridade distribuída, onde um bloco de paridade é armazenado em cada disco do conjunto. Isso significa que se um dos discos falhar, as informações contidas nele podem ser reconstruídas usando os dados armazenados nos outros discos e nas informações de paridade, garantindo a integridade dos dados e permitindo que o sistema continue operando sem perda de informações.



Veja mais em https://en.wikipedia.org/wiki/Standard_RAID_levels

## Exercícios

**Exercício 1**

Suponha que precise mover os dados armazenados em 10000 HDs de 1TB cada. O novo servidor está a 600Km de distância. 

**a)** Explique como você resolveria este problema. Cite tecnologias adequadas.

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**b)** Qual seria a latência da sua solução?

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**c)** Qual a largura de banda e a taxa de transferência da sua solução?

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**d)** Suponha que você resolva colocar todos os HDs em um caminhão e disparar! Qual seria a latência e a taxa de transferência da solução?

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**Exercício 2** (*Prova Final 2019-2*)

Em um cluster temos vários arquivos enormes, de tamanho médio 1 GB. Todos os arquivos são do tipo write-once-read-many: uma vez que o arquivo é criado, ele pode apenas ser removido por completo, nunca modificado parcialmente. Esse é o modo de operação do S3 da AWS. 
Os arquivos são divididos em blocos de 64 MB e estão armazenados de modo redundante, com fator de replicação 3 (este é o modo padrão do HDFS). Ou seja, cada bloco é armazenado 3 vezes, em máquinas diferentes. 
Desejamos armazenar 10000 arquivos destes, em máquinas com 4 discos de 1TB SSD cada, nas quais queremos que os dados ocupem no máximo 75% do espaço. 
Toda semana parte dos arquivos será processada usando Spark para alguma atividade de extração de informação. 

**a)** Quais as vantagens e desvantagens da replicação em máquinas diferentes, neste contexto? 

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**b)** Porque write-once-read-many é desejável aqui? 

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**c)** Quantas máquinas este cluster deve ter, no mínimo, para acomodar esses dados?

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**d)** Mais dados chegam constantemente ao sistema, que eventualmente ficará sem capacidade! Mas uma vez que a pipeline Spark é executada, os dados não são mais necessários de imediato. Proponha uma solução simples para não perder dados e não ter que aumentar indefinidamente o cluster. 

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**Exercício 3** (*Prova Final 2018-2*)

Descreva um sistema de armazenamento adequado para edição de vídeo, onde temos grandes massas de dados e a necessidade de transferi-los em alta velocidade numa rede local. 

Estime capacidade e velocidade de transferência para editar vídeos full HD (1920x1080, 30 quadros por segundo, 24-bit RGB) com taxa de compressão típica de 30% (ou seja, o tamanho comprimido é 30% do tamanho original). 

Cite tecnologias adequadas para este sistema. 


<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**Exercício 4** (*Prova Final 2017-2*)

(contexto: nesta prova estávamos falando de uma rede social fictícia da start-up na qual você trabalha)

A rede social está fazendo um sucesso inacreditável! Estima-se que daqui a 6 meses a rede terá 2 milhões de usuários, cada um postando uma média de 10kB por dia de conteúdo (fotos, áudio, texto, etc). Pelas regras desta rede social, todo o material postado nos últimos 12 meses estará rapidamente acessível, (em questão de milissegundos). A empresa deseja manter registros históricos de todo o material mais antigo (após 12 meses), indefinidamente. Projete uma solução de armazenamento para a empresa, indicando o tamanho esperado do(s) espaço(s) de armazenamento. 


<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**Exercício 5** Considerando a capacidade total de todos os discos, qual a porcentagem aproximada realmente disponível para armazenamento no RAID 0, RAID 1 e RAID 5 (considere 4 discos)?

<div class="alert alert-success">
Sua resposta AQUI!    
</div>

**Exercício 6**

Neste exercício vamos trabalhar com o AWS S3 utilizando a biblioteca `boto3`.

**a)** Faça a instalação dela com `pip install boto3`.

**b)** Utilize as credenciais disponibilizadas pelo professor para criar um `.env` na pasta da aula de hoje. Cuidado para não vazar estas credenciais, jamais disponibilize no github ou qualquer outro lugar público! Estas credenciais estarão válidas apenas durante a aula de hoje.

**c)** Vamos enviar uma imagem para o S3. Para isto, considere o arquivo `an_dalle.jpeg` gerado no bing utilizando o promp "an" (vai entender como este prompt gerou esta imagem, mas gostei!).

<img src="an_dalle.jpeg">

A imagem deverá ser salva em `"bucket/USUARIO_INSPER/an_dalle.jpeg"`. Assim cada aluno consegue escrever e ler sem prejudicar os demais, uma vez que utilizaremos o mesmo bucket S3.

Preencha seu usuário Insper no código e execute.

```python
import boto3
import os
from dotenv import load_dotenv


# Carrega variáveis de ambiente, confira seu .env
load_dotenv()

s3 = boto3.client(
    "s3",
    aws_access_key_id=os.getenv("AWS_ACCESS_KEY_ID"),
    aws_secret_access_key=os.getenv("AWS_SECRET_ACCESS_KEY"),
)

# Na pasta da aula deve existir este arquivo
fname = "an_dalle.jpeg"

# Informe seu usuário insper para diferenciar, no bucket s3, o seu conteúdo
# e o de seus colegas
insper_username = "" # <--- Seu usuário Insper AQUI!
bucket_name = os.getenv("AWS_BUCKET_NAME")

# A chave serve como um prefixo + arquivo (como em um sistema de pastas)
key = f"{insper_username}/{fname}"

# Faz o upload do arquivo para o bucket
s3.upload_file(fname, bucket_name, key)
print("Fez o upload!")
```

**d)** Agora vamos conferir se conseguimos fazer a leitura da imagem.

Preencha seu usuário Insper no código a seguir e confira se a imagem `an_dalle_downloaded.jpeg` é gerada corretamente.

```python
import boto3
import os
from dotenv import load_dotenv

# Carrega variáveis de ambiente, confira seu .env
load_dotenv()

s3 = boto3.client(
    "s3",
    aws_access_key_id=os.getenv("AWS_ACCESS_KEY_ID"),
    aws_secret_access_key=os.getenv("AWS_SECRET_ACCESS_KEY"),
)

# Este é o arquivo que você quer baixar
fname = "an_dalle.jpeg"
insper_username = "" # <--- Seu usuário Insper AQUI!
bucket_name = os.getenv("AWS_BUCKET_NAME")

# Com qual prefixo o arquivo está armazenado no bucket s3
key = f"{insper_username}/{fname}"

# Este será o nome do arquivo baixado
local_file_path = "an_dalle_downloaded.jpeg"

# Faz download do arquivo
s3.download_file(bucket_name, key, local_file_path)
print(f"Fez o download, confira o arquivo {local_file_path}")
```

**e)** Como funcionou para o `.jepg`, vamos utilizar a mesma ideia para subir no S3 um backup de uma base MySQL.

Para isto, utilizaremos o `mysqldump`. Provavelmente o executável `mysqldump.exe` está na pasta `C:\Program Files\MySQL\MySQL Server 8.0\bin`. Localize o local correto e faça a adição dele ao `PATH` do sistema caso ainda não esteja.

Em seguida, abra o terminal e faça o backup da base `classicmodels`:

```console
mysqldump -h localhost -u root -p classicmodels > classicmodels_261023.sql
```

Então, adapte o código para enviar este arquivo SQL para o S3, deixando-o em `"bucket/USUARIO_INSPER/classicmodels_261023.sql"`.

Em seguida, adapte o código de download para baixar o arquivo SQL como `classicmodels_261023_downloaded.sql`.

Então, faremos a reconstrução da base. Faremos drop com:

```console
mysql -h localhost -P 3306 -u root -p -e "DROP DATABASE classicmodels;"
```

Você pode abrir o Workbench e conferir se o drop realmente ocorreu!

Crie o database novamente com:

```console
mysql -h localhost -P 3306 -u root -p -e "CREATE DATABASE classicmodels;"
```

E reconstrua as tabelas e dados com:

```console
mysql -h localhost -P 3306 -u root -p classicmodels < classicmodels_261023_downloaded.sql
```

Pronto! Abra o workbench e confira se a base foi restaurada.

## Gabarito

**<div id="gab_ex1">**Exercício 1 d)**</div>**
<div class="alert alert-warning">

Vamos ignorar o tempo para desmontar e remontar os HDs (senão perde toda a graça!)...
Supondo que o caminhão viaja em média a 75 Km/h, então levará 8 horas para chegar ao destino. Logo, a latência é de aproximadamente 8 horas!

A taxa de transferência é a quantidade transmitida dividido pelo tempo. Então vamos considerar GB e segundos como unidades.

```python
    qtde_hds = 10000 # Quantos HDs eu quero transferir
    tb = qtde_hds * 1 # Cada HD tem 1TB, então calculamos o total de TB a serem transferidos
    gb = tb * 1024 # Converte TB para GB 

    horas = 8
    segundos = horas * 60 * 60

    throughput = gb / segundos
    throughput
```
Resultado: taxa de transferência de 355.56 GB/s


</div>

**<div id="gab_ex2">**Exercício 2**</div>**
<div class="alert alert-warning">

**a)**

Vantagens:

- confiabilidade: se uma máquina cai, o sistema continua a rodar
- Desempenho: propicia acesso paralelo aos dados

Desvantagens:
- Custo de aquisição dos equipamentos
- Custo de operação

**b)**
    
É comum em BigData que ocorra apenas a leitura de dados brutos:
    
Dados brutos -> pipeline de processamentos -> dados processados -> Análise

Caso necessário, os resultados da análise são armazenados, mas os dados originais são comumente mantidos.

Além disso, não precisamos sincronizar dados entre cópias, o que facilita replicação de dados para desempenho e confiabilidade.
</div>

**<div id="gab_ex4">**Exercício 4**</div>**
<div class="alert alert-warning">

*(Resposta parcial)*

Uma solução para teria as seguintes características propostas:

- write-once-read-many: é raro querer editar posts, só postar, raramente deletar
- 12 meses de dados "live", o resto é backup
    
Uma solução seria utilizar o S3 para manter os dados live e o Glacier para os dados mais antigos (backup). Os dados poderiam ser restaurados do Glacier caso fosse necessário fazer auditoria.
</div>

### Referências
- Silberschatz cap. 11
- Parte dos textos gerados utilizando https://chatbot.theb.ai/