# Imersão Cloud Computer

## Introdução ao AWS (Por Cassiano Peres)
- AWS(Amazon Web Services) é uma plataforma de computação em nuvem que oferece uma ampla variedade de serviços de computação na nuvem, como computação, armazenamento, banco de dados, redes, análise de dados, inteligência artificial, IoT, dispositivos móveis e aplicativos de desktop com entrega sob demanda e pagamento por uso.
- Da infraestrutura da AWS:
  - Regiões AZ: São datacenters geograficamente distribuídos, que são compostos por uma ou mais Zonas de Disponibilidade (AZ).
  - Availability Zone (AZ): São datacenters independentes, com energia e rede independentes, que estão conectados por uma rede de alta velocidade.
  - Local Zone: São datacenters independentes, com energia e rede independentes, que estão conectados por uma rede de alta velocidade, conectados a uma AZ
  - Wave Length Zone: São datacenters independentes, com energia e rede independentes, que estão conectados por uma rede de alta velocidade, conectados a uma AZ
  - Outposts: São datacenters de terceiros

### IAM
- AWS IAM (Identity and Access Management): É um serviço que permite gerenciar usuários e seus níveis de acesso e permissões à AWS.
- Permite o acesso compartilhado ao AWS
- Permissões granulares.
- Identidades federadas (AD, Facebook, Linkedin, etc)
- Integrações com serviços AWS
- User Groups: São grupos de usuários que compartilham as mesmas permissões.
- IAM Roles: São perfis de usuário que podem ser atribuídos a recursos da AWS.
- Inline policy: Permissões que são atribuídas diretamente ao usuário ou grupo, não sendo possível reutilizá-la.
- Managed policy: Permissões que são atribuídas diretamente ao usuário ou grupo, sendo possível reutilizá-la em várias entidades.
- IAM permisisons: Nível mais baixo, definindo permissões de acesso aos serviços da AWS (allow/deny), definida em JSON.
- Entre as boas práticas:
  - Não utilizar a conta raiz (root) para tarefas diárias.
  - Criar usuários individuais e com privilégios mínimos.
  - Utilizar grupos para atribuir permissões.
  - Utilizar o AWS Cloud Trail para monitorar as atividades da conta.
- Há políticas de segurança pré-definidas, como:
  - AWS Managed Policies: São políticas de segurança que são gerenciadas pela AWS.
  - Customer Managed Policies: São políticas de segurança que são gerenciadas pelo usuário.
  - Service Control Policies: São políticas de segurança que são gerenciadas pelo usuário, porém, aplicadas a uma organização.

- S3 (Simple Storage Service): É um serviço de armazenamento de objetos na nuvem, que permite armazenar e recuperar qualquer quantidade de dados de qualquer lugar na internet. É um serviço altamente escalável, seguro e com baixo custo.
- Nele você cria um bucket, que é um container para armazenar objetos.
- ARN (Amazon Resource Name): É um identificador único para qualquer recurso da AWS.
- Uma política é um objeto que quando associado a uma entidade ou recurso, define suas permissões.
- Role é um conjunto de políticas que define as permissões de uma entidade.

## Desenvolvendo Soluções Serverless na AWS
- Serverless: É um modelo de computação em nuvem que não requer a administração de servidores ou a configuração de infraestrutura.
- O código é executado em um ambiente gerenciado, sem a necessidade de provisionar ou gerenciar servidores, acionado por eventos ou solicitações.
- Os eventos podem ser:
  - Eventos de usuário: Quando um usuário interage com um aplicativo.
  - Eventos de aplicativo: Quando um aplicativo interage com outro aplicativo.
  - Eventos de sistema: Quando um serviço da AWS interage com um aplicativo.
- As funções são executadas em containers isolados, que são criados e destruídos conforme necessário.
- Os recursos são provisionados automaticamente conforme necessário.
- Microservices: São pequenos serviços que executam uma única tarefa.
- Stateless functions: São funções que não armazenam estado, ou seja, não armazenam dados entre as execuções.
- Cold starts: São os primeiros segundos de execução de uma função, que podem ser mais lentos devido a inicialização do container.
- Os serviços servless na AWS são:
  - Computação: Lambda( executa código em resposta a eventos) e Farga( executa código em resposta a eventos, mas com recursos de computação mais robustos).
  - Integração de aplicações: Step Functions( gerencia a execução de funções Lambda e outras funções de computação), EventBridge( gerencia fluxos de eventos entre aplicativos e serviços), SQS( gerencia filas de mensagens entre aplicativos e serviços), SNS( gerencia tópicos de mensagens entre aplicativos e serviços), API Gateway( gerencia a publicação, o monitoramento, o controle de acesso e a segurança de APIs REST e WebSocket) e AppSync( gerencia a publicação, o monitoramento, o controle de acesso e a segurança de APIs GraphQL).
  - Armazenamento de dados: S3, DynamoDB e Aurora Serverless.

### Backend serverless com o AWS Lambda
- O AWS Lambda é um serviço de computação serverless que permite executar código sem provisionar ou gerenciar servidores.
- Possui suporte a várias linguagens de programação, como: Java, Python, Node.js, C#, Go, PowerShell, Ruby e PHP.
- É pago por segundo de execução e por quantidade de memória utilizada.
- Possui monitoramento e logs integrados pelo CloudWatch.
- O Lambda Edge permite executar código em pontos de presença da AWS, como: CloudFront, Amazon S3 e Amazon Route 53.
- Destinations: São destinos para os logs de execução do Lambda.
- Layers: São pacotes de bibliotecas que podem ser compartilhados entre funções.
- Simultaniedade provisionada: É o número máximo de funções que podem ser executadas simultaneamente, oferecendo menor latência e maior disponibilidade.
- É cobrado a cada 100ms de execução, o nível gratuito permite 1 milhão de solicitações por mês e 400.000 GBs/segundos de tempo de execução.

### NoSQL com DynamoDB
- Bancos de dados NoSQL: São bancos de dados não relacionais, não estruturados e de alta performance.
- Permitem armazenar e recuperar dados de forma escalável e com baixo custo.
- Desenvolve-se o esquema baseado em como os dados serão recuperados.
- O DynamoDB é um banco de dados chave-valor e de documentos.
- Componentes:
  - Tabelas: é o container de dados, onde são armazenados os itens.
  - Itens: são os dados armazenados na tabela.
  - Atributos: são as colunas da tabela.
  - Chave primária: é o identificador único de cada item na tabela. É composta por uma chave de partição(partition key) e uma chave de ordenação (sort key).
  - A partition key é usada para distribuir os dados em vários nós (hash interna), e a sort key é usada para ordenar os dados dentro de cada partição, a combinação das duas deve ser única.
  - Os índices secundários permitem consultar os dados de uma tabela de forma mais eficiente, porém, eles não são atualizados automaticamente, ou seja, é necessário atualizar o índice sempre que um item for atualizado ou removido.
  - O índice secundário global é um índice que pode ser criado em qualquer tabela, e é composto por uma chave de partição e uma chave de ordenação.
  - O índice secundário local é um índice que pode ser criado apenas em tabelas que possuem uma chave de partição composta, e é composto por uma chave de ordenação.
- A leitura e gravação pode ser sob demanda (sem limite) ou provisionada.
- O DynamoDB não é normalizado, ou seja, não é possível criar relacionamentos entre tabelas.
- Não possui joins.
- Pode ter múltiplas entidades em uma tabela, porém, é necessário que todas as entidades tenham a mesma chave primária.
- Atributos podem ser criados dinamicamente, ou seja, não é necessário definir todos os atributos antes de inserir um item.

### Armazenamento de arquivos com o Amazon S3
- O Amazon S3 (Simple Storage Service) é um serviço de armazenamento de objetos na nuvem, oferece alta disponibilidade, escalabilidade e segurança.
- Permite a criação de buckets, que são containers de objetos.
- É possível controlar o acesso aos objetos através de políticas de acesso.
- Há várias classes de armazenamento, que definem o custo e a disponibilidade dos objetos: S3 Standard, S3 Standard-IA, S3 One Zone-IA, S3 Intelligent-Tiering, S3 Glacier, S3 Glacier Deep Archive.
  - S3 Standard é o padrão, com alta disponibilidade e baixo custo.
  - S3 Glacier Deep Archive é o mais barato, porém, com alta latência e baixa disponibilidade.
  - S3 Intelligent-Tiering é o mais recomendado, pois ele analisa o acesso aos objetos e os move automaticamente para a classe mais adequada.
  - S3 Standard-IA e S3 One Zone-IA são classes intermediárias, com custo intermediário e disponibilidade intermediária.

### APIs com o Amazon API Gateway
- O Amazon API Gateway é um serviço que permite criar, publicar, manter, monitorar e proteger APIs REST e WebSocket.
- Permite interagir com serviços da AWS, como: DynamoDB, S3, Lambda, Kinesis, SQS, SNS, Step Functions, entre outros ou com serviços externos.
- Permite restrições de acesso por meio de autenticação e autorização.
- Segurança: Permite autenticação por meio de tokens OAuth 2.0, IAM, Cognito, entre outros.
- Monitoramento: Permite monitorar o uso da API através de métricas e logs.
- Métricas através de CloudWatch.
- Os tipos de integração são: HTTP, REST ou WebSocket.
- Permite a criação de APIs é feita através de recursos, que são os endpoints da API.

## Big Data na AWS
- Big Data: É um conjunto de tecnologias que permite a coleta, armazenamento, processamento e análise de grandes volumes de dados.
- Uma falha no armazenamento de dados pode causar prejuízos financeiros, redução da produtividade e competividade.
- Big Data na AWS pode ser divivido em 5 categorias:
  - Coletores: É o serviço que permite coletar grandes volumes de dados.
  - Armazenamento: É o serviço que permite armazenar grandes volumes de dados.
  - Processamento: É o serviço que permite processar grandes volumes de dados.
  - Análise: É o serviço que permite analisar grandes volumes de dados.
  - Visualização: É o serviço que permite visualizar grandes volumes de dados.
- AWS Snow Family é uma família de serviços que permite a coleta de dados, por meio de dispositivos físicos, para dentro e fora da AWS.
- O AWS Kinesis é uma alternativa para o Apache Kafka, permite a coleta, processamento e análise de dados em tempo real.
  - Dados são replicados em 3 regiões diferentes.
  - Kinesis Streams é o consumidor de dados, que permite a coleta de dados em tempo real.
  - Kinesis Analytics é o processador de dados, que permite processar dados em tempo real.
  - Kinesis Firehose é fluxo de carga, carrega dados para o S3, Redshift, ElasticSearch, entre outros.
- O AWS Elastic MapReduce é um serviço que permite a execução de jobs em clusters Hadoop.
  - Inclui Spark, Hive, Pig, entre outros.
  - Os clusters são divididos em master, core e task nodes.
- AWS Glue é um serviço que permite a criação de jobs ETL (Extract, Transform, Load).
  - Permite a criação de jobs ETL sem a necessidade de escrever código.
  - Permite a criação de jobs ETL com código.
  - Permite a criação de jobs ETL com o AWS DataBrew.
  - Glue Elastic Views: Permite a criação de views de dados (SQL).
- AWS Redshift é servidor de armazenamento de banco de dados gerenciado em escala de petabytes.
  - Pode ter interfaces de acesso: SQL, JDBC, ODBC, entre outros.
  - Projeto para OLAP (Online Analytical Processing).
  - Pode unificar data warehouse e data lake.
  - Entre seus usos estão: BI, Data Science, Machine Learning, entre outros.
 