# Introdução

A comunicação em redes de computadores é baseada em uma série de protocolos bem estabelecidos e conhecidos por cada nó da rede para que seja possível haver trocas de mensagens e informações entre esses diferentes nós. Com isso, na internet um dos principais protocolos de comunicação é o HyperText Transfer Protocol (HTTP) sendo hoje em dia a base de qualquer comunicação web. Porém o HTTP não surgiu com o intuito de prover segurança em suas comunicações e com o avançar da internet rapidamente percebeu-se a necessidade de criptografar essas comunicações HTTP. Assim, surgiu-se a ideia do HTTPS, uma extensão do HTTP com o intuito de fornecer segurança às comunicações. Primeiramente, o protocolo utilizado para fornecer essa segurança foi o SSL, mas devido algumas vulnerabilidades, hoje o mais recomendado é o HTTPS over TLS, outro protocolo que surgiu da evolução do SSL.

Este relatório tem como objetivo explorar os principais protocolos envolvidos na comunicação segura na web, abordando o funcionamento do HTTP, HTTPS, SSL e TLS. Além disso, será feita uma breve análise das versões de cada um desses protocolos, destacando também a transição do SSL para o TLS.

Por fim, ainda, esse relatório consta com uma parte prática, onde será implementado uma rede de comunicação do tipo cliente servidor utilizando o protocolo HTTPS over TLS. Esse experimento consiste em uma simulação de comunicação entre alguns clientes e um servidor, os clientes farão requisições sobre o protocolo HTTPS para o servidor solicitando alguns componentes HTMLs, também será feita uma pequena análise dessas comunicações, bem como a geração do certificado e chave privada do servidor. Vale ressaltar que esse experimento será implementado utilizando o módulo do python SSL para implementação do HTTPS over TLS, do módulo socket para comunicação na rede local e do openssl para criação do certificado digital e chave privada do servidor.



# HyperText Transfer Protocol
O HyperText Transfer Protocol (HTTP) é um protocolo de comunicação da camada de aplicação que surgiu em 1991 com a crescente necessidade de transmissão de hiper texto de uma forma eficiente e com boa alta abstração. É amplamente utilizado no contexto web por navegadores e servidores que, ao interagirem, torna possível a troca de informações na web. Além da transmissão de hiper texto, rapidamente o protocolo evoluiu para transmissão de documentos, imagens, arquivos e outros tipos de dados por meio de uma estrutura simples baseada em requisições e respostas. 

Porém os dados trafegados no protocolo HTTP são em formato plain text, assim, o protocolo não oferece nenhum grau de segurança por padrão, pois os dados trafegam de forma clara para qualquer usuário que tenha acesso a requisição. Dessa forma, com a crescente utilização da web para realizar comunicações de grande importância, surgiu-se a necessidade de uma expansão do protocolo para comunicações que necessitem de segurança, o HTTPS.

Antes de partirmos para o HTTPS, primeiro vamos fazer uma breve análise das versões do https, iremos considerar apenas até o HTTP/2, já que sua versão 3 ainda não está totalmente suportada pela maioria das aplicações web.

## Comparativo das Diferentes Versões
### HTTP/0.9 (1991)  
- Primeira versão do protocolo, extremamente simples.  
- Suportava apenas o método `GET` e não possuía cabeçalhos nem suporte para envio de arquivos além de HTML. 

### HTTP/1.0 (1996)  
- Introduziu cabeçalhos HTTP, permitindo informações adicionais nas requisições.  
- Suporte para outros métodos além de `GET`, como `POST` e `HEAD`.  
- Comunicação não persistente, ou seja, uma nova conexão TCP era aberta para cada requisição, tornando a comunicação lenta e ineficiente.

###  HTTP/1.1 (1997)  
- Melhorias no desempenho com suporte a conexões persistentes (Keep-Alive).  
- Introdução do pipelining, permitindo múltiplas requisições em uma única conexão TCP.  
- Novos métodos adicionados, como `PUT`, `DELETE`, `OPTIONS`.  
- Suporte a cache avançado e compressão de dados.  
- Ainda é amplamente utilizado hoje em dia.  

### HTTP/2 (2015)  
- Otimizações no desempenho, incluindo multiplexação, permitindo múltiplas requisições simultâneas em uma única conexão TCP.  
- Redução da sobrecarga dos cabeçalhos HTTP, melhorando a eficiência da comunicação.  
- Introdução do server push, permitindo que o servidor envie dados antecipadamente para o cliente sem esperar uma requisição explícita.  
- Maior eficiência em conexões seguras (HTTPS é amplamente adotado junto ao HTTP/2). 

# Hyper Text Transfer Protocol Secure

Para a primeira implementação do  Hyper Text Transfer Protocol Secure (HTTPS) foi utilizado o protocolo Secure Sockets Layer (SSL) o qual foi projetado pela Netscape Communications Corporation no início da década de 90 com o intuito de adicionar segurança a diversos protocolos, incluindo HTTP, SMTP e FTP. Assim, o SSH passou a permitir a transmissão criptografada de dados entre clientes e servidores, protegendo as comunicações de ataques como interceptações e manipulações de dados. Sua adoção foi ampla, sendo utilizado em bancos, lojas online e serviços de e-mail para garantir a segurança de informações sensíveis.

## SSL

Agora partiremos para uma análise mais profunda do protocolo, analisando passo a passo como o SSL consegue transmitir privacidade, autenticação e integridade de dados em comunicações de internet. Na primeira tentativa de comunicação do cliente pelo servidor, o cliente e/ou servidor podem sinalizar que desejam utilizar o protocolo HTTPS, caso ambas aceitem, o protocolo do SSL começa a operar. O primeiro passo é chamado de handshake, o qual é uma etapa onde o servidor e o cliente estão acordando como a conexão irá acontecer. Por exemplo, o cliente transmite a lista de algoritmos de segurança que ele é capaz de operar e, assim, o servidor decide a lista de algoritmos que serão utilizados na comunicação.

Após essa etapa de acordo de algoritmos e funções, o servidor envia um certificado digital e sua chave pública, este certificado é previamente gerado por uma autoridade de certificação. Uma autoridade de certificação é uma instituição responsável por gerar certificados digitais para cada instituição que a solicite para tal, atuando como um terceiro confiável na comunicação entre dois agentes que ainda não possuem certeza de suas identidades.

O certificado digital é gerado pela AC a partir de informações de identificação do solicitante e uma chave pública que o solicitante queira cadastrar em seu certificado. Essa solicitação de certificado digital é um processo que é realizado em ambientes seguros e controlados, para se ter certeza que a pessoa que está se cadastrando realmente é quem diz ser. Assim, com informações de ID e a chave pública do solicitante a AC termina de gerar o certificado e por fim gera um hash desse certificado, o qual é assinado pela chave privada da AC e é concatenado ao certificado digital que deu origem ao hash. Vale-se ressaltar que essa concatenação do certificado com o hash assinado é armazenada pela AC a qual irá o disponibilizar para qualquer usuário que queira verificar qual é o certificado daquela instituição.

Com isso fica claro a estratégia do SSL. O que o SSL propoẽ é que quando um usuário receber o certificado digital de um emissor, ele irá fazer o hash deste certificado e irá solicitar o certificado dessa instituição na AC a qual o emissor diz ter gerado esse certificado (a AC é informada pelo servidor ao cliente durante a etapa de Handshake). Com o certificado recebido da AC, o cliente irá descriptografar o hash acoplado ao certificado, usando a chave pública da AC. Caso o emissor diz ser quem é, esses dois hashs, tanto o originado da descriptografia quanto o calculado através do certificado enviado pelo servidor, serão iguais garantindo a autenticidade do servidor, evitando-se assim, ataques de man in the middle.

Com a identidade confirmando, utilizando a chave pública fornecida pelo servidor, o cliente e o servidor vão traçar qual será a chave de criptografia simétrica utilizada para o restante da comunicação. Isso é feito ao cliente criptografar um número aleatório com a chave pública recebida do servidor e enviar o resultado ao servidor (o único capaz de descriptografar a mensagem com sua chave privada); ambas as partes então fazem uso do número aleatório para gerar uma chave de sessão única para a criptografia subsequente dos dados durante a sessão.

Isso é feito, pois, normalmente, a criptografia simétrica é mais performática em relação a assimétrica. Assim, o processo de formação da chave simétrica é finalizado e inicia-se a conexão segura, que é criptografada e descriptografada com a chave de sessão até o fim da conexão. Se qualquer um dos passos acima falhar, o handshake também falha e a conexão não é criada.


Para tornar mais fácil a visualização do processo de validação do certificado digital, aqui está uma imagem didática que sintetiza o processo acima:

![Certificados Digitais](../resource/AC.png)

Para fins deste relatório, em relação a parte dois de experimentação, iremos sempre utilizar o RSA para nossa criptografia assimétrica e o AES para a criptografia simétrica.

### Vulnerabilidades do SSL

Com o passar dos anos, foram encontradas algumas vulnerabilidades no protocolo e novas versões foram desenvolvidas para corrigir essas vulnerabilidades e até mesmo melhorar a capacidade de segurança para ameaças ainda não descobertas. Porém a última versão viável do SSL durou até o ano de 2014, SSL 3.0, devido a descoberta de uma nova forma de ataque ao protocolo, ataque POODLE (Padding Oracle On Downgraded Legacy Encryption). Esse ataque foi descoberto e divulgado por um trio do time de segurança da Google. No caso do SSL 3.0 eram necessárias somente 256 tentativas para desvendar 1 byte da mensagem criptografada. Após a divulgação dessa falha, navegadores retiraram sua compatibilidade com o SSL 3.0 e o algoritmo foi substituído por protocolos mais recentes como o TLS 1.2 e TLS 1.3.

O TLS (Transport Layer Security) substituiu o SSL e trouxe diversas melhorias, incluindo suporte para algoritmos mais seguros, melhor desempenho e maior resistência contra ataques. Atualmente, TLS 1.2 e TLS 1.3 são os únicos padrões recomendados para aplicações seguras, eliminando as vulnerabilidades do SSL e garantindo criptografia robusta, autenticação confiável e integridade dos dados na comunicação pela internet. 

### Análise de Versões



## TLS

O **Transport Layer Security (TLS)** é um protocolo de segurança projetado para fornecer **criptografia, autenticação e integridade** na comunicação entre dispositivos conectados à internet. Ele é o sucessor do **Secure Sockets Layer (SSL)** e corrige diversas vulnerabilidades encontradas nas versões anteriores do SSL. Atualmente, o **TLS é o padrão de segurança utilizado na web**, sendo essencial para **comunicações seguras em HTTPS**, conexões de email (SMTP, IMAP, POP3) e até mesmo em protocolos de comunicação em tempo real, como VoIP e VPNs.  


### Melhorias em Relação ao SSL


### Comparativo das Diferentes Versões

| Versão    | Ano  | Características Principais |
|-----------|------|----------------------------|
| **TLS 1.0** | 1999 | Substituiu o SSL 3.0, mas herdou algumas vulnerabilidades. |
| **TLS 1.1** | 2006 | Melhorias na proteção contra ataques, mas ainda vulnerável. |
| **TLS 1.2** | 2008 | Adotado amplamente, suporta AES-GCM e SHA-256. |
| **TLS 1.3** | 2018 | Removidos algoritmos inseguros, handshake mais rápido e seguro. |