<h1 align=center><b>Capítulo 6</b></h1>
<h1 align=center>Trabalhando com Segurança na Web<h1>

## Introdução à Web Segura
A implementação de recursos de segurança baseados na Web (ou recursos que são usados para manter um estado seguro de acesso) para acessar informações está crescendo rapidamente, dia a dia. Com tecnologias baseadas na web em constante crescimento, sites e aplicativos da web implementam mecanismos seguros que são básicos ou altamente sofisticados.

O conteúdo seguro habilitado para a Web geralmente é um desafio do ponto de vista de rastreamento e raspagem. Nesta seção, você será apresentado a alguns conceitos básicos baseados em segurança. Exploraremos esses conceitos, juntamente com sua implementação, nas próximas seções.

As seções a seguir falarão sobre alguns conceitos ou conceitos habilitados para segurança que são vulneráveis à segurança. Esses conceitos podem ser implementados de forma independente e colaborativa em sites usando várias ferramentas ou medidas subjacentes.

## Processamento de formulários
Isso também é conhecido como processamento de `<form>` HTML, manipulação de formulários ou envio de formulários. Este método processa e trata dados dentro de um `<form>` HTML.

Do ponto de vista da segurança, o HTML `<form>` pode conter valores dinâmicos e ocultos ou gerados pelo sistema que gerenciam a validação, fornecem valor aos campos ou executam a implementação baseada em segurança durante o envio do formulário. Formulários com campos como `<input type="hidden"...>` podem não ser visíveis para os usuários nas páginas.

## Cookies e sessões
### Cookies
Cookies são dados gerados e armazenados por sites em seu sistema ou computador. Os dados nos cookies ajudam a identificar solicitações da web do usuário para o site. Os dados nos cookies são armazenados em pares `chave:valor`. Os dados armazenados em cookies ajudam os sites a acessar esses dados e transferir determinados valores salvos na forma de uma interação rápida.

Os cookies também permitem que os sites rastreiem perfis de usuários, seus hábitos na web e assim por diante, e usem essas informações para indexação, anúncios de página e atividades de marketing.

Os dados baseados em cookies podem durar uma sessão (ou seja, desde o momento em que uma página da Web é carregada até o fechamento do navegador) formando o que é conhecido como cookies de sessão, ou por dias, semanas ou meses, conhecidos como cookies permanentes ou armazenados. Os cookies também podem conter valores de expiração em segundos e são expirados ou excluídos do sistema uma vez decorrido o período de tempo expresso neste valor.

### Sessões
As sessões são propriedades que impõem a comunicação baseada em estado entre dois sistemas. Uma sessão é usada para armazenar informações do usuário temporariamente e também é excluída assim que o usuário sai do navegador ou sai do site.

Uma sessão é usada para manter a atividade de segurança. Um número de identificação exclusivo, também conhecido como ID de sessão ou chave de sessão, é gerado pelo site e é usado para rastrear seus usuários ou recursos baseados em segurança de forma independente. Na maioria dos casos de disponibilidade de sessão, ela também pode ser rastreada usando cookies.

### Autenticação de usuário
A autenticação do usuário lida com o manuseio e gerenciamento de processos de identificação baseados no usuário. Os sites oferecem o registro do usuário por meio de sua página de registro e, assim, coletam entradas do usuário para campos obrigatórios ou disponíveis. Os detalhes de um usuário são salvos em locais seguros, como bancos de dados baseados em nuvem ou servidor, ou qualquer outro sistema seguro.

Os usuários registrados são verificados e têm permissão para fazer login e logout de seu sistema e são identificados por seu nome de usuário, senha e endereço de e-mail.

Processamento de formulários, cookies, gerenciamento de sessões e outras medidas baseadas em segurança podem ser implementadas individualmente ou de forma colaborativa para este processo.

As seções deste módulo tratam de várias medidas e situações que podem ser implementadas ou que podem ser enfrentadas durante o web scraping.

## HTML \<form> processing

In [6]:
from pyquery import PyQuery as pq
import requests
mainurl = "http://toscrape.com/"
searchurl = "http://quotes.toscrape.com/search.aspx"
filterurl = "http://quotes.toscrape.com/filter.aspx"
quoteurl = "http://quotes.toscrape.com/"
authorTags = [('Albert Einstein', 'success'), ('Thomas A. Edison', 'inspirational')]

def processRequests(url, params={}, customheaders={}):
    if len(params) > 0:
	    response = requests.post(url, data=params, headers=customheaders)
    else:
        response = requests.get(url)
    return pq(response.text)

if __name__ == '__main__':
	for authorTag in authorTags:
		authorName,tagName= authorTag

		#Step 1: load searchURL
		searchResponse = processRequests(searchurl)
		author = searchResponse.find('select#author option:contains("' + authorName +'")').attr('value')
		viewstate = searchResponse.find('input#__VIEWSTATE').attr('value')
		tag = searchResponse.find('select#tag option').text()
		print("Author: ", author)
		print("ViewState: ", viewstate)
		print("Tag: ", tag)

Author:  Albert Einstein
ViewState:  MjQzZDZmOWI3ZjRhNGU0NDljODcxMDQzNWRhMGY5ZmUsQWxiZXJ0IEVpbnN0ZWluLEouSy4gUm93bGluZyxKYW5lIEF1c3RlbixNYXJpbHluIE1vbnJvZSxBbmRyw6kgR2lkZSxUaG9tYXMgQS4gRWRpc29uLEVsZWFub3IgUm9vc2V2ZWx0LFN0ZXZlIE1hcnRpbixCb2IgTWFybGV5LERyLiBTZXVzcyxEb3VnbGFzIEFkYW1zLEVsaWUgV2llc2VsLEZyaWVkcmljaCBOaWV0enNjaGUsTWFyayBUd2FpbixBbGxlbiBTYXVuZGVycyxQYWJsbyBOZXJ1ZGEsUmFscGggV2FsZG8gRW1lcnNvbixNb3RoZXIgVGVyZXNhLEdhcnJpc29uIEtlaWxsb3IsSmltIEhlbnNvbixDaGFybGVzIE0uIFNjaHVseixXaWxsaWFtIE5pY2hvbHNvbixKb3JnZSBMdWlzIEJvcmdlcyxHZW9yZ2UgRWxpb3QsR2VvcmdlIFIuUi4gTWFydGluLEMuUy4gTGV3aXMsTWFydGluIEx1dGhlciBLaW5nIEpyLixKYW1lcyBCYWxkd2luLEhhcnVraSBNdXJha2FtaSxBbGV4YW5kcmUgRHVtYXMgZmlscyxTdGVwaGVuaWUgTWV5ZXIsRXJuZXN0IEhlbWluZ3dheSxIZWxlbiBLZWxsZXIsR2VvcmdlIEJlcm5hcmQgU2hhdyxDaGFybGVzIEJ1a293c2tpLFN1emFubmUgQ29sbGlucyxKLlIuUi4gVG9sa2llbixBbGZyZWQgVGVubnlzb24sVGVycnkgUHJhdGNoZXR0LEouRC4gU2FsaW5nZXIsR2VvcmdlIENhcmxpbixKb2huIExlbm5vbixXLkMuIEZpZWxkcyxKaW1pIEhlbmRyaXgsSi5NLiBCYXJyaWUsRS5FLiBDdW1taW5