## Questionário 72 (Q72)

Orientações: 

- Registre suas respostas no questionário de mesmo nome no SIGAA.
- O tempo de registro das respostas no questionário será de 10 minutos. Portanto, resolva primeiro as questões e depois registre-as.
- Haverá apenas 1 (uma) tentativa de resposta.
- Submeta seu arquivo-fonte (utilizado para resolver as questões) em formato _.ipynb_ pelo SIGAA anexando-o à Tarefa denominada "Envio de arquivo" correspondente ao questionário.

*Nota:* o arquivo-fonte será utilizado apenas como prova de execução da tarefa. Nenhuma avaliação será feita quanto ao estilo de programação.

<hr>

Para responder às questões, leia o texto introdutório a seguir.

>Um ataque hacker ao portal do Governo Federal foi identificado após se descobrir na página https://www.gov.br/economia/pt-br/assuntos/processo-eletronico-nacional/conteudo/barramento-de-servicos/relacao-dos-orgaos-e-entidades, associada ao Ministério da Economia, que as _cache keys_ embutidas em alguns links resultavam em uma chave com 6 blocos de 4 dígitos que permitia o acesso furtivo a dados sigilosos.
>
>A atividade criminosa funcionava da seguinte forma:
>
>1. O hacker coletou cada _cache key_ existente no cabeçalho do arquivo .HTML dessa página exatamente nas vinculações aos arquivos .CSS. A _cache key_ é um número hexadecimal de 32 dígitos que aparece em um elemento `<link>`. No exemplo 
>```html
><link href="https://www.gov.br/economia/ ... cachekey-dac9630aec642a428cd73f4be0a03569.css"  ... />,
>```
> a cache key é o número `dac9630aec642a428cd73f4be0a03569`.
> 2. O hacker usava a _cache key_ como entrada para uma função decriptadora e obtinha um número de 4 dígitos.
> 3. Juntando as 6 _cache keys_ contidas na página, ele determinava uma sequência do tipo ####.####.####.####.####.####, que era usada para quebrar _firewalls_ e acessar os arquivos sigilosos.
>

Como especialista, você frustrou o ataque do hacker usando a função de decriptação dada por:
```python
def decrypt(Hash):
    return sum(map(lambda x: ord(x),Hash)),
```
onde `Hash` é uma _cache key_. Por exemplo:

```python
print(decrypt('dac9630aec642a428cd73f4be0a03569'))
2280
```


_Obs.:_ o relato acima é fictício.

**Questão 1.** Utilize raspagem de dados para coletar as 6 _cache keys_ contidas na página e determinar as 6 quádruplas que quebram o _firewall_ e assinale a alternativa que contém todas as quádruplas corretas, independentemente da ordem das _cache keys_ que os determinam.

A. 2184.1999.2200.1090.2215.2175

B. 1090.1999.2169.2215.2175.2184

***C. 2091.2169.1999.2184.2215.2175***

D. 2175.1999.2184.2215.1090.1010

<div class="alert alert-block alert-success">
<b>Resposta:</b> C. 2091.2169.1999.2184.2215.2175
</div>

In [1]:
import requests
import pandas as pd
from bs4 import BeautifulSoup
from urllib.parse import unquote
def decrypt(Hash):
    return sum(map(lambda x: ord(x), Hash))

In [2]:
url = requests.get("https://www.gov.br/economia/pt-br/assuntos/processo-eletronico-nacional/conteudo/barramento-de-servicos/relacao-dos-orgaos-e-entidades")

In [3]:
html = url.content
soup = BeautifulSoup(html,"html")

In [4]:
links = soup.find_all("link")
hashes = []
for link in links:
    if "cachekey" in str(link):
        hashes.append(str(link).split("cachekey-")[1][:32])

In [5]:
hashes_decrypt = []
for hash in hashes:
    hashes_decrypt.append(decrypt(hash))

a = [2184, 1999, 2200, 1090, 2215, 2175]
b = [1090, 1999, 2169, 2215, 2175, 2184]
c = [2091, 2169, 1999, 2184, 2215, 2175]
d = [2175, 1999, 2184, 2215, 1090, 1010]
alternativas = [a,b,c,d]
for idx, alternativa in enumerate(alternativas):
    if sorted(alternativa) == sorted(hashes_decrypt):
        print(f"Index #: {idx}")

Index #: 2


**Questão 2.** No corpo do arquivo HTML da página em questão, existem diversas âncoras (elementos da árvore DOM com a tag `<a>...</a>` com URLs que apontam para outros endereços no domínio do Ministério da Economia. Assinale a alternativa correta para o número de links contidos em `<body>` que iniciam pela raiz `https://www.gov.br/economia/pt-br`.

A. 502

***B. 499***

C. 400

D. 380

<div class="alert alert-block alert-success">
<b>Resposta:</b> B. 499
</div>

In [6]:
import re
len(soup.body.find_all('a', attrs={'href': re.compile("https://www.gov.br/economia/pt-br")}))

499

**Questão 3.** Marque a alternativa correta para o número de descendentes de `<body>` na árvore DOM correspondente ao arquivo HTML da página em questão.

***A. 5821***

B. 6000

C. 5800

D. 5994

<div class="alert alert-block alert-success">
<b>Resposta:</b> A. 5821
</div>

In [7]:
descendants = [desc for desc in soup.body.descendants]

In [8]:
len(descendants)

5821