# Lista de Exercícios - Projetos

--> [Link da Lista](https://wiki.python.org.br/ListaDeExercicios) <--

---

1. Controle de cotas de disco. A ACME Inc., uma organização com mais de 1500 funcionários, está tendo problemas de espaço em disco no seu servidor de arquivos. Para tentar resolver este problema, o Administrador de Rede precisa saber qual o espaço em disco ocupado pelas contas dos usuários, e identificar os usuários com maior espaço ocupado. Através de um aplicativo baixado da Internet, ele conseguiu gerar o seguinte arquivo, chamado usuarios.txt:


alexandre       456123789
anderson        1245698456
antonio         123456456
carlos          91257581
cesar           987458
rosemary        789456125
Neste arquivo, o primeiro campo corresponde ao login do usuário e o segundo ao espaço em disco ocupado pelo seu diretório home. A partir deste arquivo, você deve criar um programa que gere um relatório, chamado relatório.txt, no seguinte formato:


ACME Inc.           Uso do espaço em disco pelos usuários
------------------------------------------------------------------------
Nr.  Usuário        Espaço utilizado     % do uso

1    alexandre       434,99 MB            16,85%
2    anderson       1187,99 MB            46,02%
3    antonio         117,73 MB             4,56%
4    carlos           87,03 MB             3,37%
5    cesar             0,94 MB             0,04%
6    rosemary        752,88 MB            29,16%

Espaço total ocupado: 2581,57 MB
Espaço médio ocupado: 430,26 MB
O arquivo de entrada deve ser lido uma única vez, e os dados armazenados em memória, caso sejam necessários, de forma a agilizar a execução do programa. A conversão da espaço ocupado em disco, de bytes para megabytes deverá ser feita através de uma função separada, que será chamada pelo programa principal. O cálculo do percentual de uso também deverá ser feito através de uma função, que será chamada pelo programa principal.
Recursos adicionais: opcionalmente, desenvolva as seguintes funcionalidades:

Ordenar os usuários pelo percentual de espaço ocupado;
Mostrar apenas os n primeiros em uso, definido pelo usuário;

Gerar a saída numa página html;
Criar o programa que lê as pastas e gera o arquivo inicial;
2. Analisador de logs do Apache. Desenvolva um analisador de log do Apache que mostre quais as strings de pesquisa do google que mais levam internautas para o site da sua organização.

3. Analisador de logs do Squid: sites bloqueados. Desenvolva um analisador de log do Squid que mostre quais os sites mais bloqueados em uma organização.

In [6]:
#Projeto 1
import os

def bytes_para_megabytes(bytes_valor):
  return bytes_valor / (1024 * 1024)

def percentual_uso(espaco_utilizado, espaco_total):
  return (espaco_utilizado / espaco_total) * 100

def gerar_relatorio(usuarios, n=None, ordenar_por_percentual=False):
  espaco_total = sum(espaco for _, espaco in usuarios)
  espaco_medio = espaco_total / len(usuarios)
  usuarios_processados = []

  for i, (usuario, espaco) in enumerate(usuarios):
    espaco_mb = bytes_para_megabytes(espaco)
    percentual = percentual_uso(espaco, espaco_total)
    usuarios_processados.append((i + 1, usuario, espaco_mb, percentual))

  if ordenar_por_percentual:
    usuarios_processados.sort(key=lambda x: x[3], reverse=True)

  if n:
    usuarios_processados = usuarios_processados[:n]

  relatorio = []
  relatorio.append('ACME Inc.           Uso do espaço em disco pelos usuários')
  relatorio.append('------------------------------------------------------------------------')
  relatorio.append('Nr.  Usuário        Espaço utilizado     % do uso')

  for nr, usuario, espaco_mb, percentual in usuarios_processados:
    relatorio.append(f'{nr:<4} {usuario:<15} {espaco_mb:>10.2f} MB      {percentual:>7.2f}%')

  relatorio.append('\nEspaço total ocupado: {:.2f} MB'.format(bytes_para_megabytes(espaco_total)))
  relatorio.append('\nEspaço médio ocupado: {:.2f} MB'.format(bytes_para_megabytes(espaco_medio)))

  with open('relatório.txt', 'w') as arquivo:
    arquivo.write('\n'.join(relatorio))
  print('Relatório gerado: relatório.txt')

  gerar_relatorio_html(usuarios_processados, espaco_total, espaco_medio)

def gerar_relatorio_html(usuarios_processados, espaco_total, espaco_medio):
  html = []
  html.append('<!DOCTYPE html>')
  html.append("<html lang='pt-br'>")
  html.append('<head>')
  html.append("<meta charset='UTF-8'>")
  html.append('<title>Relatório de Uso de Disco</title>')
  html.append('</head>')
  html.append('<body>')
  html.append('<h1>ACME Inc. - Uso do espaço em disco pelos usuários</h1>')
  html.append("<table border='1'>")
  html.append('<tr><th>Nr.</th><th>Usuário</th><th>Espaço utilizado (MB)</th><th>% do uso</th></tr>')

  for nr, usuario, espaco_mb, percentual in usuarios_processados:
    html.append(
        f'<tr><td>{nr}</td><td>{usuario}</td><td>{espaco_mb:.2f}</td><td>{percentual:.2f}%</td></tr>'
    )

  html.append('</table>')
  html.append('<p>Espaço total ocupado: {:.2f} MB</p>'.format(bytes_para_megabytes(espaco_total)))
  html.append('<p>Espaço médio ocupado: {:.2f} MB</p>'.format(bytes_para_megabytes(espaco_medio)))
  html.append('</body>')
  html.append('</html>')

  with open('relatorio.html', 'w') as arquivo_html:
    arquivo_html.write('\n'.join(html))
  print('Relatório gerado: relatorio.html')

def ler_arquivo_usuarios(caminho):
  usuarios = []
  with open(caminho, 'r') as arquivo:
    for linha in arquivo:
      partes = linha.strip().split()
      usuario = partes[0]
      espaco_ocupado = int(partes[1])
      usuarios.append((usuario, espaco_ocupado))
  return usuarios

def main():
  caminho_arquivo = 'usuarios.txt'
  if not os.path.exists(caminho_arquivo):
    print(f'Arquivo {caminho_arquivo} não encontrado.')
    return

  usuarios = ler_arquivo_usuarios(caminho_arquivo)

  ordenar_por_percentual = input('Deseja ordenar os usuários por percentual de uso? (s/n) ').lower() == 's'
  n = input('Deseja mostrar apenas os N primeiros usuários? (deixe em branco para mostrar todos): ')
  n = int(n) if n.isdigit() else None

  gerar_relatorio(usuarios, n, ordenar_por_percentual)

if __name__ == '__main__':
  main()

Deseja ordenar os usuários por percentual de uso? (s/n) s
Deseja mostrar apenas os N primeiros usuários? (deixe em branco para mostrar todos): 
Relatório gerado: relatório.txt
Relatório gerado: relatorio.html


In [19]:
#Projeto 2
import re
from urllib.parse import parse_qs, urlparse
from collections import Counter

def extrair_pesquisa_google(linha):
  match = re.search(r'"GET .*? HTTP.*?" "https?://www\.google\..*?\?(.*?)"', linha)
  if match:
    query_string = match.group(1)
    parametros = parse_qs(query_string)
    if 'q' in parametros:
      return parametros['q'][0]
  return None

def analisar_log(caminho_arquivo):
  pesquisas = []

  with open(caminho_arquivo, 'r') as arquivo:
    for linha in arquivo:
      pesquisa = extrair_pesquisa_google(linha)
      if pesquisa:
        pesquisas.append(pesquisa)
  return pesquisas

def gerar_relatorio(pesquisas, top_n=10):
  contador = Counter(pesquisas)
  mais_comuns = contador.most_common(top_n)

  print('\nStrings de pesquisa mais comuns que redirecionam para o site:')
  print('------------------------------------------------------------------------')
  print(f"{'String de pesquisa':<50} {'Ocorrências':>10}")
  print('------------------------------------------------------------------------')
  for pesquisa, ocorrencias in mais_comuns:
    print(f'{pesquisa:<50} {ocorrencias:>10}')

def main():
  caminho_log = input('Informe o caminho para o arquivo de log do Apache: ')
  try:
    pesquisas = analisar_log(caminho_log)
    if not pesquisas:
      print('Nenhuma string de pesquisa do Google foi encontrada no log.')
      return

    gerar_relatorio(pesquisas)

  except FileNotFoundError:
    print(f"Erro: O arquivo '{caminho_log}' não foi encontrado.")
  except Exception as e:
    print(f'Ocorreu um erro: {e}')

if __name__ == '__main__':
   main()

Informe o caminho para o arquivo de log do Apache: acesso.txt

Strings de pesquisa mais comuns que redirecionam para o site:
------------------------------------------------------------------------
String de pesquisa                                 Ocorrências
------------------------------------------------------------------------
confi                                                       1


In [27]:
#Projeto 3
import re
from collections import Counter

def extrair_sites_bloqueados(linha):
  match = re.search(r"ERR_ACCESS_DENIED.*?://(.*?)/", linha)
  if match:
    return match.group(1)
  return None

def analisar_logs_squid(caminho_arquivo):
  sites_bloqueados = []

  with open(caminho_arquivo, 'r') as arquivo:
    for linha in arquivo:
      site = extrair_sites_bloqueados(linha)
      if site:
        sites_bloqueados.append(site)
  return sites_bloqueados

def gerar_relatorio(sites_bloqueados, top_n=10):
  contador = Counter(sites_bloqueados)
  mais_bloqueados = contador.most_common(top_n)

  print('\nSites mais bloqueados:')
  print('------------------------------------------------------------------------')
  print(f"{'Site':<50} {'Bloqueios':>10}")
  print('------------------------------------------------------------------------')
  for site, bloqueios in mais_bloqueados:
    print(f'{site:<50} {bloqueios:>10}')

def main():
  caminho_log = input('Informe o caminho para o arquivo de log do Squid: ')
  try:
    sites_bloqueados = analisar_logs_squid(caminho_log)
    if not sites_bloqueados:
      print('Nenhum site bloqueado foi encontrado no log.')
      return

    gerar_relatorio(sites_bloqueados)

  except FileNotFoundError:
    print(f"Erro: O arquivo '{caminho_log}' não foi encontrado.")
  except Exception as e:
    print(f'Ocorreu um erro: {e}')

if __name__ == '__main__':
  main()

Informe o caminho para o arquivo de log do Squid: acesso.txt
Nenhum site bloqueado foi encontrado no log.
