# Задача 6: Анализ почтового архива

Анализ файла mbox для определения самых активных авторов писем

In [None]:
import requests
from collections import defaultdict

url = input("Введите URL файла mbox (или нажмите Enter для использования по умолчанию): ").strip()
if not url:
    url = 'http://www.py4inf.com/code/mbox.txt'

try:
    print("Загружаем данные с сервера...")
    response = requests.get(url, timeout=30)
    response.raise_for_status()
    mbox = response.text
    all_lines = mbox.split('\n')
    
    print(f"Загружено {len(all_lines)} строк")
    
except requests.RequestException as e:
    print(f"Ошибка загрузки: {e}")
    all_lines = []

In [None]:
if all_lines:
    author_counts = defaultdict(int)
    from_lines = 0
    
    for line in all_lines:
        if line.startswith("From "):
            from_lines += 1
            parts = line.split()
            if len(parts) >= 2:
                email = parts[1]
                author_counts[email] += 1
    
    print(f"Найдено {from_lines} строк с 'From '")
    print(f"Найдено {len(author_counts)} уникальных авторов")

In [None]:
if all_lines and author_counts:
    try:
        top_n = int(input("Сколько топ авторов показать (по умолчанию 10): ") or "10")
        if top_n < 1 or top_n > 100:
            top_n = 10
    except ValueError:
        top_n = 10
    
    sorted_authors = sorted(author_counts.items(), key=lambda x: x[1], reverse=True)
    
    print(f"Топ-{top_n} самых активных авторов:")
    for i, (email, count) in enumerate(sorted_authors[:top_n], 1):
        print(f"{i:2d}. {email}: {count} писем")

In [None]:
if all_lines and author_counts and sorted_authors:
    most_active_author = sorted_authors[0]
    total_emails = sum(count for _, count in author_counts.items())
    percentage = (most_active_author[1] / total_emails) * 100
    
    print(f"\nСамый активный автор:")
    print(f"Email: {most_active_author[0]}")
    print(f"Количество писем: {most_active_author[1]}")
    print(f"Процент от общего количества: {percentage:.1f}%")
    print(f"Общее количество писем в архиве: {total_emails}")