# Практические задания 13
* Лекция 26 - Работа с файловой системой
* Лекция 27 - Основы работы с файлами


### Анализ продаж по категориям и датам
Напишите программу, которая обрабатывает текстовый файл с данными о продажах.  
Используйте файл sales_data.txt.  
**Программа должна:**  
1. ***Принимать аргументы командной строки:***  
`python sales_report.py <input_file> <output_directory>`  
Где:  
   * `<input_file>` — путь к входному файлу с продажами.  
   * `<output_directory>` — папка, куда будут сохранены отчёты.  
2. ***Считать данные из текстового файла, в котором каждая строка содержит информацию в следующем формате:***  
`имя,дата,сумма,категория,город`  
Пример входных данных:
```
Olivia Suarez,2024-08-02,4565,Electronics,Dallas
Jennifer Jacobs,2023-08-19,4963,Automotive,London
Erin Johnson,2024-08-29,1796,Clothing,Miami
```
3. ***Сгруппировать данные по годам и месяцам, создавая для каждого года и месяца отдельную папку в указанной директории.
Создать общий отчёт по каждому месяцу (monthly_report.txt), в котором указана суммарная выручка по каждой категории и общая сумма:***
```
Automotive,109539
Books,133160
Clothing,102001
Electronics,79403
Groceries,104387
Home Appliances,99911
Sports,78782
Full,707183
```
4. ***Создать файлы для каждой категории товаров, в которых должны быть указаны все продажи по данной категории в формате:***  
`дата,имя продавца,сумма`  
Пример файла Electronics.txt:
```
2025-02-01,Cynthia Maddox,538
2025-02-01,Kendra Martinez,3799
2025-02-02,Rachel Miller,1097
```
5. ***Все записи в файле должны быть отсортированы по дате.***  
Пример запуска программы  
`python sales_report.py data/sales_data.txt reports`  
Пример созданной структуры
```
reports/
├── 2024/
│   ├── 12/
│   │   ├── monthly_report.txt
│   │   ├── Automotive.txt
├── 2025/
│   ├── 01/
│   │   ├── monthly_report.txt
│   │   ├── Clothing.txt
│   │   ├── Electronics.txt
│   ├── 02/
│   │   ├── monthly_report.txt
│   │   ├── Groceries.txt
│   │   ├── Sports.txt
```

In [None]:
'''
sales = [{name : Holly Cook, data : 2024-06-07, amount : 4107, category : Clothing, year : 2024, month : 07, day : 06} , ...]


grouped_sales = defaultdict({('2025', '03', 'Groceries'): [{'name': 'Stephen Hanson', 'date': '2025-03-01', 'amount': 3304, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '01'}, {'name': 'Bryan Morales', 'date': '2025-03-01', 'amount': 4866, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '01'}, {'name': 'David Walker', 'date': '2025-03-02', 'amount': 611, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '02'}],
                             ('2025', '03', 'Electronics'): [{'name': 'Angela Hahn', 'date': '2025-03-01', 'amount': 647, 'category': 'Electronics', 'year': '2025', 'month': '03', 'day': '01'}, {'name': 'Brian Wyatt', 'date': '2025-03-02', 'amount': 4089, 'category': 'Electronics', 'year': '2025', 'month': '03', 'day': '02'}, {'name': 'Elizabeth Curry', 'date': '2025-03-02', 'amount': 847, 'category': 'Electronics', 'year': '2025', 'month': '03', 'day': '02'}, {'name': 'Michael Gutierrez', 'date': '2025-03-01', 'amount': 1831, 'category': 'Electronics', 'year': '2025', 'month': '03', 'day': '01'}],
                             ...
                            })

category_totals = defaultdict({('2024', '06'): defaultdict({'Clothing': 111686, 'Books': 139334, 'Automotive': 104638, 'Groceries': 63201, 'Electronics': 97822, 'Sports': 94794, 'Home Appliances': 90418}),
                               ('2024', '03'): defaultdict({'Sports': 100167, 'Automotive': 138992, 'Clothing': 87318, 'Books': 121272, 'Home Appliances': 145551, 'Electronics': 77391, 'Groceries': 101169}),
                               ('2024', '12'): defaultdict({'Books': 109065, 'Automotive': 121071, 'Clothing': 116663, 'Groceries': 92477, 'Sports': 91302, 'Home Appliances': 88015, 'Electronics': 90498}),
                               ...
                              })
'''

In [5]:
with open('data/sales_data.txt', "r", encoding='utf-8') as file:
        lines = file.readlines() # ['Holly Cook,2024-06-07,4107,Clothing,New York\n', 'Amy Shah,2024-03-08,4490,Sports,Miami\n',...]
lines[1]

'Amy Shah,2024-03-08,4490,Sports,Miami\n'

In [17]:
import os
import sys
from collections import defaultdict

def write_category_reports(output_dir, grouped_sales):
    '''
    Создаем файлы с отчетами по категориям в формате "дата, продавец, сумма" сортируя по дате.
    '''
    for (year, month, category), records in grouped_sales.items(): #grouped_sales = defaultdict({('2025', '03', 'Groceries'): [{'name': 'Stephen Hanson', 'date': '2025-03-01', 'amount': 3304, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '01'}, 
        category_file = os.path.join(output_dir, year, month, f'{category}.txt')
        os.makedirs(os.path.dirname(category_file), exist_ok=True)

        #сортировка
        sorted_records = sorted(records, key=lambda x: x['date'])

        with open(category_file,'w', encoding = 'utf-8') as file:
            for record in sorted_records:
                file.write(f'{record['date']}, {record['name']}, {record['amount']}\n')
        


def read_sales_data(input_file: str) -> list[dict]:
    """
    Чтение данных и представление в виде списка словарей
    
    return:
    Список словарей 
    [{name : ...,
    data :...,
    amount : ...,
    category : ...,
    year : ...,
    month : ...,
    day : ...},...]
    """
    with open(input_file, "r", encoding='utf-8') as file:
        lines = file.readlines() # ['Holly Cook,2024-06-07,4107,Clothing,New York\n', 'Amy Shah,2024-03-08,4490,Sports,Miami\n',...]
    sales = []
    for line in lines:
        parts = line.split(',')
        name, date, amount, category, city = parts
        year, month, day = date.split('-')
        sales.append({
            'name': name,
            'date': date,
            'amount': int(amount),
            'category': category,
            'year': year,
            'month': month,
            'day': day
        })
    return sales
        


def process_sales_data(input_file: str, output_dir:str)-> None:
    '''
    Реализация записии сгруппированных данных в выходную директорию
    '''
    sales = read_sales_data(input_file)

    grouped_sales = defaultdict(list)
    category_totals = defaultdict(lambda: defaultdict(int))

    for record in sales:  # [{name : Holly Cook, data : 2024-06-07, amount : 4107, category : Clothing, year : 2024, month : 07, day : 06} , ...]     
        key = (record['year'], record['month'], record['category'])
        grouped_sales[key].append(record) #{('2025', '03', 'Groceries'): [{'name': 'Stephen Hanson', 'date': '2025-03-01', 'amount': 3304, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '01'}, {'name': 'Bryan Morales', 'date': '2025-03-01', 'amount': 4866, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '01'}, {'name': 'David Walker', 'date': '2025-03-02', 'amount': 611, 'category': 'Groceries', 'year': '2025', 'month': '03', 'day': '02'}],
        category_totals[(record['year'], record['month'])][record['category']] += record['amount']

    write_category_reports(output_dir, grouped_sales)
    write_mouthly_reports(output_dir, category_totals)
        

    

In [None]:
'''
category_totals = defaultdict({('2024', '06'): defaultdict({'Clothing': 111686, 'Books': 139334, 'Automotive': 104638, 'Groceries': 63201, 'Electronics': 97822, 'Sports': 94794, 'Home Appliances': 90418}),
                               ('2024', '03'): defaultdict({'Sports': 100167, 'Automotive': 138992, 'Clothing': 87318, 'Books': 121272, 'Home Appliances': 145551, 'Electronics': 77391, 'Groceries': 101169}),
                               ('2024', '12'): defaultdict({'Books': 109065, 'Automotive': 121071, 'Clothing': 116663, 'Groceries': 92477, 'Sports': 91302, 'Home Appliances': 88015, 'Electronics': 90498}),
                               ...
                              })
'''

In [18]:


input_file = 'data/sales_data.txt'
output_dir = 'reports'

process_sales_data(input_file, output_dir)

defaultdict(<function process_sales_data.<locals>.<lambda> at 0x0000015BA06D1DA0>, {('2024', '06'): defaultdict(<class 'int'>, {'Clothing': 111686, 'Books': 139334, 'Automotive': 104638, 'Groceries': 63201, 'Electronics': 97822, 'Sports': 94794, 'Home Appliances': 90418}), ('2024', '03'): defaultdict(<class 'int'>, {'Sports': 100167, 'Automotive': 138992, 'Clothing': 87318, 'Books': 121272, 'Home Appliances': 145551, 'Electronics': 77391, 'Groceries': 101169}), ('2024', '12'): defaultdict(<class 'int'>, {'Books': 109065, 'Automotive': 121071, 'Clothing': 116663, 'Groceries': 92477, 'Sports': 91302, 'Home Appliances': 88015, 'Electronics': 90498}), ('2024', '11'): defaultdict(<class 'int'>, {'Groceries': 125400, 'Clothing': 106395, 'Automotive': 108688, 'Home Appliances': 73443, 'Electronics': 73198, 'Books': 75998, 'Sports': 71083}), ('2024', '08'): defaultdict(<class 'int'>, {'Clothing': 125933, 'Books': 125980, 'Sports': 109992, 'Automotive': 104982, 'Home Appliances': 108100, 'Groce