# Курсовая работа по дисциплине СиАОД №1

## Выполнил студент группы БВТ2101 Козей Михаил Александрович
***

# Задание

Написать программу, которая будет считывать данные из CSV файла, содержащего
информацию о продажах товаров в магазине. Данные в файле содержатся в следующем
формате:
<br>| Номер заказа | Дата заказа | Название товара | Категория товара | Количество продаж | Цена
за единицу | Общая стоимость |
<br>Необходимо:
1. Рассчитать общую выручку магазина.
2. Найти товар, который был продан наибольшее количество раз.
3. Найти товар, который принес наибольшую выручку.
4. Составить отчет, содержащий информацию об общей выручке магазина, количестве
проданных единиц каждого товар и доле каждого товара в общей выручке.
Для решения задач необходимо использовать структуры данных, такие как массивы и
хеш-таблицы, а также различные алгоритмы обработки данных, например, сортировку и поиск.
Также необходимо учитывать возможные ошибки ввода-вывода и обрабатывать их в
соответствии с требованиями.

***
# Записки сумасшедшего

# Шаги для  решения задачки:
<ol>
    <li>Импортировать библиотеку для работы с CSV файлами.</li>
    <li>Открыть CSV файл и считать данные в массив или хеш-таблицу.</li>
    <li>Создать переменную для хранения общей выручки магазина и проинициализировать ее нулем.</li>
    <li>Создать хеш-таблицу, где ключ будет названием товара, а значение - количеством продаж и общей выручкой для этого товара.</li>
    <li>Проитерироваться по каждой строке CSV файла и обновить значения хеш-таблицы в соответствии с данными из текущей строки.</li>
    <li>Вычислить общую выручку магазина, просуммировав общую стоимость из каждой строки CSV файла.</li>
    <li>Найти товар, который был продан наибольшее количество раз, пройдя по значениям хеш-таблицы и выбрав тот, у которого количество продаж максимально.</li>
    <li>Найти товар, который принес наибольшую выручку, пройдя по значениям хеш-таблицы и выбрав тот, у которого общая выручка максимальна.</li>
    <li>Создать отчет, содержащий информацию об общей выручке магазина, количестве проданных единиц каждого товара и доле каждого товара в общей выручке.</li>
    <li>Закрыть файл и обработать возможные ошибки ввода-вывода в соответствии с требованиями.</li>
</ol>

***

# Выполнение

In [1]:
# Импорты
import csv
from collections import defaultdict
import pandas as pd

### Шаг 1
Читаем с файла

In [2]:
tablitsa = []
with open('table.csv', encoding='UTF-8') as f:
    reader = csv.reader(f)
    for row in reader:
        tablitsa.append(row)

### Шаг 2
Составляем хэш-таблицу, где ключ — наименование товара, а значение — количество проданных единиц товара и общая выручка

In [3]:
sales_by_product = {} # хеш-таблица (ключ — товар; значение — количество продаж и общая выручка товара)
# Проходим циклом по всем строкам массива, начиная со второй строки
for row in tablitsa[1:]:
    # Разбиваем строку на отдельные элементы
    order_number, order_date, product_name, category, quantity, price, total_price = row[0].split(';')

    # Извлекаем из строки необходимые данные
    product_name = product_name.strip()
    quantity = int(quantity)
    price = int(price)

    # Если товар уже есть в словаре продаж по товару, увеличиваем количество продаж и общую выручку
    if product_name in sales_by_product:
        sales_by_product[product_name][0] += quantity
        sales_by_product[product_name][1] += quantity * price
    # Если товара нет в словаре продаж по товару, создаем новую запись
    else:
        sales_by_product[product_name] = [quantity, quantity * price]


### Шаг 3
Проходим по всей таблице в поисках наибольших значений по количеству продаж, а также общей выручке. Параллельно расчитываем всю выручку магазина

In [4]:
# Total_revenue = 0 # общая выручка
# max_sales = 0
# max_revenue = 0
# for product, sales_data in sales_by_product.items():
#     quantity_sold, total_revenue = sales_data
#     Total_revenue  += total_revenue
#     if quantity_sold > max_sales:
#         best_product_sold = product
#         max_sales = quantity_sold
#     if total_revenue > max_revenue:
#         best_product_revenue = product
#         max_revenue = total_revenue

In [8]:
def binary_search(sales_by_product, low, high, key):
    while low <= high:
        mid = (low + high) // 2
        if key in sales_by_product[mid]:
            return mid
        elif key < sales_by_product[mid]:
            high = mid - 1
        else:
            low = mid + 1
    return -1

# сортируем данные о продажах по выручке
sorted_sales = sorted(sales_by_product.items(), key=lambda x: x[1][1], reverse=True)

# находим продукт с максимальной выручкой
best_product_revenue = sorted_sales[0][0]
max_revenue = sorted_sales[0][1][1]

# находим продукт с максимальным количеством продаж
best_product_sold = sorted(sales_by_product.items(), key=lambda x: x[1][0], reverse=True)[0][0]
max_sales = sales_by_product[best_product_sold][0]

# находим общую выручку
Total_revenue = sum([sales_data[1] for sales_data in sales_by_product.values()])

### Шаг 4
Подготавливаем данные для вывода отчётности через Pandos

In [6]:
products = []
solds =[]
revenues = []
dolya = []

for product, sales_data in sales_by_product.items():
    quantity_sold, total_revenue = sales_data
    products.append(product)
    solds.append(quantity_sold)
    revenues.append(total_revenue)
    dolya.append(total_revenue/Total_revenue*100)





# Создаем DataFrame из списков
df = pd.DataFrame({
    'Товар': products,
    'Количество проданных единиц': solds,
    'Выручка': revenues,
    'Доля в общей выручке %':  dolya
})

# Устанавливаем 'Товар' как индекс для удобства чтения таблицы
df = df.set_index('Товар')
pd.set_option('display.width', 1000)

#### Вывод

In [7]:
print(df)
print("\n")
print(f"Общая выручка:", Total_revenue)
print(f"Лучший товар: {best_product_sold} (с количеством продаж {max_sales})")
print(f"Лучший товар: {best_product_revenue} (с общей выручкой {max_revenue})")

                               Количество проданных единиц   Выручка  Доля в общей выручке %
Товар                                                                                       
Apple iPhone 14                                        500  44995000               18.595319
Samsung Galaxy S22 Ultra                               300  29997000               12.397017
Игровые приставки                                      200  11998000                4.958476
LG OLED TV                                             150  26998500               11.157811
Apple MacBook Pro 16                                   100  19999000                8.265091
Canon EOS R7                                            50  12499500                5.165734
Bose QuietComfort 55                                   100   3499000                1.446050
Samsung Galaxy Tab S8                                   75   5249250                2.169385
DJI Mavic 3                                             25   3749750  