# PreorderMe - pomocnik do generowania listy zamówień

<div style="text-align: center;">
  <img src="logo.png" width="350" height="500">
</div>

## Specyfikacja / Specs

* Aplikacja pomaga określić rodzaj i liczbę produktów do zamówienia w danym preorderze
* Tabela do zamówienia składa się z informacji: rodzaj ubrania, numer katalogowy, liczba sztuk (z podziałem na rozmiary)
* Użytkownik wgrywa katalog producenta (.pdf), a aplikacja generuje z niego dane o obecnej kolekcji (dataframe: rodzaj ubrania, numer katalogowy, przeznaczenie, kolor)
* Użytkownik wgrywa historyczny raport (.xls), na podstawie którego aplikacja określa tendencje dla danych produktów
* Użytkownik określa budżet na zamówienie
* Aplikacja generuje raport z listą produktów do zamówienia na bieżący okres w danym budżecie

W początkowych wersjach aplikacja skupi się na zamawianiu getrów firmy Adidas:

<div style="text-align: center;">
  <img src="getrymilano.png" width="700" height="590">
</div>

## Architektura

#### Architektura aplikacji

```plaintext
[INPUT] ─────────► [KATALOG .pdf]
                        │
                        ▼
             [Model klasyfikacji obrazów]
                - Clarifai (ubranie + kolor + ID (OCR))
                - PyMuPDF (zamiana PDF → obrazy)
                        │
                        ▼
           [DataFrame: typ, kolor, ID, rozmiary]

[INPUT] ─────────► [HISTORYCZNE RAPORTY .xls]
                        │
                        ▼
            [Model regresji (np. PyCaret)]
                - prognozy zapotrzebowania
                        │
                        ▼
          [DataFrame: ID, trendy, popyt, sezon]

[INPUT] ─────────► [BUDŻET użytkownika]

                        ▼
   [Algorytm optymalizacji doboru produktów]
        - pulp
        - wybiera najlepsze ID w budżecie
                        │
                        ▼
        [Lista produktów do zamówienia]

                        ▼
     [Generowanie raportu]
          - np. wykresy dla danych produktów, trendy
                        │
                        ▼
[OUTPUT] ◄──────────── [Raport]


## Plan / Taski
* 1 - wgranie katalogu w .pdf + generowanie danych o produktach + wyświetlenie tabeli (na początek dla getrów), sprawdzenie - EDA (describe, czy model się nie pomylił itd.)
* 2 - wgranie historycznego raportu + przygotowanie danych (EDA, preprocessing)
* 3 - trenowanie modelu regresyjnego (dobór modelu, dobór hyperparameters)
* 4 - użycie modelu do określenia liczby produktów do zakupu dla danego rodzaju (metryki, ocena modelu, ocena dla różnych hiperparametrów, wnioski)
* 5 - wyświetlenie raportu + wykresy
* 6 - uwzględnienie budżetu
### Extras
* 7 - Streamlit
* 8 - Dane w chmurze
* 9 - Porządkowanie danych w bazie danych
* 10 - Automatyczne ETL

## Zależności
* `streamlit` - do budowy interfejsu użytkownika.
* `dotenv` - do przechowywania klucza clarifai.
* `pandas` - do pracy na dataframe.
* `pdf2image` - do przetworzenia .pdf na .jpeg lub .png (zainstalować poppler for Windows)
* `clarifai` - do klasyfikacji ubrań, detekcji, koloru i OCR.
* `pycaret` - do budowy modelu ML.
* `pulp` - do optymalizacji budżetu.
* `seaborn` - do wizualizacji wyników.

## Instalacja

- otwórz terminal  
- uruchom `conda activate od_zera_do_ai`  
- uruchom `conda config --append channels conda-forge`  
- uruchom `conda install -y streamlit python-dotenv pandas pdf2image seaborn pulp`  
- uruchom `pip install clarifai pycaret`  
- jeśli używasz Windowsa, pobierz i wypakuj Poppler z `https://github.com/oschwartz10612/poppler-windows/releases`  
- dodaj ścieżkę do folderu `poppler-xx\Library\bin` do zmiennej środowiskowej `PATH`  
- jeśli używasz Maca, uruchom `brew install poppler` 