![Alt Text](axpo-animated.gif)
# Witamy na rozmowie rekrutacyjnej
## na stanowisko: **Financial Data Analyst** w **Axpo Polska**

Cieszymy się, że zdecydowałeś/aś się wziąć udział w naszym procesie rekrutacyjnym. Przedstawiamy Ci case study, w którym będziesz mógł/mogła zaprezentować swoje umiejętności analityczne:

---

## Opis Case Study

W naszej bazie danych znajdują się trzy kluczowe tabele:

- **Customers**: Zawiera dane teleadresowe klientów, w tym imię, nazwisko, adres, numer telefonu i adres e-mail.
- **Usage**: Rejestruje odczyty dzienne zużyć mediów (energii elektrycznej i gazu) przez klientów.
- **Invoices**: Zawiera informacje o fakturach wystawionych klientom, w tym dane dotyczące zużycia oraz kwoty do zapłaty. Numery faktur są unikatowe, tak samo jak nazwy punktów poboru wewnątrz umowy. 

Twoim zadaniem jako analityka danych jest **sprawdzenie poprawności zafakturowania**. Podejrzewasz, że przynajmniej jedna faktura została wystawiona na podstawie błędnych danych dotyczących zużycia.

---

## Zadania do Wykonania
   - Wywołaj komórkę poniżej - wygeneruje ona unikatową bazę danych 
   - Przeanalizuj tabelę `invoices` i porównaj odnotowane zużycie z danymi zawartymi na fakturach w tabeli `usage`.
   - Znajdź konkretny przypadek (lub przypadki), w którym dane z tabeli `usage` nie odpowiadają wartościom na fakturze.
   - W przypadku wykrycia błędu wylistuj dane teleadresowe takich klientów 
   - Przygotuj zestawienie z danymi kontaktowymi, które zostanie przekazane do zespołu Customer Care, który skontaktuje się z klientem w celu wyjaśnienia sytuacji.
   - Zespół Customer Care chciałby otrzymać dane w pliku **csv**

## Dostępne narzędzia 

  - analizę możesz przeprowadzić używając pythona, sqla lub obu narzędzi jednocześnie 
  - możesz korzystać z internetu, ale nie używaj generatywnej AI
  - bardziej niż wynik oceniany będzie sposób jego osiągnięcia, płynność posługiwania się narzędziami i sposób myślenia 

## Podpowiedź

  - count(distinct bledne_przypadki) between 1 and 10 ---> True ;)
---

# Powodzenia! 


In [None]:
import sqlite3
import pandas as pd
from db_setup import setup_database, modify_random_usage

invoices, usage, customers = setup_database()
print("Przykładowe dane dotyczace faktur:")
display(invoices.head())
print("Konstrukcja kolumny Description z tabeli invoices")
display(invoices['Description'][0])

print("Przykładowe dane zużycia energii:")
display(usage.head())

print("Przykładowe dane klientów:")
display(customers.head())

random_index, random_customer_id, old_usage, new_usage, modified_record = modify_random_usage(usage)

conn = sqlite3.connect(':memory:')
invoices.to_sql('invoices', conn, index=False)
usage.to_sql('usage', conn, index=False)
customers.to_sql('customers', conn, index=False)
def sqlquery(query, conn = conn):
    return pd.read_sql_query(query, conn)

In [None]:
query = """
SELECT 
    u.* 
FROM 
    usage u
WHERE 
    1=1
    AND CustomerID = 'CU5940'
LIMIT 
    10
"""
sqlquery(query)