## Wczytywanie potrzebnych bibliotek.

In [1]:
import pandas as pd
import pathlib as path
import numpy as np
import datetime as dt
import calendar
from string import digits

# Gęstość rozkładu N(m, sd).
norm_dens : callable = lambda t, m, sd : 1/np.sqrt(2*np.pi * sd**2) * np.exp(-((t-m)/sd)**2)

digits:list[str] = list(digits)
today: dt.date = dt.date.today()


### Odczytywanie popularnych imion i nazwisk żeńskich i męskich.

In [2]:
# Znajdź katalog z imionami i nazwiskami.
name_dir_path: path.Path = path.Path().cwd()/"Imiona i nazwiska"

# Znajdź  katalog, gdzie zapisujemy wszystkie tabele .csv.
csv_tables_dir_path: path.Path = path.Path().cwd()/"Tabele_csv"


def read_names(first_names_file:str, last_names_file:str, dir_path:path.Path) -> tuple[pd.Series, pd.Series]:
    """Funkcja odczytuje pliki zawierające najpopularniejsze polskie imiona i nazwiska. Wczytuje je do szeregu danych typu pandas"""
    # Odczytaj imiona oraz nazwiska.
    first_names: pd.DataFrame = pd.read_excel(dir_path/first_names_file  ,"Arkusz1",
                                                usecols = [0,2]
                                                )
    last_names: pd.DataFrame = pd.read_excel(dir_path/last_names_file, "Arkusz1",
                                                nrows = 5_000) # Wierszy w arkuszu jest bardzo dużo (ponad 380 000). 
                                                                # Odczytaj tylko pewną część wierszy.
                                                                

    # Bierzemy pod uwagę jedynie najpopularniejsze imiona i nazwiska.
    first_names = first_names.loc[first_names["LICZBA_WYSTĄPIEŃ"] > 500, "IMIĘ_PIERWSZE"]
    last_names = last_names.loc[last_names["Liczba"] > 500, "Nazwisko aktualne"] 

    # Skróc nazwy kolumn.
    first_names.columns = ['imię']
    last_names.columns = ['nazwisko']

    return first_names, last_names

# Wczytaj męskie imiona i nazwiska.
male_first_names, male_last_names = read_names("imiona_meskie.xlsx", "nazwiska_meskie.xlsx", name_dir_path)

# Wczytaj żęńskie imiona i nazwiska.
female_first_names, female_last_names = read_names("imiona_zenskie.xlsx", "nazwiska_zenskie.xlsx", name_dir_path)


### Generujące funkcje pomocnicze.

In [3]:
def generate_birthday() -> dt.datetime:
    # Wygeneruj wiek z rozkładu normalnego. Pamiętaj, że osoba musi być przynajmniej pełnoletnia i maksymalnie 100 letnia.
    birth_year: int =  today.year - np.random.randint(18, 100,)

    birth_month:int = np.random.randint(1, 13) # Wygeneruj miesiąc urodzenia.

    birth_day = calendar.monthrange(birth_year, birth_month)[1] # Znajdź dzień urodzenia (zgodny z liczbą dni w miesiącu)

    birthday = dt.date(birth_year, birth_month, birth_day) # Złóż wszystkie składowe urodzin w jedną date.

    return birthday



def generate_email(first_name:str, last_name:str, domains:list[str]) -> str:
    email:str = first_name.lower() + last_name.lower() + "".join(np.random.choice(digits, 3)) +"@"+ np.random.choice(domains)

    return email



def generate_phone_number() -> str:
    # Wygeneruj losowy numer telefonu nie zaczynający się od 0.
    phone_number:np.array = np.random.choice(digits, 9)

    # Jeżeli wylosowaliśmy zero, podmień cyfrę.
    if phone_number[0] == "0":
        phone_number[0] = np.random.choice(digits[1:])

    phone_number: str = "".join(phone_number)

    return phone_number


def insert_id_col(people_data:pd.DataFrame, col_name:str) -> pd.DataFrame:
    people_data.insert(loc = 0,column = col_name,
                       value = range(1, people_data.shape[0]+1))
    
    return people_data


def merge_females_and_males(female_data:pd.DataFrame, male_data:pd.DataFrame, id_col_name:str) ->pd.DataFrame:
    people_data_df : pd.DataFrame = pd.concat(objs = [female_data, male_data], axis = 0).reset_index(drop = True)

    people_data_df : pd.DataFrame = insert_id_col(people_data_df, id_col_name)

    return people_data_df


def chance_of_being_student(age:float):
    """
    Oblicza szansę na bycie studentem w zależności od wieku.

    Parametry:
        age (int): Wiek osoby.

    Zwraca:
        float: Szansa na bycie studentem (od 0.0 do 1.0).
    """
    if age < 20 or age > 35:
        return 0.0
    else:
        return 1 - (age - 20) / 15  # Liniowe zmniejszanie szansy




### Tworzenie danych osobowych pracowników.

In [4]:
def generate_worker_personal_data(first_names:pd.Series, last_names:pd.Series, trades_n:dict[str,int], email_domains:str) -> pd.DataFrame:
    """Funkcja generuje dane osobiste pracowników. Tworzone są wiersze imię, nazwisko, numer telefonu oraz adres e-mail firmowy.

    """
    # Przygotuj wyjściową ramkę danych.
    workers_df: pd.DataFrame = pd.DataFrame(data = {"imię":pd.Series(dtype = pd.StringDtype()),
                                                    "nazwisko": pd.Series(dtype = pd.StringDtype()), 
                                                    "stanowisko":pd.Series(dtype = pd.CategoricalDtype(categories = ["kierowca","przewodnik"],
                                                                                                  ordered = False
                                                                                                  )),
                                                    "numer telefonu":pd.Series(dtype = pd.StringDtype()), 
                                                    "adres email": pd.Series(dtype = pd.StringDtype())},                                           
    )

    id: int = 0
    for pos in trades_n:
        for _ in range(trades_n[pos]):
            first_name_idx:int = np.random.randint(0, first_names.shape[0])
            last_name_idx:int = np.random.randint(0, last_names.shape[0])

            first_name:str = first_names[first_name_idx].capitalize() # Wylosuj imię
            last_name:str = last_names[last_name_idx].capitalize()  # Wylosuj nazwisko.

            # Wygeneruj losowy numer telefonu nie zaczynający się od 0.
            phone_number:np.array = np.random.choice(digits, 9)

            # Jeżeli wylosowaliśmy zero, podmień cyfrę.
            if phone_number[0] == "0":
                phone_number[0] = np.random.choice(digits[1:], 1)[0]

            phone_number: str = "".join(phone_number)

            # Stwórz email dla tego pracownika
            random_domain = np.random.choice(email_domains)
            email:str = first_name.lower() + last_name.lower() + "".join(np.random.choice(digits, 3)) +"@" + random_domain
            

            workers_df.loc[id, :] = [first_name, last_name, pos ,phone_number, email]

            id += 1

    return workers_df





# Dwa razy więcej przewodników niż mężczyzn.
female_drivers : int = 15
females_guides: int = 2*female_drivers

male_drivers:int = 25
male_guides = 2*male_drivers

female_trades_n: dict[str, int] = {"przewodnik":females_guides, 
                                   "kierowca":female_drivers}

male_trades_n: dict[str, int] = {"przewodnik":male_guides, 
                                 "kierowca":male_guides}


# Wygeneruj dane osobiste dla pracowniczek
email_domains:list[str] = ["nowowiejska.com"]

female_workers_df : pd.DataFrame = generate_worker_personal_data(female_first_names, female_last_names, female_trades_n, email_domains)

male_workers_df : pd.DataFrame = generate_worker_personal_data(male_first_names, male_last_names, male_trades_n, email_domains)

# Połącz kobiecych i męskich pracowników.
workers_data_df : pd.DataFrame = merge_females_and_males(female_workers_df, male_workers_df, "id_pracownika")


# Zapisz dane pracowników do pliku .csv.
workers_data_df.to_csv(path_or_buf = csv_tables_dir_path/"Pracownicy_db.csv",
                    sep = ";", index = False)



## Tworzenie danych osobowych klientów.

In [None]:
def generate_client_personal_data(first_names:pd.Series, last_names:pd.Series, n:int) -> pd.DataFrame:
    """Funkcja generuje dane osobiste klientów. Tworzone są wiersze imię, nazwisko, data urodzenia, numer telefonu i adres e-mail, status studenta.

    """
    # Przygotuj wyjściową ramkę danych.
    clients_df: pd.DataFrame = pd.DataFrame(data = {"imię":pd.Series(dtype = pd.StringDtype()),
                                                    "nazwisko": pd.Series(dtype = pd.StringDtype()), 
                                                    "data_urodzenia":pd.Series(dtype = "datetime64[ns]"),
                                                    "zniżka": pd.Series(dtype = pd.Float32Dtype()),
                                                    "numer telefonu":pd.Series(dtype = pd.StringDtype()), 
                                                    "adres email": pd.Series(dtype = pd.StringDtype()),
                                                    "status_studenta":pd.Series(dtype = pd.Int8Dtype())}                                          
    )

    clients_df["data_urodzenia"] = clients_df['data_urodzenia'].dt.date

    # Lista domen emailowych.
    email_domains:list[str] = ['gmail.com', "wp.pl", "onet.pl"]


    for id in range(n):
        first_name_idx:int = np.random.randint(0, first_names.shape[0])
        last_name_idx:int = np.random.randint(0, last_names.shape[0])

        first_name:str = first_names[first_name_idx].capitalize() # Wylosuj imię
        last_name:str = last_names[last_name_idx].capitalize()  # Wylosuj nazwisko.

        
        # Wygeneruj losowy numer telefonu nie zaczynający się od 0.
        phone_number:str = generate_phone_number()

        # Stwórz email dla tego klienta
        email:str = generate_email(first_name, last_name, email_domains)
        
        
        # Zmyśl datę urodzenia dla tego klienta. Wszyscy muszą być pełnoletni i zakładamy, że żyją maksymalnie 100 lat.
        birthday = generate_birthday()
        
        age: int = (today-birthday).days/365

        # Czy jest studentem
        is_student: int = np.random.binomial(1, chance_of_being_student(age))
     
        # Ustal zniżkę w zależności od wieku.
        if is_student:
            discount = 0.49
        else:
            if age >= 70:
                discount = 0.5
            elif age >= 60:
                discount = 0.65
            elif age >= 50:
                discount = 0.75
            elif age >= 40:
                discount = 0.85
            elif age >= 30:
                discount = 0.9
            else:
                discount = 1
    

        clients_df.loc[id, :] = [first_name, last_name, birthday, discount,phone_number, email, is_student]

    return clients_df

        

n_female_clients: int = 250
n_male_clients:int = 400

female_clients_df : pd.DataFrame = generate_client_personal_data(female_first_names, female_last_names, n_female_clients)
male_clients_df : pd.DataFrame = generate_client_personal_data(male_first_names, male_last_names, n_male_clients)

clients_df = merge_females_and_males(female_clients_df, male_clients_df, "ID_klienta")


clients_df.to_csv(path_or_buf = csv_tables_dir_path/"Klienci_db.csv",
                    sep = ";", index = False)


### Tworzenie tabeli Miasta oraz Atrakcje_w_miescie

In [61]:
def generate_cities_and_city_attraction_df():
    # Wczytaj plik wycieczki.csv
    all_info_trip = pd.read_csv(csv_tables_dir_path/"wycieczki.csv",
                                sep = ";", 
                                encoding = "ISO 8859-2").drop(columns = "Liczba_atrakcji")


    # Dodaj kolumne ID_miasta.
    all_info_trip.insert(0, "ID_miasta", range(1, all_info_trip.shape[0]+1))

    # Podziel nazwę miasta na miasto oraz kraj.
    cities_countries_df : pd.DataFrame = all_info_trip["Miasto"].str.split(", ", expand = True)
    
    # Wybierz miasta i odpowiadające im kraje.
    city_df : pd.DataFrame = cities_countries_df[0]
    country_df : pd.DataFrame = cities_countries_df[1]

    # Dodaj miasto i kraj do osobnych kolumn
    all_info_trip["Miasto"] = city_df
    all_info_trip["Kraj"] = country_df



    # Następnie zwiń listę atrakcji do listy.
    all_info_trip.loc[:, "Atrakcja"] = all_info_trip["Atrakcja"].str.split(", ")

    # Teraz atrakcje z jednej listy przenieś do kolejnych wierszy.
    allinfo_longer_df = all_info_trip.explode("Atrakcja")

    # Dodaj kolumnę ID_atrakcje.
    allinfo_longer_df.insert(1, "ID_atrakcji", range(1, allinfo_longer_df.shape[0]+1))

    # Przygotuj tabelę z miastami do zapisu do pliku csv
    city_table :pd.DataFrame = allinfo_longer_df[["ID_miasta","Miasto","Cena","Matematyk","Dlugosc_wycieczki"]].drop_duplicates("ID_miasta")
    city_table["Dlugosc_wycieczki"] = pd.to_timedelta(city_table["Dlugosc_wycieczki"], "d")

    # Zapisz tabelę do pliku csv.
    city_table.to_csv(csv_tables_dir_path/"Miasta_db.csv",
                      sep = ';',
                      encoding = "utf-8",
                      index = False)
    
    
    # Teraz przygotuj ramkę z atrakcjami do zapisu.
    attraction_df : pd.DataFrame = allinfo_longer_df[['ID_atrakcji', "ID_miasta", "Atrakcja"]]

    attraction_df.to_csv(csv_tables_dir_path/"Atrakcje_db.csv",
                      sep = ';',
                      encoding = "utf-8",
                      index = False)
    
    



generate_cities_and_city_attraction_df()

### Generowanie bliskich osób.

In [7]:
def generate_one_relative(first_names:pd.Series, last_names:pd.Series, id:int):
    """Funkcja generuje jedną osobę bliską dla ustalonego klienta"""
    first_name:str = np.random.choice(first_names)
    last_name:str = np.random.choice(last_names)

    phone_number: str = generate_phone_number()
    email = generate_email(first_name, last_name, ["gmail.com", "wp.pl", "onet.pl"])

    return (id,first_name, last_name, phone_number, email)



def generate_relatives():
    klienci:pd.DataFrame = pd.read_csv(csv_tables_dir_path/"Klienci_db.csv",
                          sep = ";",
                          encoding = "utf-8", usecols=["ID_klienta"])
    
    klienci_id:pd.Series = klienci["ID_klienta"]
    
    relationship_df : pd.DataFrame = pd.DataFrame(data = {"ID_klienta":pd.Series(dtype = pd.Int16Dtype()),
                                                          "ID_osoby_bliskiej":pd.Series(dtype = pd.Int16Dtype())})
    
    relatives_df: pd.DataFrame = pd.DataFrame(data = {"ID_osoby_bliskiej":pd.Series(dtype = pd.Int16Dtype()),
                                                        "imię":pd.Series(dtype = pd.StringDtype()),
                                                        "nazwisko": pd.Series(dtype = pd.StringDtype()), 
                                                        "numer telefonu":pd.Series(dtype = pd.StringDtype()), 
                                                        "adres email": pd.Series(dtype = pd.StringDtype())}) # id klienta, z którym dana osoba ma związek.


    how_many_relatives:pd.DataFrame = pd.DataFrame(data = {"ID_klienta":klienci_id,
                                                        "n_relatives":np.zeros(klienci_id.shape[0])}
                                                        )


    id: int = 1 # Identyfikator osoby bliskiej.
    i: int  = 0 # Identyfikator wiersza w ramce relationship_df.


    for id_klienta in klienci_id:
        n_relatives = np.random.randint(1, 4) # Wygeneruj, ilu bliskich może mieć dana osoba.

        for _ in range(n_relatives):
            gender_draw = np.random.uniform(0, 1)

            if gender_draw > 0.5: # Jeżeli tak jest, losujemy kobietę.
                relative = generate_one_relative(female_first_names, female_last_names, id_klienta)
            else: # Jeżeli nie, losujemy mężczyzne
                relative = generate_one_relative(male_first_names, male_last_names, id_klienta)

            # Połącz relacją bliskości 'relative' oraz 'id_klienta'
            relatives_df.loc[id, :] = relative
            relationship_df.loc[i, :] = (id_klienta, id)
            
            how_many_relatives.loc[id_klienta-1, "n_relatives"] += 1

            i += 1

            # Teraz wygeneruj kilku innych klientów, z którymi ta osoba bliska będzie w relacji
        
            # Znajdź potencjalnych klientów, z którym może się zaprzyjaźnic ustalona osoba bliska.
            potential_players_id = (how_many_relatives["ID_klienta"]!=id_klienta) & (how_many_relatives["n_relatives"] < 4)
            potential_players = how_many_relatives.loc[potential_players_id, :]
            
            # Ustal, z iloma osoba dana osoba będzie w relacji bliskości.
            n_clients:int = min(np.random.randint(0, 3), potential_players_id.shape[0])

            for inne_id_klienta in potential_players['ID_klienta'].sample(n_clients):
                relationship_df.loc[i, :] = (inne_id_klienta, id)
                
                i += 1

            id +=1
    

    # Zapisz ramkę z krewnymi do csv.
    relatives_df.to_csv(csv_tables_dir_path/"Osoby_bliskie_db.csv",
                      sep = ';',
                      encoding = "utf-8",
                      index = False)
    
    # Zapisz ramkę z relacjiami do csv.
    relationship_df.to_csv(csv_tables_dir_path/"Relacje_bliskości_db.csv",
                      sep = ';',
                      encoding = "utf-8",
                      index = False)
    

    
generate_relatives()

### Tworzenie tabeli z wynagrodzeniami.

In [8]:
def create_salary_table():

    salary_df:  pd.DataFrame = pd.DataFrame(data = {"stanowisko":pd.Series(dtype =pd.StringDtype()),
                                                    "wynagrodzenie":pd.Series(dtype = pd.Float64Dtype())
                                                    })
    
    salary_df.loc[0, :] = ["przewodnik", 1200]
    salary_df.loc[1, :] = ["kierowca",800]


    salary_df.to_csv(csv_tables_dir_path/"Wynagrodzenie_db.csv",
                      sep = ';',
                      encoding = "utf-8",
                      index = False)
    

create_salary_table()

### Generowanie tabeli planowanych wycieczek, tabeli transakcji.

In [65]:
def generate_startday() -> dt.datetime:
    year: int =  np.random.randint(today.year -2, today.year) # Wylosuj rok odbycia się wyjazdu.

    month:int = np.random.randint(6, 10) # Wygeneruj miesiąc wyjazdu.

    day = calendar.monthrange(year, month)[1] # Znajdź dzień urodzenia (zgodny z liczbą dni w miesiącu)

    return dt.date(year, month, day) 

    

def generate_trip_tables():
    # Wczytaj tabelę zawierającą listę możliwych destynacji.
    cities_df: pd.DataFrame = pd.read_csv(csv_tables_dir_path/"Miasta_db.csv",
                                          sep = ";", 
                                          encoding = "utf-8")
    
    # Wczytaj tabele z klientami.
    clients_df: pd.DataFrame = pd.read_csv(csv_tables_dir_path/"Klienci_db.csv",
                                           sep = ";",
                                           encoding = "utf-8")
    
    clients_df["data_urodzenia"] = pd.to_datetime(clients_df["data_urodzenia"])   
   

    # Stwórz tabele opisującą planowane wyjazdy.
    planned_trips_df: pd.DataFrame = pd.DataFrame(data = {"ID_wycieczki":pd.Series(dtype = pd.Int32Dtype()),
                                                       "data_rozpoczecia":pd.Series(dtype = "datetime64[ns]"),
                                                       "odbyła_się":pd.Series(dtype = pd.BooleanDtype())
                                                       ,"ID_miasta":pd.Series(dtype = pd.Int32Dtype())})
    
    # Zbuduj tabelę zapisującą zrealizowane transakcje.
    transaction_df:pd.DataFrame =  pd.DataFrame(data = {"ID_transakcja":pd.Series(dtype = pd.Int32Dtype()),
                                         "kwota":pd.Series(dtype = pd.Float64Dtype()),
                                         "data":"datetime64[ns]",
                                         "ID_klienta":pd.Series(dtype = pd.Int32Dtype()),
                                         "ID_wycieczki":pd.Series(dtype = pd.Int32Dtype())
                                         })

    

    n_trips: int = np.random.randint(low = 5, high = 10) # Określ liczbę planowanych wyjazdów.
    transaction_id:int = 1 # Identyfikator danej transakcji.

    for trip_id in range(1, n_trips+1):
        # Wylosuj datę rozpoczęcia się wyjazdu.
        trip_startdate:dt.date = generate_startday()

        # Ustal, w jakim okresie klienti mogą opłacać bilet.
        trans_period_start : dt.date = trip_startdate - dt.timedelta(30)
        trans_period_end : dt.date = trip_startdate - dt.timedelta(7)

        trans_period:dt.date = pd.date_range(trans_period_start, trans_period_end, freq = "1d").date

       

        # Wylosuj  (maksymalną) liczbę podróżniczych.
        n_client_range: tuple[int, int] = ( min(30, clients_df.shape[0]), min(100, clients_df.shape[0]) )

        n_max_clients: int = np.random.randint(n_client_range[0],
                                            n_client_range[1]+1)
        
        # Licznik faktycznej liczby klientów.
        n_client_fact: int = 0
       
        # Wylosuj miasto, do którego idziemy.
        city_id: int = cities_df["ID_miasta"].sample().values[0]

        # Znajdź rekord opisujący wylosowane miasto.
        city_record:pd.DataFrame = cities_df.loc[ cities_df["ID_miasta"] == city_id, ["ID_miasta", "Cena","Dlugosc_wycieczki"]]
        ticket_price: float = city_record["Cena"].values[0]

        
        # Znajdź odpowiednią liczbę róznych klientów.
        clients_ids:pd.Series = clients_df["ID_klienta"].sample(n_max_clients, replace = False)


        # Dodanie każdego klienta rozważ indywidualnie.
        for client_id in clients_ids:
            # Znajdź rekord opisujący danego klienta.
            client_record: pd.DataFrame = clients_df.loc[clients_df["ID_klienta"] == client_id, :]

            # Policz jego wiek.
            client_age:float = (trip_startdate - client_record["data_urodzenia"].dt.date.values[0]).days/365

            

            # Upewnij się, że osoba jest pełnoletnia.
            if client_age >= 18: 
                # Znajdź wszystkie transakcje związane z tym klientem.
                client_transaction:pd.DataFrame = transaction_df.loc[transaction_df["ID_klienta"] == client_id, :]

                # Znajdź znizkę przysługującą temu klientowi.
                discount: float = client_record["zniżka"].values[0]

                # Policz cenę przecenionego biletu.
                discounted_ticket: float = round(discount * ticket_price, 2)

                # Wylosuj datę zawarcia transakcji.
                transaction_date: dt.date = np.random.choice(trans_period)


                    
                # Jeżeli klient nie dokonywał jeszcze żadnych transakcji, dodaj go do tabeli od razu.
                if client_transaction.shape[0] == 0:
                    transaction_df.loc[transaction_id, :] = [transaction_id, discounted_ticket,
                                                             transaction_date, client_id, trip_id]
                    
                    transaction_id +=1
                    n_client_fact += 1

                else:
                    # W przeciwnym wypadku, znajdź wycieczki, w których brał udzial (czyli takie, za które zapłacił i KTÓRE SIĘ ODBYŁY!).git/

                    # Znajdź wszystkie wycieczki, na które zapisał się dany klient.
                    client_trip_ids: pd.DataFrame = client_transaction["ID_wycieczki"]

                    client_trips:pd.DataFrame = planned_trips_df.merge(right = client_trip_ids, on = "ID_wycieczki")

                    # Teraz znajdź wycieczki klienta, które się odbyły.
                    client_taken_trips : pd.DataFrame = client_trips.loc[client_trips["odbyła_się"] == True, :]

                    # Jeżeli wszystkie wycieczki, na które zapisał się dany klient, się nie odbyły, dopisz klienta do tabeli transakcje.
                    if client_taken_trips.shape[0] == 0:
                        transaction_df.loc[transaction_id, :] = [transaction_id, discounted_ticket,
                                                                transaction_date, client_id, trip_id]
                        
                        transaction_id +=1
                        n_client_fact += 1
                    
                    else:
                        # Dowiedz się, kiedy skończyły się wycieczki, w których klient brał udział.
                        client_taken_trips_with_time: pd.DataFrame =client_taken_trips.merge(cities_df, on = "ID_miasta")[["data_rozpoczecia", "Dlugosc_wycieczki"]]
                        
                        
                        


                        break



        # Określ, czy wycieczka się odbyła na podstawie liczby klientów.
        if n_client_fact >= np.sum(n_client_range)/2:
            took_place: bool = True
        else:
            took_place: bool = False

        planned_trips_df.loc[trip_id, :] = (trip_id, trip_startdate, took_place, city_id)
        

    
   
generate_trip_tables()    

  planned_trips_df.loc[trip_id, :] = (trip_id, trip_startdate, took_place, city_id)


data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
data_rozpoczecia     object
Dlugosc_wycieczki    object
dtype: object
