<a href="https://colab.research.google.com/github/rtornai/adatkezelo/blob/main/03_Sample.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install faker faker_airtravel faker_vehicle

In [2]:
import random
from faker import Faker
from typing import List

In [3]:
from dataclasses import dataclass, field


@dataclass
class Person:
    id: str = field(hash=True)
    name: str = field(repr=True, compare=False)
    age: int = field(repr=True, compare=False)
    male: bool = field(default=True, repr=True, compare=False)

@dataclass
class Car:
    plate: str = field(hash=True)
    type: str = field(repr=True, compare=False)
    year: int = field(repr=True, compare=False)
    automatic: bool = field(default=True, repr=True, compare=False)


@dataclass
class Airport:
    code: str = field(hash=True)
    name: str = field(repr=True, compare=False)
    city: str = field(repr=True, compare=False)
    state: str = field(repr=True, compare=False)
    country: str = field(repr=True, compare=False)

Here’s a quick breakdown of what each part does:

id: str = field\(hash=True\): The id field is a string and is used for hashing.

name: str = field\(repr=True, compare=False\): The name field is a string and will be included in the string representation of the object but won’t be used for comparison.

age: int = field\(repr=True, compare=False\): The age field is an integer and will also be included in the string representation but not used for comparison.

male: bool = field\(default=True, repr=True, compare=False\): The male field is a boolean with a default value of True, included in the string representation but not used for comparison.

Definiálj egy generate_people() nevű függvényt a következők szerint:

A függvény megkap egy n nevű, int típusú paramétert.
A függvény egy olyan listát ad vissza, mely pontosan n darab, Person típusú elemet tartalmaz.
Az id mező értéke egyedi minden objektum esetén.
Az age mező értéke 18 és 100 közötti.
A male tulajdonság értéke egyelőre az alapértelmezett érték. Definiálj egy generate\_people\(\) nevű függvényt a következők szerint:

* A függvény megkap egy n nevű, int típusú paramétert.
* A függvény egy olyan listát ad vissza, mely pontosan n darab, Person típusú elemet tartalmaz.
* Az id mező értéke egyedi minden objektum esetén.
* Az age mező értéke 18 és 100 közötti.
* A male tulajdonság értéke egyelőre az alapértelmezett érték.



In [4]:
def generate_people(n: int) -> List[Person]:
    fake = Faker()
    return [Person(
        "P-" + (str(i).zfill(6)),
        fake.name(),
        random.randint(18, 100),
        True) for i in range(n)]

In [5]:
print(generate_people(10))

[Person(id='P-000000', name='Melody Cooper', age=80, male=True), Person(id='P-000001', name='Amy Coleman', age=78, male=True), Person(id='P-000002', name='Tara Summers', age=58, male=True), Person(id='P-000003', name='Donna Jordan', age=58, male=True), Person(id='P-000004', name='Sherri Murphy', age=20, male=True), Person(id='P-000005', name='Joseph Pearson', age=39, male=True), Person(id='P-000006', name='Jennifer Mcdaniel', age=97, male=True), Person(id='P-000007', name='Erika Smith', age=95, male=True), Person(id='P-000008', name='Trevor Manning', age=61, male=True), Person(id='P-000009', name='Gregory Cortez', age=43, male=True)]


Módosítsd a generate_people() nevű függvényt a következők szerint:

A male tulajdonság értéke helyesen generálódik. Ehhez szükség szerint keressünk egy új Faker metódust.



In [6]:
def generate_people(n: int) -> List[Person]:
    fake = Faker()
    people = []

    for i in range(n):
        male = random.random() < 0.5
        people.append(
            Person("P-" + (str(i).zfill(6)),
            fake.name_male() if male else fake.name_female(),
            random.randint(18, 100),
            male))

    return people

print(generate_people(5))

[Person(id='P-000000', name='Cody Lewis', age=53, male=True), Person(id='P-000001', name='Mrs. Kimberly Williams', age=97, male=False), Person(id='P-000002', name='Melissa Smith', age=97, male=False), Person(id='P-000003', name='Mrs. Alison Allen', age=22, male=False), Person(id='P-000004', name='Nicholas Robinson', age=89, male=True)]


Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény megkap egy male_ratio nevű, float típusú paramétert.
* A paraméter alapértelmezett értéke 0.5.
* A függvény az új paraméter értéke által jelzett valószínűséggel generál férfiakat.

In [7]:
def generate_people(n: int, male_ratio: float = 0.5) -> List[Person]:
    fake = Faker()
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            fake.name_male() if male else fake.name_female(),
            random.randint(18, 100),
            male))

    return people

print(generate_people(5))

[Person(id='P-000000', name='Lucas Hall', age=53, male=True), Person(id='P-000001', name='Tony Washington', age=91, male=True), Person(id='P-000002', name='Daniel Alvarado', age=62, male=True), Person(id='P-000003', name='Amy Trujillo', age=82, male=False), Person(id='P-000004', name='Christopher Jenkins', age=69, male=True)]


Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény megkap egy locale nevű, str típusú paramétert.
* A paraméter alapértelmezett értéke en_US.
* A függvény az új paraméter értékének megfelelő területi beállítással generál neveket.

In [8]:
def generate_people(n: int, male_ratio: float = 0.5, locale: str = "en_US") -> List[Person]:
    fake = Faker(locale)
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            fake.name_male() if male else fake.name_female(),
            random.randint(18, 100),
            male))

    return people

Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény megkap egy unique nevű, bool típusú paramétert.
* A paraméter alapértelmezett értéke False.
* A függvény az új paraméter True értéke esetén csupa különböző személynevet generál.

In [9]:
def generate_people(n: int, male_ratio: float = 0.5, locale: str = "en_US", unique: bool = False) -> List[Person]:
    fake = Faker(locale)
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        generator = fake if not unique else fake.unique
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            generator.name_male() if male else generator.name_female(),
            random.randint(18, 100),
            male))

    return people

Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény megkap egy min_age nevű, int típusú paramétert.
* A paraméter alapértelmezett értéke 0.
* A függvény úgy generálja a személyek életkorát, hogy azok nem kisebbek az új paraméter értékénél.

In [10]:
def generate_people(n: int, male_ratio: float = 0.5, locale: str = "en_US",
                unique: bool = False, min_age: int = 0) -> List[Person]:
    fake = Faker(locale)
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        generator = fake if not unique else fake.unique
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            generator.name_male() if male else generator.name_female(),
            random.randint(min_age, 100),
            male))

    return people

Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény megkap egy max_age nevű, int típusú paramétert.
* A paraméter alapértelmezett értéke 100.
* A függvény úgy generálja a személyek életkorát, hogy azok nem nagyobbak az új paraméter értékénél.

In [11]:
def generate_people(n: int, male_ratio: float = 0.5, locale: str = "en_US",
                unique: bool = False, min_age: int = 0, max_age: int = 100) -> List[Person]:
    fake = Faker(locale)
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        generator = fake if not unique else fake.unique
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            generator.name_male() if male else generator.name_female(),
            random.randint(min_age, max_age + 1),
            male))

    return people

Módosítsd a generate_people() nevű függvényt a következők szerint:

* A függvény csak akkor fut le, ha az n paraméter értéke pozitív.
* A függvény csak akkor fut le, ha a male_ratio egy helyes valószínűségi érték.
* A függvény csak akkor fut le, ha a min_age paraméter értéke nemnegatív.

In [12]:
def generate_people(n: int, male_ratio: float = 0.5, locale: str = "en_US",
                    unique: bool = False, min_age: int = 0, max_age: int = 100) -> List[Person]:
    assert n > 0
    assert 0 < male_ratio < 1
    assert min_age >= 0

    fake = Faker(locale)
    people = []

    for i in range(n):
        male = random.random() < male_ratio
        generator = fake if not unique else fake.unique
        people.append(Person(
            "P-" + (str(i).zfill(6)),
            generator.name_male() if male else generator.name_female(),
            random.randint(min_age, max_age + 1),
            male))

    return people

In [13]:
print(generate_people(5))
print(generate_people(n=5, locale="HU"))

[Person(id='P-000000', name='Jose Rivera', age=81, male=True), Person(id='P-000001', name='Alexander Davidson', age=14, male=True), Person(id='P-000002', name='Karla Thompson', age=67, male=False), Person(id='P-000003', name='Justin Hughes', age=21, male=True), Person(id='P-000004', name='Barbara Jenkins', age=35, male=False)]
[Person(id='P-000000', name='Kovács Zoltán', age=28, male=True), Person(id='P-000001', name='Dr. Veres István István', age=96, male=True), Person(id='P-000002', name='Deák Nikolett Erzsébet', age=41, male=False), Person(id='P-000003', name='Szabó Szilágyi Csilla', age=34, male=False), Person(id='P-000004', name='Dr. Hegedüsné Orosz Anita', age=10, male=False)]


In [14]:
from faker_airtravel import AirTravelProvider
from faker_vehicle import VehicleProvider

In [15]:
def generate_cars(n: int, automatic_ratio: float = 0.2, locale: str = "hu_HU", unique: bool = False,
                  min_year: int = 1950, max_year: int = 2021) -> List[Car]:
    assert n > 0
    assert 0 < automatic_ratio < 1
    assert 1950 <= min_year
    assert min_year <= max_year <= 2021

    fake_plate = Faker(locale)
    fake_plate.add_provider(VehicleProvider)
    if unique:
        fake_plate = fake_plate.unique
    fake_type = Faker()
    fake_type.add_provider(VehicleProvider)

    cars = []
    for i in range(n):
        automatic = random.random() < automatic_ratio
        cars.append(Car(
            fake_plate.license_plate(),
            fake_type.vehicle_make(),
            random.randint(min_year, max_year),
            automatic))

    return cars

print(generate_cars(5))

[Car(plate='LIQ-211', type='Eagle', year=1956, automatic=False), Car(plate='UZS-524', type='Mercedes-Benz', year=1958, automatic=False), Car(plate='NBN-651', type='Ford', year=1987, automatic=False), Car(plate='PSY-534', type='Jaguar', year=1951, automatic=True), Car(plate='ZJP-559', type='Kia', year=2020, automatic=True)]


In [16]:
def generate_airports(n: int, country: str = None, city: str = None,
                      unique: bool = False, attempts: int = None) -> List[Airport]:
    assert n > 0
    assert attempts is None or attempts >= n

    fake = Faker()
    fake.add_provider(AirTravelProvider)

    airports = []
    for i in range(n if attempts is None else attempts):
        values = fake.airport_object()

        actual = Airport(
            values["icao"],
            values["airport"],
            values["city"],
            values["state"],
            values["country"])

        if len(actual.code) == 0:
            continue
        if country is not None and country != actual.country:
            continue
        if city is not None and city != actual.city:
            continue
        if unique and actual in airports:
            continue

        airports.append(actual)

    return airports

print(generate_airports(5))

[Airport(code='SVMI', name='Simon Bolivar International airport', city='Catia la Mar', state='Vargas', country='Venezuela'), Airport(code='EIDW', name='Dublin airport', city='Cloghran', state='', country='Ireland'), Airport(code='ZBAA', name='Beijing Capital airport', city='Shunyi', state='Beijing', country='China'), Airport(code='SKMD', name='Olaya Herrera airport', city='Medellin', state='Antioquia', country='Colombia'), Airport(code='KGRR', name='Gerald R. Ford International airport', city='Grand Rapids', state='Michigan', country='United states')]
