In [None]:
!pip install Faker
!pip install Unidecode

In [2]:
import pandas as pd
import numpy as np
from faker import Faker
from datetime import datetime
import random
import re
from dateutil.relativedelta import relativedelta
from unidecode import unidecode

In [3]:
fake = Faker(["el_GR"])

class Greek_Citizen:
    def __init__(self):

        self.sex = random.choice(["F", "M"])

        if self.sex == 'F':
            self.first_name = fake.first_name_female()
            self.last_name = fake.last_name_female()
        else:
            self.first_name = fake.first_name_male()
            self.last_name = fake.last_name_male()

        self.full_name = self.first_name + ' ' + self.last_name
        
        self.father_name = fake.first_name_male()
        self.mother_first_name = fake.first_name_female()
        self.mother_last_name = fake.last_name_female()

        self.address = fake.address()
        self.birthdate = fake.date_of_birth(minimum_age=10, maximum_age=110)
        self.city_of_birth = fake.city()
        self.region_of_birth = fake.region()
        self.country = 'Greece'
        self.nationality = 'Ελλάδα' if random.random() > .1 else fake.country()
        
        # address
        self.region = fake.region()
        self.city = fake.city()
        self.street = fake.street()
        self.postcode = fake.postcode()
        self.building_number = fake.building_number()

        self.id_number = fake.police_id()
        self.id_publish_date = fake.date_between(start_date='-15y', end_date='today')
        self.citizen_id = '{} {}/{}'.format(self.city, fake.bothify(text='#####'), fake.random_digit_not_null())

        # passport
        self.passport_number = fake.bothify(text='??#######', letters='ABCDEFGHIJKLMNOPQRSTUVWXYZ') # https://www.google.gr/search?tbm=isch&q=passport+greece
        self.passport_publish_date = fake.date_between(start_date='-5y', end_date='today')
        self.passport_expiration_date = self.passport_publish_date + relativedelta(years=5, days=-1)

        # health insurance
        self.health_insurance_publish_date = fake.date_between(start_date='-15y', end_date='today')
        self.health_insurance_expiration_date = self.passport_publish_date + relativedelta(years=3, days=-1)


        # medical history
        self.disability_record = None if random.random() > .2 else random.choice(
        ["Blindness", "Low-vision", "Leprosy", "Hearing impairment", "Locomotor Disability", "Dwarfism",
        "Intellectual Disability", "Mental Illness", "Autism Spectrum Disorder (ASD)", "Cerebral Palsy (CP)",
        "Muscular Dystrophy (MD)", "Chronic Neurological Condition", "Specific Learning Disability",
        "Multiple Sclerosis (MS)", "Speech and Language Disability", "Thalassemia", "Hemophilia",
        "Sickle Cell Disease", "Multiple Disabilitt", "Acid Attack Victim", "Parkinson’s disease"]) # https://wecapable.com/types-of-disabilities-list/

        self.disability_rate = random.random() if self.disability_record else None


        # proof of income  -- https://i.pinimg.com/736x/63/84/4b/63844b5a06461dfa6c3852924ab6e52e.jpg
        self.company = fake.company()
        self.work_start_date = fake.date_between(start_date='-15y', end_date='today')
        self.work_position = fake.job()
        self.salary = random.random()*10000


        # school records
        self.school_certificate_date = self.birthdate + relativedelta(years=18, days=random.randint(1,100))
        self.school_certificate_id = '{}-{}'.format(fake.bothify(text='####'), self.school_certificate_date)
        self.school_certificate_grade_value = round(random.random()*10 + 10, 1) # range [10,20]
        self.ssn = fake.ssn()
        self.ssn_country = 'Ελλάδα' if random.random() > .1 else fake.country()
        self.tin = fake.bothify(text='#########') # AFM --- https://vathygalazio.files.wordpress.com/2013/03/vatlidator2-2.png



    def getID(self):
        return {
            'Αριθμός Δελτίου Ταυτότητας': self.id_number,
            'Ημερομηνία Έκδοσης': self.id_publish_date.strftime('%d/%m/%Y'),
            'Όνομα': self.first_name,
            'Given Name': unidecode(self.first_name),
            'Επώνυμο': self.last_name,
            'Surname': unidecode(self.last_name),
            'Όνομα Πατέρα': self.father_name,
            'Όνομα Mητέρας': self.mother_first_name,
            'Επώνυμο Μητέρας': self.mother_last_name,
            'Ημερομηνία Γέννησης': self.birthdate.strftime('%d/%m/%Y'),
            'Τόπος Γέννησης': '{} {}'.format(self.region_of_birth, self.city_of_birth),
            'Ύψος': '-',
            'Δημότης': self.citizen_id,
            'Αρχή Έκδοσης Δελτίου Ταυτότητας': 'Υ.Α. {} {}'.format(self.city_of_birth, self.region_of_birth),
        }

    def getBirthdate(self):
        return { 'Ημερομηνία Γέννησης': self.birthdate.strftime('%d/%m/%Y') }

    def getPassport(self):
        return {
            'Τύπος': 'P',
            'Αριθμός Διαβατηρίου': self.passport_number,
            'Όνομα': self.first_name,
            'Name': unidecode(self.first_name),
            'Επώνυμο': self.last_name,
            'Surname': unidecode(self.last_name),
            'Φύλο': self.sex,
            'Ιθαγένεια': self.nationality,
            'Ημερομηνία Γέννησης': self.birthdate.strftime('%d/%m/%Y'),
            'Τόπος Γέννησης': self.city_of_birth,
            'Place of Birth': unidecode(self.city_of_birth),
            'Ημ. Έκδοσης': self.passport_publish_date.strftime('%d/%m/%Y'),
            'Ημ. Λήξης': self.passport_expiration_date.strftime('%d/%m/%Y'),
        }

    def getHealthInsurance(self):
        return {
            'Αριθμός Δελτίου Ταυτότητας': self.id_number,
            'Όνομα': self.first_name,
            'Επώνυμο': self.last_name,
            'Φύλο': self.sex,
            'Τόπος Γέννησης': self.city_of_birth,
            'Ημερομηνία Γέννησης': self.birthdate.strftime('%d/%m/%Y'),
            'Όνομα Πατέρα': self.father_name,
            'Ιθαγένεια': self.nationality,
            'Ημ. Έκδοσης': self.health_insurance_publish_date.strftime('%d/%m/%Y'),
            'Ημ. Λήξης': self.health_insurance_expiration_date.strftime('%d/%m/%Y'),
        }

    def getMedicalHistory(self):
        return {
            'Αριθμός Δελτίου Ταυτότητας': self.id_number,
            'Όνομα': self.first_name,
            'Επώνυμο': self.last_name,
            'Αναπηρία': self.disability_record,
            'Ποσοστό Αναπηρίας': self.disability_rate
        }

    def getProofOfIncome(self):
        return {
            'Αριθμός Δελτίου Ταυτότητας': self.id_number,
            'Όνομα': self.first_name,
            'Επώνυμο': self.last_name,
            'Εταιρεία': self.company,
            'Ημ. Έναρξης': self.work_start_date,
            'Θέση Εργασίας': self.work_position,
            'Μισθός': self.salary
        }

    def getSchoolCertificate(self):
        return {
            'Αριθμός Δελτίου Ταυτότητας': self.id_number,
            'Όνομα': self.first_name,
            'Name': unidecode(self.first_name),
            'Επώνυμο': self.last_name,
            'Surname': unidecode(self.last_name),
            'Όνομα Πατέρα': self.father_name,
            'Father Name': unidecode(self.father_name),
            'Όνομα Mητέρας': self.mother_first_name,
            'Mother Name': unidecode(self.mother_first_name),
            'Ημερομηνία Γέννησης': self.birthdate.strftime('%d/%m/%Y'),
            'Αριθμός Πρωτοκόλλου': self.school_certificate_id,
            'Ημ. Έκδοσης': self.school_certificate_date,
            'Βαθμός': self.school_certificate_grade_value,
            'Αριθμός Κοινωνικής Ασφάλισης': self.ssn,
            'Χώρα Ασφάλισης': self.ssn_country,
            'Αριθμός Φορολογικού Μητρώου (ΑΦΜ)': self.tin
        }


In [4]:
citizens = [Greek_Citizen() for _ in range(100)]

In [5]:
IDs = [citizen.getID() for citizen in citizens]
pd.DataFrame(IDs)

Unnamed: 0,Αριθμός Δελτίου Ταυτότητας,Ημερομηνία Έκδοσης,Όνομα,Given Name,Επώνυμο,Surname,Όνομα Πατέρα,Όνομα Mητέρας,Επώνυμο Μητέρας,Ημερομηνία Γέννησης,Τόπος Γέννησης,Ύψος,Δημότης,Αρχή Έκδοσης Δελτίου Ταυτότητας
0,Γ 799970,05/10/2007,Δομήνικος,Domenikos,Ταβερναράκης,Tabernarakes,Πελοπίδας,Πολυχρονία,Αβραμπέκη,04/01/1990,Σέρρες Πάτρα,-,Πολύγυρος 52255/5,Υ.Α. Πάτρα Σέρρες
1,Η 022160,12/02/2011,Γαβριέλλα,Gabriella,Καραμπίνα,Karampina,Αβραάμ,Δούκισσα,Φίλκα,30/06/1945,Αχαΐα Ναύπλιο,-,Λαμία 98611/7,Υ.Α. Ναύπλιο Αχαΐα
2,ΠΘ935433,07/08/2006,Αυξέντιος,Auxentios,Πέτσας,Petsas,Ίων,Εύα,Νικολουδάκη,23/02/2002,Ρέθυμνο Αθήνα,-,Γρεβενά 89442/9,Υ.Α. Αθήνα Ρέθυμνο
3,Κ 188908,11/09/2011,Μάρθα,Martha,Θεοδοσίου,Theodosiou,Τιμολέων,Ζωή,Γρηγοροπούλου,14/08/1978,Αρκαδία Άμφισσα,-,Μεσολόγγι 68202/9,Υ.Α. Άμφισσα Αρκαδία
4,ΚΕ198323,26/05/2015,Θεοχάρης,Theokhares,Φωτογλίδης,Photoglides,Μαρίνος,Σεραφεία,Σκυλογιάννη,22/07/2003,Αιτωλία & Ακαρνανία Ιωάννινα,-,Καλαμάτα 60075/8,Υ.Α. Ιωάννινα Αιτωλία & Ακαρνανία
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,ΟΤ925780,21/08/2008,Ανατολή,Anatole,Τσαμπαλή,Tsampale,Διογένης,Σεμίνα,Κωνσταντοπούλου,07/01/1963,Ροδόπη Σάμος,-,Λιβαδιά 19841/7,Υ.Α. Σάμος Ροδόπη
96,ΦΝ010448,14/05/2017,Αδαμάντιος,Adamantios,Κουλίδης,Koulides,Θεολόγος,Αθηνά,Κανελλή,21/09/1911,Αργολίδα Καρπενήσι,-,Μυτιλήνη 42800/8,Υ.Α. Καρπενήσι Αργολίδα
97,Ξ 044457,13/11/2019,Πάρις,Paris,Σμαρδάς,Smardas,Μαυροειδής,Γεωργία,Φιλιάγκου,06/05/1964,Λευκάδα Κέρκυρα,-,Κατερίνη 24897/3,Υ.Α. Κέρκυρα Λευκάδα
98,Π 394496,21/10/2015,Κλεάνθης,Kleanthes,Λιθοξοΐδης,LithoxoIdes,Ευτύχιος,Ευπραξία,Ζιάρα,09/12/2007,Αιτωλία & Ακαρνανία Καβάλα,-,Ναύπλιο 88585/9,Υ.Α. Καβάλα Αιτωλία & Ακαρνανία


In [6]:
Birthdates = [citizen.getBirthdate() for citizen in citizens]
pd.DataFrame(Birthdates)

Unnamed: 0,Ημερομηνία Γέννησης
0,04/01/1990
1,30/06/1945
2,23/02/2002
3,14/08/1978
4,22/07/2003
...,...
95,07/01/1963
96,21/09/1911
97,06/05/1964
98,09/12/2007


In [7]:
Passports = [citizen.getPassport() for citizen in citizens]
pd.DataFrame(Passports)

Unnamed: 0,Τύπος,Αριθμός Διαβατηρίου,Όνομα,Name,Επώνυμο,Surname,Φύλο,Ιθαγένεια,Ημερομηνία Γέννησης,Τόπος Γέννησης,Place of Birth,Ημ. Έκδοσης,Ημ. Λήξης
0,P,CL1019742,Δομήνικος,Domenikos,Ταβερναράκης,Tabernarakes,M,Νήσος Μαν,04/01/1990,Πάτρα,Patra,18/09/2018,17/09/2023
1,P,UD6270327,Γαβριέλλα,Gabriella,Καραμπίνα,Karampina,F,Ελλάδα,30/06/1945,Ναύπλιο,Nauplio,06/01/2018,05/01/2023
2,P,MQ0083843,Αυξέντιος,Auxentios,Πέτσας,Petsas,M,Ελλάδα,23/02/2002,Αθήνα,Athena,20/12/2018,19/12/2023
3,P,AK4485635,Μάρθα,Martha,Θεοδοσίου,Theodosiou,F,Ελλάδα,14/08/1978,Άμφισσα,Amphissa,23/09/2019,22/09/2024
4,P,KD2131798,Θεοχάρης,Theokhares,Φωτογλίδης,Photoglides,M,Ελλάδα,22/07/2003,Ιωάννινα,Ioannina,27/03/2021,26/03/2026
...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,P,KS7124121,Ανατολή,Anatole,Τσαμπαλή,Tsampale,F,Ελλάδα,07/01/1963,Σάμος,Samos,19/01/2019,18/01/2024
96,P,UH7739146,Αδαμάντιος,Adamantios,Κουλίδης,Koulides,M,Ελλάδα,21/09/1911,Καρπενήσι,Karpenesi,02/03/2020,01/03/2025
97,P,VD0658505,Πάρις,Paris,Σμαρδάς,Smardas,M,Ελλάδα,06/05/1964,Κέρκυρα,Kerkura,19/09/2016,18/09/2021
98,P,SR1286205,Κλεάνθης,Kleanthes,Λιθοξοΐδης,LithoxoIdes,M,Ελλάδα,09/12/2007,Καβάλα,Kabala,27/02/2018,26/02/2023


In [8]:
HealthInsurances = [citizen.getHealthInsurance() for citizen in citizens]
pd.DataFrame(HealthInsurances)

Unnamed: 0,Αριθμός Δελτίου Ταυτότητας,Όνομα,Επώνυμο,Φύλο,Τόπος Γέννησης,Ημερομηνία Γέννησης,Όνομα Πατέρα,Ιθαγένεια,Ημ. Έκδοσης,Ημ. Λήξης
0,Γ 799970,Δομήνικος,Ταβερναράκης,M,Πάτρα,04/01/1990,Πελοπίδας,Νήσος Μαν,04/12/2014,17/09/2021
1,Η 022160,Γαβριέλλα,Καραμπίνα,F,Ναύπλιο,30/06/1945,Αβραάμ,Ελλάδα,16/04/2012,05/01/2021
2,ΠΘ935433,Αυξέντιος,Πέτσας,M,Αθήνα,23/02/2002,Ίων,Ελλάδα,06/04/2015,19/12/2021
3,Κ 188908,Μάρθα,Θεοδοσίου,F,Άμφισσα,14/08/1978,Τιμολέων,Ελλάδα,26/03/2017,22/09/2022
4,ΚΕ198323,Θεοχάρης,Φωτογλίδης,M,Ιωάννινα,22/07/2003,Μαρίνος,Ελλάδα,20/12/2019,26/03/2024
...,...,...,...,...,...,...,...,...,...,...
95,ΟΤ925780,Ανατολή,Τσαμπαλή,F,Σάμος,07/01/1963,Διογένης,Ελλάδα,28/02/2014,18/01/2022
96,ΦΝ010448,Αδαμάντιος,Κουλίδης,M,Καρπενήσι,21/09/1911,Θεολόγος,Ελλάδα,17/06/2016,01/03/2023
97,Ξ 044457,Πάρις,Σμαρδάς,M,Κέρκυρα,06/05/1964,Μαυροειδής,Ελλάδα,02/01/2019,18/09/2019
98,Π 394496,Κλεάνθης,Λιθοξοΐδης,M,Καβάλα,09/12/2007,Ευτύχιος,Ελλάδα,22/05/2014,26/02/2021


In [9]:
MedicalHistories = [citizen.getMedicalHistory() for citizen in citizens]
pd.DataFrame(MedicalHistories)

Unnamed: 0,Αριθμός Δελτίου Ταυτότητας,Όνομα,Επώνυμο,Αναπηρία,Ποσοστό Αναπηρίας
0,Γ 799970,Δομήνικος,Ταβερναράκης,,
1,Η 022160,Γαβριέλλα,Καραμπίνα,,
2,ΠΘ935433,Αυξέντιος,Πέτσας,,
3,Κ 188908,Μάρθα,Θεοδοσίου,,
4,ΚΕ198323,Θεοχάρης,Φωτογλίδης,,
...,...,...,...,...,...
95,ΟΤ925780,Ανατολή,Τσαμπαλή,Blindness,0.590166
96,ΦΝ010448,Αδαμάντιος,Κουλίδης,Thalassemia,0.425972
97,Ξ 044457,Πάρις,Σμαρδάς,,
98,Π 394496,Κλεάνθης,Λιθοξοΐδης,Autism Spectrum Disorder (ASD),0.366070


In [10]:
ProofsOfIncome = [citizen.getProofOfIncome() for citizen in citizens]
pd.DataFrame(ProofsOfIncome)

Unnamed: 0,Αριθμός Δελτίου Ταυτότητας,Όνομα,Επώνυμο,Εταιρεία,Ημ. Έναρξης,Θέση Εργασίας,Μισθός
0,Γ 799970,Δομήνικος,Ταβερναράκης,Αγαλιώτης Inc,2006-07-20,Μουσικολόγος,2000.186878
1,Η 022160,Γαβριέλλα,Καραμπίνα,Μαυραειδή-Κουλίδης,2010-01-09,Αξιωματικός Φαρμακοποιός,8472.455962
2,ΠΘ935433,Αυξέντιος,Πέτσας,Βαρελίδου-Σακελλαρίου,2009-09-16,Λογιστής - Ειδικός Μηχανογραφημένου Λογιστηρίου,977.085607
3,Κ 188908,Μάρθα,Θεοδοσίου,Σοφιανός-Κωνσταντινίδου,2018-10-30,Αγρότης Καλλιεργητής,8492.563589
4,ΚΕ198323,Θεοχάρης,Φωτογλίδης,Φίλκα-Λογκάκη,2013-06-16,Μηχανολόγος Μηχανικός Συστημάτων Αυτόματου Ελέ...,848.449317
...,...,...,...,...,...,...,...
95,ΟΤ925780,Ανατολή,Τσαμπαλή,"Νανούρης, Κυρούδη and Μπότζα",2017-06-16,Πλέκτης,9597.793165
96,ΦΝ010448,Αδαμάντιος,Κουλίδης,Νώε LLC,2014-08-16,Νοσοκόμα Παίδων,8625.319984
97,Ξ 044457,Πάρις,Σμαρδάς,Λογκάκη PLC,2021-01-15,Τεχνικός Ψηφιακής Φωτογραφίας και CD-ROM,5172.691178
98,Π 394496,Κλεάνθης,Λιθοξοΐδης,"Γκαλίου, Λεντζίου and Κατσιμάνη",2006-06-05,Μηχανικός Αυτοκινήτων,6364.089091


In [11]:
SchoolCertificates = [citizen.getSchoolCertificate() for citizen in citizens]
pd.DataFrame(SchoolCertificates)

Unnamed: 0,Αριθμός Δελτίου Ταυτότητας,Όνομα,Name,Επώνυμο,Surname,Όνομα Πατέρα,Father Name,Όνομα Mητέρας,Mother Name,Ημερομηνία Γέννησης,Αριθμός Πρωτοκόλλου,Ημ. Έκδοσης,Βαθμός,Αριθμός Κοινωνικής Ασφάλισης,Χώρα Ασφάλισης,Αριθμός Φορολογικού Μητρώου (ΑΦΜ)
0,Γ 799970,Δομήνικος,Domenikos,Ταβερναράκης,Tabernarakes,Πελοπίδας,Pelopidas,Πολυχρονία,Polukhronia,04/01/1990,7604-2008-03-01,2008-03-01,14.8,256-25-2263,Ελλάδα,480327749
1,Η 022160,Γαβριέλλα,Gabriella,Καραμπίνα,Karampina,Αβραάμ,Abraam,Δούκισσα,Doukissa,30/06/1945,0460-1963-09-18,1963-09-18,15.3,923-81-5391,Ελλάδα,660834972
2,ΠΘ935433,Αυξέντιος,Auxentios,Πέτσας,Petsas,Ίων,Ion,Εύα,Eua,23/02/2002,8668-2020-05-27,2020-05-27,14.3,362-12-4205,Ελλάδα,143979024
3,Κ 188908,Μάρθα,Martha,Θεοδοσίου,Theodosiou,Τιμολέων,Timoleon,Ζωή,Zoe,14/08/1978,1180-1996-09-25,1996-09-25,18.2,475-53-9386,Ελλάδα,223353664
4,ΚΕ198323,Θεοχάρης,Theokhares,Φωτογλίδης,Photoglides,Μαρίνος,Marinos,Σεραφεία,Serapheia,22/07/2003,7616-2021-08-01,2021-08-01,16.3,051-12-7851,Ελλάδα,767904180
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,ΟΤ925780,Ανατολή,Anatole,Τσαμπαλή,Tsampale,Διογένης,Diogenes,Σεμίνα,Semina,07/01/1963,2143-1981-01-27,1981-01-27,16.7,674-67-6057,Ελλάδα,294574022
96,ΦΝ010448,Αδαμάντιος,Adamantios,Κουλίδης,Koulides,Θεολόγος,Theologos,Αθηνά,Athena,21/09/1911,5906-1929-09-25,1929-09-25,13.9,197-94-3252,Ελλάδα,300058049
97,Ξ 044457,Πάρις,Paris,Σμαρδάς,Smardas,Μαυροειδής,Mauroeides,Γεωργία,Georgia,06/05/1964,5875-1982-07-13,1982-07-13,14.9,073-50-0090,Ελλάδα,582443906
98,Π 394496,Κλεάνθης,Kleanthes,Λιθοξοΐδης,LithoxoIdes,Ευτύχιος,Eutukhios,Ευπραξία,Eupraxia,09/12/2007,3836-2026-02-14,2026-02-14,11.8,892-77-1525,Ελλάδα,918705920
