# Part 1

In [14]:
test_cases = [
    "ecl:gry pid:860033327 eyr:2020 hcl:#fffffd byr:1937 iyr:2017 cid:147 hgt:183cm",
    "iyr:2013 ecl:amb cid:350 eyr:2023 pid:028048884 hcl:#cfa07d byr:1929",
    "hcl:#ae17e1 iyr:2013 eyr:2024 ecl:brn pid:760753108 byr:1931 hgt:179cm",
    "hcl:#cfa07d eyr:2025 pid:166559648 iyr:2011 ecl:brn hgt:59in",
]
expected = [True, False, True, False]

In [15]:
def parse_passport(txt):
    key_values = [entry.split(':') for entry in txt.split(' ')]
    return dict(key_values)

In [23]:
NEEDED_FIELDS = {'eyr', 'byr', 'ecl', 'hcl', 'pid', 'iyr', 'hgt'}

def is_passport_valid(txt):
    entries = parse_passport(txt)
    missing_fields = NEEDED_FIELDS.difference(set(entries.keys()))
    return len(missing_fields) == 0

In [28]:
for txt, exp in zip(test_cases, expected):
    assert is_passport_valid(txt) == exp

In [46]:
with open('input.txt', 'r') as f:
    cases = f.read().strip()

In [47]:
passports = [p.replace('\n', ' ') for p in cases.split('\n\n')]

In [49]:
n_valid = 0
for txt in passports:
    n_valid += is_passport_valid(txt)

n_valid

213

# Part 2

In [188]:
test_cases_invalid = [
    "eyr:1972 cid:100 hcl:#18171d ecl:amb hgt:170 pid:186cm iyr:2018 byr:1926",
    "iyr:2019 hcl:#602927 eyr:1967 hgt:170cm ecl:grn pid:012533040 byr:1946",
    "hcl:dab227 iyr:2012 ecl:brn hgt:182cm pid:021572410 eyr:2020 byr:1992 cid:277",
    "hgt:59cm ecl:zzz eyr:2038 hcl:74454a iyr:2023 pid:3556412378 byr:2007",
    "iyr:2010 hgt:190in hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719",
    "iyr:2010 hgt:190 hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719",
    "iyr:2010 hgt:12cm hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719",
    "pid:087499704 hgt:74in iyr:2012 eyr:2030 byr:1980 hcl:#623a2f",
    "pid:0123456789 hgt:74in iyr:2012 eyr:2030 byr:1980 hcl:#623a2f",
    "pid:ABC hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f",
    "pid:#430c70 hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f",
]

test_cases_valid = [
    "pid:087499704 hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f",
    "eyr:2029 ecl:blu cid:129 byr:1989 iyr:2014 pid:896056539 hcl:#a97842 hgt:165cm",
    "hcl:#888785 hgt:164cm byr:2001 iyr:2015 cid:88 pid:545766238 ecl:hzl eyr:2022",
    "iyr:2010 hgt:158cm hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719",
]


In [189]:
parse_passport(test_cases[0]).keys()

dict_keys(['eyr', 'byr', 'ecl', 'hcl', 'pid', 'iyr', 'cid', 'hgt'])

In [193]:
import re

def always_valid(x):
    return True

def byr_validate(v):
    date = int(v)
    return len(v) == 4 and 1920 <= date <= 2002

def iyr_validate(v):
    date = int(v)
    return len(v) == 4 and 2010 <= date <= 2020

def eyr_validate(v):
    date = int(v)
    return len(v) == 4 and 2020 <= date <= 2030

def ecl_validate(v):
    return v in {'amb', 'blu', 'brn', 'gry', 'grn', 'hzl', 'oth'}

def hcl_validate(v):
    regex = r"#[0-9a-f]{6}"
    return len(re.findall(regex, v)) == 1

def hgt_validate(v):
    if v.endswith('cm'):
        return 150 <= int(v[:-2]) <= 193
    if v.endswith('in'):
        return 59 <= int(v[:-2]) <= 76
    return False

def pid_validate(v):
    try:
        int(v)
    except ValueError:
        return False
    return len(v) == 9

validation_functions = {
    'byr': byr_validate,
    'cid': always_valid,
    'ecl': ecl_validate,
    'eyr': eyr_validate,
    'hcl': hcl_validate,
    'hgt': hgt_validate,
    'iyr': iyr_validate,
    'pid': pid_validate,
}

def is_passport_valid(txt):
    entries = parse_passport(txt)
    missing_fields = NEEDED_FIELDS.difference(set(entries))
    if len(missing_fields) > 0:
        return False
    
    for key, value in entries.items():
        if not validation_functions[key](value):
            return False
    
    return True

In [194]:
for txt in test_cases_valid:
    print(txt)
    assert is_passport_valid(txt)

pid:087499704 hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f
eyr:2029 ecl:blu cid:129 byr:1989 iyr:2014 pid:896056539 hcl:#a97842 hgt:165cm
hcl:#888785 hgt:164cm byr:2001 iyr:2015 cid:88 pid:545766238 ecl:hzl eyr:2022
iyr:2010 hgt:158cm hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719


In [195]:
for txt in test_cases_invalid:
    print(txt)
    assert not is_passport_valid(txt)

eyr:1972 cid:100 hcl:#18171d ecl:amb hgt:170 pid:186cm iyr:2018 byr:1926
iyr:2019 hcl:#602927 eyr:1967 hgt:170cm ecl:grn pid:012533040 byr:1946
hcl:dab227 iyr:2012 ecl:brn hgt:182cm pid:021572410 eyr:2020 byr:1992 cid:277
hgt:59cm ecl:zzz eyr:2038 hcl:74454a iyr:2023 pid:3556412378 byr:2007
iyr:2010 hgt:190in hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719
iyr:2010 hgt:190 hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719
iyr:2010 hgt:12cm hcl:#b6652a ecl:blu byr:1944 eyr:2021 pid:093154719
pid:087499704 hgt:74in iyr:2012 eyr:2030 byr:1980 hcl:#623a2f
pid:0123456789 hgt:74in iyr:2012 eyr:2030 byr:1980 hcl:#623a2f
pid:ABC hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f
pid:#430c70 hgt:74in ecl:grn iyr:2012 eyr:2030 byr:1980 hcl:#623a2f


In [196]:
n_valid = 0
for txt in passports:
    n_valid += is_passport_valid(txt)

n_valid

147