# Задание 1
Напишите функцию, которая принимает на вход строку и проверяет является ли она валидным транспортным номером (1 буква, 3 цифры, 2 буквы, 2-3 цифры). Обратите внимание, что не все буквы кириллического алфавита используются в транспортных номерах.

Если номер валиден, то функция должна возвращать отдельно номер и регион.

Примеры работы программы:

car_id = 'АВ222С96’
Результат: Номер АВ222С валиден. Регион: 96

car_id = 'АБ22ВВ193’
Результат: Номер не валиден



In [21]:
import re

def parse_carnum(s):
    """Проверить и распарсить номер машины (1 буква, 3 цифры, 2 буквы, 2-3 цифры)

    Parameters:
    s (str): Строка с номером машины

    Returns:
    (str, str): Кортеж номера и региона, если номер валиден. Иначе None

   """
    carnum_re = r'^([a-zA-Zа-яА-Я]{1,2}\d{3}[a-zA-Zа-яА-Я]{1,2})(\d{2,3})$'
    res = re.match(carnum_re, s.strip())
    if res != None:
        return (res[1], res[2])
    return res

In [24]:
car_ids = ['AB322C96', 'АВ222С962', 'Ф2343ЯФ333']
for car_id in car_ids:
    print(f'Проверка номера: {car_id}')
    res = parse_carnum(car_id)
    if res != None:
        print('Результат: Номер {} валиден. Регион: {}'.format(*res))
    else:
        print('Результат: Номер не валиден')
        


Проверка номера: AB322C96
Результат: Номер AB322C валиден. Регион: 96
Проверка номера: АВ222С962
Результат: Номер АВ222С валиден. Регион: 962
Проверка номера: Ф2343ЯФ333
Результат: Номер не валиден


# Задание 2
Напишите функцию, которая будет удалять все последовательные повторы слов из заданной строки при помощи регулярных выражений.

Пример работы программы:

some_string = ‘Напишите функцию функцию, которая будет будет будет будет удалять все все все все последовательные повторы слов из из из из заданной строки строки при помощи регулярных выражений’

Результат: Напишите функцию, которая будет удалять все последовательные повторы слов из заданной строки при помощи регулярных выражений.



In [47]:
def unique_words_in_seq(str_in, case_sensitive = True):
    """Удалить повторяющиеся (подряд идущие) одинаковые слова
    
    Parameters:
    str_in (str): строка для обработки.
    
    Returns:
    str: обработанная строка без подряд идущих одинаковых слов
    """
    
    parts = re.findall(r'\w+|\W+', str_in)
    prev_word = ''
    res = []    
    for p in parts:
        if re.match('\W', p):
            res.append(p)
            continue
        w = p
        if not case_sensitive:
            w = w.lower()
        if w != prev_word:    
            res.append(w)
        prev_word = w 
    return ''.join(res)

In [48]:
test_strings = [
     'Напишите функцию функцию, которая будет будет будет будет удалять все все все все последовательные повторы слов из из из из заданной строки строки при помощи регулярных выражений'
]

for s in test_strings:
    print(f'Тестовая строка: {s}')
    t = unique_words_in_seq(s)
    print(f"\nРезультат: {t}")

Тестовая строка: Напишите функцию функцию, которая будет будет будет будет удалять все все все все последовательные повторы слов из из из из заданной строки строки при помощи регулярных выражений

Результат: Напишите функцию , которая будет    удалять все    последовательные повторы слов из    заданной строки  при помощи регулярных выражений


# Задание 3
Напишите функцию, которая будет возвращать акроним по переданной в нее строке со словами.

Примеры работы программы:

some_words = 'Информационные технологии’
Результат: ИТ

some_words = 'Near Field Communication’
Результат: NFC



In [52]:
def acronym_str(some_str):
    """Вернуть акроним переданной строке (абревиатуру из первых букв слов)
    
    Parameters:
    some_str (str): строка, из которой будем собирать акроним
    
    Returns:
    str: акроним переданной строке
    """
    chr_re = r'(?:(?<=\W)|^)\w'
    return ''.join([c.upper() for c in re.findall(chr_re, some_str)])

In [53]:
test_strs = [ 
    'Информационные технологии',
    'Near Field Communication',
    'oneword',
    ''    
]

for s in test_strs:
    print('Акроним для строки "{}": {}'.format(s, acronym_str(s)))

Акроним для строки "Информационные технологии": ИТ
Акроним для строки "Near Field Communication": NFC
Акроним для строки "oneword": O
Акроним для строки "": 


# Задание 4
Напишите функцию, которая будет принимать на вход список email-адресов и выводить их распределение по доменным зонам.

Пример работы программы:

emails = [‘test@gmail.com, xyz@test.in, test@ya.ru, xyz@mail.ru, xyz@ya.ru’, xyz@gmail.com]

Результат:

gmail.com: 2
test.in: 1
ya.ru: 2
mail.ru: 1



In [90]:
def count_domains(emails, bad_key='bad emails'):
    """Посчитать домены во входящем списке email-адресов
    
    Parameters:
    emails ([str]): список почтовых адресов
    bad_key (str): ключ для невалидных email в результате. По-умолчанию - "bad emails"
    
    Returns:
    {str: int} : словарь, где ключ - домен, а значение - кол-во адресов в нём.
                 Для невалидных email-ов - ключ bad_key
    """
    domain_re = re.compile(r'(?<=@)([a-zA-Z0-9][a-zA-Z0-9-]{0,61}[a-zA-Z0-9]\.)+[a-zA-Z]{2,}$')
    res = {}
    for eml in emails:
        m = re.search(domain_re, eml.strip())
        if m != None:
            dmn = m[0]
            res[dmn] = res.get(dmn,0) + 1            
        else:
            res[bad_key] = res.get(bad_key, 0) + 1
    
    return res

In [91]:
emails = ['test@gmail.com', 'xyz@test.in', 'test@ya.ru', 'xyz@mail.ru', 'xyz@ya.ru', 'xyz@gmail.com',
         'asdf', '',  '', # 3 невалидных
          's@my.mail.com' # 1 третьего уровня домен
         ]

res = count_domains(emails)
print("\n".join([f'{k}: {v}' for k, v in res.items()]))

gmail.com: 2
test.in: 1
ya.ru: 2
mail.ru: 1
bad emails: 3
my.mail.com: 1


# Задание 5 (необязательное)

Напишите функцию, которая будет подсчитывать сколько слов начинается на гласные, а сколько на согласные буквы в тексте (текст может быть написан как с использованием букв кириллицы, так и латиницы).

Пример работы программы:

some_text = ‘Эталонной реализацией Python является интерпретатор CPython, поддерживающий большинство активно используемых платформ. Он распространяется под свободной лицензией Python Software Foundation License, позволяющей использовать его без ограничений в любых приложениях, включая проприетарные.’

Результат:

Слов на гласные буквы: 9
Слов на согласные буквы: 21



In [107]:
def count_vowels_and_consonants(s):
    """Подсчитать кол-во слов, начинающихся на гласные и согласные (рус/англ)
    
    Parameters:
    s (str): строка для анализа
    
    Returns:
    (int,int): вернуть кортеж из кол-ва слов, начинающихся на гласные и согласные
    """
    
    vowels_chrs         = 'aeiouафоэиуыуеёюя'
    vowels_words_re     = f'(?<!\w)[{vowels_chrs}]'
    consonants_words_re = f'(?<!\w)[^{vowels_chrs}]'
    cnt_vowels     = len(re.findall(vowels_words_re, s.lower()))
    # удалим всё, что не есть буква
    consonants_str = re.sub(r'[^a-zа-я]','', ''.join(re.findall(consonants_words_re, s.lower())))
    cnt_consonants = len(consonants_str)
    
    return (cnt_vowels, cnt_consonants)

In [108]:
some_text = 'Эталонной реализацией Python является интерпретатор CPython, поддерживающий большинство активно используемых платформ. Он распространяется под свободной лицензией Python Software Foundation License, позволяющей использовать его без ограничений в любых приложениях, включая проприетарные.'

res = count_vowels_and_consonants(some_text)

print(f"Слов на гласные буквы: {res[0]}\nСлов на согласные буквы: {res[1]}")


Слов на гласные буквы: 9
Слов на согласные буквы: 21


# Задание 6 (необязательное)

Напишите функцию, которая будет проверять номер сотового телефона на валидность, если он валиден, то переводить его в формат:
+7-xxx-xxx-xx-xx
Постарайтесь предусмотреть как можно больше адекватных форматов изначального ввода номера. Примеры работы программы:

phone = '+7 955 555-55-55’
Результат: +7-950-555-55-55

phone = '8(955)555-55-55’
Результат: +7-950-555-55-55

phone = '+7 955 555 55 55’
Результат: +7-950-555-55-55

phone = '7(955) 555-55-55’
Результат: +7-950-555-55-55

phone = '423-555-55-5555’
Результат: Номер не валиден

phone = '123-456-789’
Результат: Номер не валиден

In [124]:
def parse_phone(pnum):
    """ Проверить номер телефона на валидность для +7 и привести к стандартному формату.
    
    Parameters:
    pnum (str): строка с номером телефона для обработки
    
    Returns:
    str: Строка в формате  +7-xxx-xxx-xx-xx или None (если номер невалиден)
    
    """
    
    clear_re = r'[-\s()+]'
    pnum_re  = r'(7|8)(\d{3})(\d{7})'
    pnum = re.sub(clear_re, '', pnum.strip())
    m    = re.match(pnum_re, pnum)
    if m == None:
        return None
    return '+7-{}-{}-{}-{}'.format(m[2], m[3][0:3], m[3][3:5], m[3][5:7])

In [126]:
test_pnums = [
    '+7 955 555-55-55',
    '8(926)123-45-67',
    '+7 955 555 55 55', '7(955) 555-55-55', 
    '423-555-55-5555', '123-456-789' # невалид
]

for pnum in test_pnums:
    res = parse_phone(pnum)
    if res == None:
        res = 'Номер не валиден'
    print('Проверка номера "{}". Результат: {}'.format(pnum, res))

cleared: 79555555555
Проверка номера "+7 955 555-55-55". Результат: +7-955-555-55-55
cleared: 89261234567
Проверка номера "8(926)123-45-67". Результат: +7-926-123-45-67
cleared: 79555555555
Проверка номера "+7 955 555 55 55". Результат: +7-955-555-55-55
cleared: 79555555555
Проверка номера "7(955) 555-55-55". Результат: +7-955-555-55-55
cleared: 423555555555
Проверка номера "423-555-55-5555". Результат: Номер не валиден
cleared: 123456789
Проверка номера "123-456-789". Результат: Номер не валиден
