In [2]:
import re

In [4]:
text = """Сегодня в пресс-релизе МИД РФ и NASA ESA, а также ООН ЮНЕСКО, объявили о совместном пилотном проекте. Во встрече в Берлине приняли участие Анна Петрова и Михаил Иванов, а координатором выступил Виктор Сергеев. Компания ООО РОМАШКА и НИИ МЕХАНИКИ обязались подготовить отчёт до 05.03.2007, тогда как рабочую сессию перенесли на 7/11/07; резервная дата указана как 12-04-07. Кроме того, НАТО и ЦУМ поддержали информационную кампанию, ИП ПЕТРОВ выступит подрядчиком по логистике, а консультантом станет Екатерина Смирнова. Вчера я обсуждал детали с Иваном в кафе на набережной Волги и отправил письмо в адрес ESA и МИД РФ."""

In [5]:
#ЗАДАНИЕ 1

def find_abbreviations(text):
    # Паттерн для поиска слов из заглавных букв, минимум 2 символа) несколько аббревиатур могут идти подряд через пробелы
    pattern = r'\b[A-ZА-Я]{2,}(?:\s+[A-ZА-Я]{2,})*\b'
    abbreviations = re.findall(pattern, text)
    
    filtered_abbr = []
    sentences = re.split(r'[.!?]', text)
    
    for sentence in sentences:
        sentence = sentence.strip()
        if not sentence:
            continue
            
        # Поиск аббревиатур в предложении, исключая первое слово
        sentence_abbr = re.findall(pattern, sentence)
        if sentence_abbr:
            # Первое слово предложения
            first_word = sentence.split()[0] if sentence.split() else ""
            
            for abbr in sentence_abbr:
                # Если аббревиатура не является первым словом предложения
                if abbr != first_word:
                    filtered_abbr.append(abbr)
    
    return list(set(filtered_abbr))

abbreviations = find_abbreviations(text)
print("Найденные аббревиатуры:")
for i, abbr in enumerate(abbreviations, 1):
    print(f"{i}. {abbr}")

print("\n" + "="*50 + "\n")

Найденные аббревиатуры:
1. МИД РФ
2. ЦУМ
3. ООН ЮНЕСКО
4. НАТО
5. NASA ESA
6. НИИ МЕХАНИКИ
7. ИП ПЕТРОВ
8. ESA
9. ООО РОМАШКА




In [6]:
#ЗАДАНИЕ 2

def find_dates_and_months(text):
    patterns = [
        r'(\d{2})\.(\d{2})\.(\d{4})',  # DD.MM.YYYY
        r'(\d{2})\.(\d{2})\.(\d{2})',  # DD.MM.YY
        r'(\d{1,2})/(\d{1,2})/(\d{2})', # D/M/YY или DD/MM/YY
        r'(\d{2})-(\d{2})-(\d{2})'     # DD-MM-YY
    ]
    
    dates_info = []
    
    for pattern in patterns:
        dates = re.findall(pattern, text)
        for date in dates:
            day, month, year = date
            dates_info.append({
                'full_date': f"{day}.{month}.{year}",
                'month': month,
                'day': day,
                'year': year
            })
    
    return dates_info

dates_info = find_dates_and_months(text)
print("Найденные даты и месяцы:")
for i, date_info in enumerate(dates_info, 1):
    print(f"{i}. Дата: {date_info['full_date']} -> Месяц: {date_info['month']}")

print("\n" + "="*50 + "\n")

Найденные даты и месяцы:
1. Дата: 05.03.2007 -> Месяц: 03
2. Дата: 05.03.20 -> Месяц: 03
3. Дата: 7.11.07 -> Месяц: 11
4. Дата: 12.04.07 -> Месяц: 04




In [7]:
#ЗАДАНИЕ 3

def find_proper_names(text):
    # Разбить текст на предложения
    sentences = re.split(r'[.!?]', text)
    proper_names = []
    
    for sentence in sentences:
        sentence = sentence.strip()
        if not sentence:
            continue
            
        # Разбить предложение на слова
        words = sentence.split()
        
        for word in words[1:]:
            if (word[0].isupper() and 
                any(char.islower() for char in word) and
                not word.isupper()):  # Исключить слова полностью из заглавных букв
                
                clean_word = re.sub(r'[.,;:!?]$', '', word)
                if clean_word and clean_word[0].isupper():
                    proper_names.append(clean_word)
    
    return list(set(proper_names))

proper_names = find_proper_names(text)
print("Найденные имена собственные (исключая начало предложений):")
for i, name in enumerate(proper_names, 1):
    print(f"{i}. {name}")

print("\n" + "="*50 + "\n")

Найденные имена собственные (исключая начало предложений):
1. Анна
2. Иванов
3. Берлине
4. Екатерина
5. Сергеев
6. Смирнова
7. Петрова
8. Михаил
9. Волги
10. Иваном
11. Виктор




In [8]:
list_of_strings = ["ПриветМир", "abcXYZ", "МарияАнтуанетта", "über", "abc-xyz", "abc_123", "хлеб", "арбузб", "арбузБ", "баб", "ббабб", "б", "бббаббаб", "ба", "аб", "аба", "а", "Ваня Ваня пришёл вовремя", "что что это же очевидно бабушка", "мы просто говорим тут", "123 это строка и заканчивается словом финал", "+42 пример строки с числом в начале и словом на конце слово", "7 а тут в конце восклицание!", "В пещере цвет выцвел, и ворон каркнул громко.", "цветы не считаются, зато ворон тут есть.", "This is fine.", "The bag is empty.", "'Hello', she said softly.", "(Well) this is fine.", "It's nice.", "Re-enter the room."]

In [10]:
#ЗАДАНИЕ 5
print("1. Строки, состоящие только из букв:")
pattern_5_1 = r'^[A-Za-zА-Яа-яёЁ]+$'
result_5_1 = [s for s in list_of_strings if re.match(pattern_5_1, s)]
for s in result_5_1:
    print(f"   '{s}'")

print("\n2. Строки из строчных букв, оканчивающихся на 'б':")
pattern_5_2 = r'^[а-яё]+б$'
result_5_2 = [s for s in list_of_strings if re.match(pattern_5_2, s)]
for s in result_5_2:
    print(f"   '{s}'")

print("\n3. Строки над алфавитом {а, б}, где каждая 'а' в контексте 'баб':")
pattern_5_3 = r'^б*(баб)*б*$'
result_5_3 = [s for s in list_of_strings if re.match(pattern_5_3, s)]
for s in result_5_3:
    print(f"   '{s}'")

1. Строки, состоящие только из букв:
   'ПриветМир'
   'abcXYZ'
   'МарияАнтуанетта'
   'хлеб'
   'арбузб'
   'арбузБ'
   'баб'
   'ббабб'
   'б'
   'бббаббаб'
   'ба'
   'аб'
   'аба'
   'а'

2. Строки из строчных букв, оканчивающихся на 'б':
   'хлеб'
   'арбузб'
   'баб'
   'ббабб'
   'бббаббаб'
   'аб'

3. Строки над алфавитом {а, б}, где каждая 'а' в контексте 'баб':
   'баб'
   'ббабб'
   'б'
   'бббаббаб'


In [11]:
#ЗАДАНИЕ 6
print("1. Два подряд идущих повторяющихся слова:")
pattern_6_1 = r'\b(\w+)\s+\1\b'
result_6_1 = [s for s in list_of_strings if re.search(pattern_6_1, s)]
for s in result_6_1:
    matches = re.findall(pattern_6_1, s)
    print(f"   '{s}' -> повторяющиеся слова: {matches}")

print("\n2. Строки, начинающиеся с целого числа и оканчивающиеся словом:")
pattern_6_2 = r'^\d+\b.*\b[А-Яа-яA-Za-zёЁ]+$'
result_6_2 = [s for s in list_of_strings if re.match(pattern_6_2, s)]
for s in result_6_2:
    print(f"   '{s}'")

print("\n3. Строки, содержащие и слово 'цвет', и слово 'ворон':")
pattern_6_3_color = r'\bцвет\b'
pattern_6_3_raven = r'\bворон\b'
result_6_3 = [s for s in list_of_strings if (re.search(pattern_6_3_color, s) and 
                                           re.search(pattern_6_3_raven, s))]
for s in result_6_3:
    print(f"   '{s}'")

print("\n4. Перемещение первого слова английского предложения в конец:")
english_sentences = [s for s in list_of_strings if re.match(r'^[A-Z]', s)]

def move_first_word_to_end(sentence):
    # Шаблон для захвата первого слова и остатка предложения
    pattern_6_4 = r'^([\'\"\(]?[A-Za-z\'-]+[\'\"\)]?)([\s\S]*?)([.!?]?)$'
    match = re.match(pattern_6_4, sentence)
    
    if match:
        first_word = match.group(1).strip()
        rest_of_sentence = match.group(2).strip()
        punctuation = match.group(3)
        
        clean_first_word = re.sub(r'^[\'\"\(]|[\'\"\)]$', '', first_word)
        
        if rest_of_sentence:
            new_sentence = f"{rest_of_sentence} {clean_first_word}{punctuation}"
        else:
            new_sentence = f"{clean_first_word}{punctuation}"
        
        new_sentence = new_sentence[0].upper() + new_sentence[1:]
        
        return new_sentence
    return sentence

print("Преобразованные английские предложения:")
for s in english_sentences:
    if re.match(r'^[A-Z]', s):
        transformed = move_first_word_to_end(s)
        print(f"   '{s}' -> '{transformed}'")

1. Два подряд идущих повторяющихся слова:
   'Ваня Ваня пришёл вовремя' -> повторяющиеся слова: ['Ваня']
   'что что это же очевидно бабушка' -> повторяющиеся слова: ['что']

2. Строки, начинающиеся с целого числа и оканчивающиеся словом:
   '123 это строка и заканчивается словом финал'

3. Строки, содержащие и слово 'цвет', и слово 'ворон':
   'В пещере цвет выцвел, и ворон каркнул громко.'

4. Перемещение первого слова английского предложения в конец:
Преобразованные английские предложения:
   'This is fine.' -> 'Is fine This.'
   'The bag is empty.' -> 'Bag is empty The.'
   'It's nice.' -> 'Nice It's.'
   'Re-enter the room.' -> 'The room Re-enter.'
