# Лекция: Работа со строками, преобразование типов и регулярные выражения в Python

## План занятия
1. Строки в Python: создание, индексация, срезы
2. Основные методы строк
3. Форматирование строк
4. Преобразование типов (int, float, str, bool)
5. Введение в регулярные выражения (модуль `re`)
6. Шаблоны (маски) для проверки и поиска данных
7. Практические задания

## 1. Строки в Python
Строка — это упорядоченная последовательность символов.

**Создание строк:**
```python
s1 = 'Привет'
s2 = "Мир"
s3 = '''Многострочная
строка'''
```

**Индексация и срезы:**
- `s[0]` — первый символ строки
- `s[-1]` — последний символ строки
- `s[начало:конец:шаг]` — срез

In [None]:
# Примеры работы со строками
s = 'Python is fun!'
print('Исходная строка:', s)
print('Первый символ:', s[0])
print('Последний символ:', s[-1])
print('Первые 6 символов:', s[:6])
print('Каждый второй символ:', s[::2])

## 2. Основные методы строк
Некоторые полезные методы:

- `lower()` / `upper()` — в нижний / верхний регистр
- `strip()` — удалить пробелы по краям
- `replace(old, new)` — замена подстроки
- `split(sep)` — разделить строку на список
- `join(iterable)` — склеить строки из последовательности
- `startswith()` / `endswith()` — проверка начала/конца строки


In [None]:
# Демонстрация методов строк
text = '  Hello, Python!  '
print('Оригинал:', repr(text))
print('strip():', repr(text.strip()))
print('lower():', text.lower())
print('upper():', text.upper())
print("replace('Python', 'World'):", text.replace('Python', 'World'))
print("split(','):", text.split(','))
words = ['Python', '—', 'классный', 'язык']
print("' '.join(words):", ' '.join(words))

## 3. Форматирование строк
В Python есть несколько способов подстановки значений в строку:

### f-строки (рекомендуется)
```python
name = 'Аня'
age = 20
msg = f'Меня зовут {name}, мне {age} лет.'
```

### Метод `format`
```python
msg = 'Меня зовут {}, мне {} лет'.format(name, age)
```


In [None]:
# Примеры форматирования
name = 'Аня'
age = 20
height = 1.65

msg1 = f'Меня зовут {name}, мне {age} лет, рост {height:.2f} м.'
msg2 = 'Меня зовут {}, мне {} лет, рост {:.2f} м.'.format(name, age, height)
print(msg1)
print(msg2)

## 4. Преобразование типов
Часто нужно перевести строку в число и наоборот.

**Основные функции:**
- `int(x)` — в целое число
- `float(x)` — в число с плавающей точкой
- `str(x)` — в строку
- `bool(x)` — в логический тип

Если строка не похожа на число, `int()` и `float()` вызовут ошибку.

In [None]:
# Примеры преобразования типов
s_num = '42'
print('Тип s_num:', type(s_num))
n = int(s_num)
print('Тип n:', type(n), 'значение:', n)

s_float = '3.14'
f = float(s_float)
print('Тип f:', type(f), 'значение:', f)

x = 100
s = str(x)
print('Тип s:', type(s), 'значение:', s)

print('bool(0):', bool(0))
print('bool(1):', bool(1))
print("bool(''):", bool(''))
print("bool('текст'):", bool('текст'))

## 5. Введение в регулярные выражения
Регулярные выражения (regular expressions, regex) — это мини-язык для поиска и проверки строк по шаблонам.

В Python для работы с ними есть модуль `re`.

Основные функции:
- `re.search(pattern, string)` — ищет первое вхождение
- `re.findall(pattern, string)` — ищет все вхождения и возвращает список
- `re.sub(pattern, repl, string)` — заменяет по шаблону

Простые элементы шаблонов:
- `\d` — цифра (0–9)
- `\w` — буква/цифра/подчёркивание
- `\s` — пробельный символ
- `.` — любой символ, кроме перевода строки
- `+` — один или более раз
- `*` — ноль или более раз
- `?` — ноль или один раз
- `{n}` — ровно n раз
- `{n,m}` — от n до m раз
- `^` — начало строки
- `$` — конец строки

In [5]:
import re

text = 'Телефоны: +7-911-123-45-67, 8(800)555-35-35, 123-456'
pattern = r'\d{3}-\d{3}'  # три цифры, дефис, три цифры

matches = re.findall(pattern, text)
print('Найденные совпадения:', matches)

Найденные совпадения: ['911-123', '123-456']


## 6. Шаблоны (маски) для проверки и поиска данных
Частая задача — проверить, что строка соответствует определённому формату (маске).

Примеры масок:
- Номер телефона в формате `+7-XXX-XXX-XX-XX`
- E-mail: `имя@домен.зона`
- Почтовый индекс: 6 цифр

### Пример: проверка почтового индекса РФ
Шаблон: 6 цифр подряд → `^\d{6}$`
- `^` — начало строки
- `\d{6}` — ровно 6 цифр
- `$` — конец строки

In [4]:
import re

def is_valid_postcode(code: str) -> bool:
    pattern = r'^\d{6}$'
    return bool(re.match(pattern, code))

tests = ['190000', '12345', 'abcdef', '1234567']
for t in tests:
    print(t, '->', is_valid_postcode(t))

190000 -> True
12345 -> False
abcdef -> False
1234567 -> False


### Пример: проверка e-mail
Упрощённый шаблон e-mail (для учебных целей):
```regex
^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$
```
- `^[\w.-]+` — имя (буквы/цифры/подчёркивание/точка/дефис)
- `@` — символ собачки
- `[\w.-]+` — домен
- `\.` — точка
- `[a-zA-Z]{2,}` — доменная зона от 2 букв и больше

In [3]:
import re

def is_valid_email(email: str) -> bool:
    pattern = r'^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$'
    return bool(re.match(pattern, email))

emails = ['test@example.com', 'user.name@mail.ru', 'bad-email@', '123@domain', 'a@b.c']
for e in emails:
    print(e, '->', is_valid_email(e))

test@example.com -> True
user.name@mail.ru -> True
bad-email@ -> False
123@domain -> False
a@b.c -> False


## 7. Практические задания
Рекомендуется решать их прямо в этом блокноте, создавая новые ячейки.

### Задание 1. Работа со строками
1. Попросите пользователя ввести строку.
2. Выведите:
   - длину строки
   - строку в верхнем и нижнем регистре
   - первые 3 и последние 3 символа (если длина позволяет)

### Задание 2. Преобразование типов
Попросите пользователя ввести два числа (как строки), преобразуйте их в `int` и выведите сумму, разность и произведение.

### Задание 3. Поиск по шаблону
Дана строка с текстом. Найдите с помощью регулярных выражений все числа в строке.

Подсказка: используйте шаблон `\d+` и функцию `re.findall`.

### Задание 4. Проверка номера телефона
Напишите функцию, которая проверяет, соответствует ли строка формату российского номера телефона:
- `+7-XXX-XXX-XX-XX` или
- `8(XXX)XXX-XX-XX`

Используйте регулярные выражения. Протестируйте несколько примеров.

### Задание 5. Валидация пароля
Придумайте шаблон для пароля, который должен содержать:
- минимум 8 символов
- хотя бы одну букву в верхнем регистре
- хотя бы одну букву в нижнем регистре
- хотя бы одну цифру

Напишите функцию, которая проверяет пароль на соответствие этому шаблону.

In [1]:
user_input = input("Введите строку: ")
print("Длина строки:", len(user_input))
print("Верхний регистр:", user_input.upper())
print("Нижний регистр:", user_input.lower())

if len(user_input) >= 6:
    print("Первые 3 символа:", user_input[:3])
    print("Последние 3 символа:", user_input[-3:])
else:
    print("Строка слишком короткая для отображения первых и последних 3 символов.")

Длина строки: 11
Верхний регистр: HELLO WORLD
Нижний регистр: hello world
Первые 3 символа: Hel
Последние 3 символа: rld


In [6]:
num_str1 = input("Введите первое число:")
num_str2 = input("Введите второе число:")

num1 = int(num_str1)
num2 = int(num_str2)

print(f"Сумма: {num1 + num2}")
print(f"Разность: {num1 - num2}")
print(f"Произведение: {num1 * num2}")


Сумма: 14
Разность: 4
Произведение: 45


In [8]:
text = input("Введите текст: ")
import re
numbers = re.findall(r'\d+', text)
print("Найденные числа:", numbers)


Найденные числа: ['2', '3', '10']


In [17]:
import re

def check_phone(number: str) -> bool:
    pattern = r'^\+7-\d{3}-\d{3}-\d{2}-\d{2}$|^8\(\d{3}\)\d{3}-\d{2}-\d{2}$'
    return bool(re.match(pattern, number))

numbers = [
    "+7-921-523-45-67",
    "8(900)535-35-35",
    "7-911-123-45-67", 
    "8(800)555-35-3"    
]

for num in numbers:
    print(f"{num} -> {check_phone(num)}")

+7-921-523-45-67 -> True
8(900)535-35-35 -> True
7-911-123-45-67 -> False
8(800)555-35-3 -> False


In [19]:
def validate_password(password: str) -> bool:
    pattern = r'^(?=.*[a-z])(?=.*[A-Z])(?=.*\d).{8,}$'
    return bool(re.match(pattern, password))

passwords = [
    "Password1",
    "PASSWORD1",
    "Password",
    "Passw0rd!"
]

for pw in passwords:
    print(f"{pw} -> {validate_password(pw)}")

Password1 -> True
PASSWORD1 -> False
Password -> False
Passw0rd! -> True
