# Работа с числами и строками на примере алгоритма Луна
---
М.А. Гейне (mike.geine@gmail.com)

## Операции со строками

### Базовые операции

Конкатенация

In [None]:
# Cell 1: String Concatenation
string1 = "Hello"
string2 = "World"
string1 + " " + string2

Повторение

In [None]:
"Hi" * 3

Длина строки

In [None]:
len("Python")

Обращение по индексу

In [None]:
"Python"[0]

Интервалы

In [None]:
"Python"[1:4]

Форматирование

In [None]:
name = "Alice"
f"Hello, {name}!"

Удаление лишних пробелов
- `strip()`: Удаляет ведущие и заключительные пробелы.
- `lstrip()`: Удаляет ведущие пробелы.
- `rstrip()`: Удаляет заключительные пробелы.

In [None]:
"  hel  lo  ".strip()

Поиск подстроки

- `find()`: Индекс первого вхождения подстроки или -1, если её нет.
- `count()`: Подсчитывает вхождение подстроки.

In [None]:
"hello".find("e")


In [None]:
"hello".count("l")

Соединение и разбиение строк

- `split()`: Разбивает строку на список
- `join()`: Соединяет список строк через разделитель

In [None]:
"hello world".split()

In [None]:
"-".join(['hello', 'world'])

### Продвинутые операции

Замена подстроки

In [None]:
"Hello world".replace("world", "Python")

Интерполяция строк

In [None]:
"Hello, %s!" % "Alice"

Регулярные выражения

In [None]:
import re
re.findall(r"\d+", "The year is 2023")

Превращения строк (String Translation)

In [None]:
translation_table = str.maketrans("aeiou", "12345")
"hello".translate(translation_table)

In [None]:
translation_table2 = str.maketrans({'e': '2', 'o': '0'})
"hello".translate(translation_table)

Кодирование и декодирование

In [None]:
"hello".encode('utf-8').hex(' ')

In [None]:
b'hello'.decode('utf-8')

Проверка свойств строки

- `isalpha()`: Все символы - буквы.
- `isdigit()`: Все символы - цифры.
- `isalnum()`: Все символы - буквы или цифры.

In [None]:
"hello".isalpha()

In [None]:
"123".isdigit()

In [None]:
"hello123".isalnum()

In [None]:
"hello!123".isalnum()

Проверка начала/конца строки

In [None]:
"python".startswith("py")

In [None]:
"python".endswith("on")

Разворот строки

In [None]:
"hello"[::-1]

### Регулярные выражения

In [30]:
import re
log_line = '2023-10-27 10:30:00 - ERROR - User [johndoe] attempted login from IP 192.168.1.100'

In [31]:
pattern = r'(\d{4}-\d{2}-\d{2})\s+(\d{2}:\d{2}:\d{2})\s+-\s+(\w+)\s+-\s+User\s+\[(\w+)\]\s+attempted\s+login\s+from\s+IP\s+(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})'

Расшифровка:

- `U` - поиск символа U (или любого другого символа, указанного буквально)
- `a-z` - любой символ в интервале
- `[abc]` - любой из символов a, b или c
- `[^abc]` - любой из символов, кроме abc
- `.` - любой символ
- `\d` - любая цифра (0-9)
- `\D` - любой символ, кроме цифры
- `\w` - любой символ слова ([a-zA-Z0-9_])
- `\s` - любой символ пробела
- `{4}` - количество повторений предыдущего токена (4 раза)
- `+` - предыдущий токен должен повториться 1 или более раз
- `*` - предыдущий токен должен повториться 0 или более раз
- `()` - группа захвата

См. также: [https://regex101.com/](https://regex101.com/)


In [None]:
match = re.search(pattern, log_line)
if match:
    date, time, level, username, ip = match.groups()
    print(f"Date: {date}, Time: {time}, Level: {level}, Username: {username}, IP: {ip}")

In [None]:
email = "test.user+alias@example.com"
pattern = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
if re.match(pattern, email):
    print("Valid email address")
else:
    print("Invalid email address")

In [None]:
text = "This is a sentence with some phone numbers: 123-456-7890 and (555) 123-4567."
pattern = r"\(*(\d{3})\D*(\d{3})\D*(\d{4})"
replacement = r"(\1) \2-\3"

re.sub(pattern, replacement, text)

In [None]:
text = "I have 10 apples and 20 oranges."
pattern = r"\d+(?= apples)"

re.findall(pattern, text)

## Алгоритм Луна

Алгоритм Луна (Luhn algorithm) — это алгоритм контрольной суммы, используемый для проверки различных идентификационных номеров, таких как номера кредитных карт, номера социального страхования (SIN) в Канаде и некоторых других стран.

Как он работает:

1. Удвоение цифр: Начиная с конца номера (справа налево), удвоить каждую вторую цифру.
2. Суммирование цифр: Если удвоение цифры приводит к двузначному числу, сложить цифры этого числа (например, 12 -> 1 + 2 = 3).
3. Суммирование всех цифр: Сложить все цифры, полученные на предыдущих шагах, включая неудвоенные.
4. Проверка результата: Если полученная сумма делится на 10 без остатка, то номер считается действительным по алгоритму Луна.

In [41]:
card_number = '4111-1111-4555-1142'

0. Подготовка номера карты

In [None]:
card_translation = str.maketrans({'-': '', ' ': ''})
translated_card_number = card_number.translate(card_translation)
translated_card_number

1. Сумма нечётных чисел

In [43]:
sum_of_odd_digits = 0

In [None]:
card_number_reversed = translated_card_number[::-1]
card_number_reversed

In [None]:
odd_digits = card_number_reversed[::2]
odd_digits

In [None]:
for digit in odd_digits:
  sum_of_odd_digits += int(digit)
sum_of_odd_digits

2. Сумма чётных чисел

In [47]:
sum_of_even_digits = 0

In [None]:
even_digits = card_number_reversed[1::2]
even_digits

In [None]:
for digit in even_digits:
  number = int(digit) * 2
  if number >= 10:
    number = (number // 10) + (number % 10)
  sum_of_even_digits += number
sum_of_even_digits

3. Подсчёт суммы

In [None]:
total = sum_of_even_digits + sum_of_odd_digits
total

In [None]:
total % 10 == 0

Оформим в функции

In [52]:
def clear_card_number(card_number):
  card_translation = str.maketrans({'-': '', ' ': ''})
  return card_number.translate(card_translation)

def verify_luhn(str_of_digits):
  sum_of_odd_digits = 0
  card_number_reversed = str_of_digits[::-1]
  odd_digits = card_number_reversed[::2]

  for digit in odd_digits:
      sum_of_odd_digits += int(digit)

  sum_of_even_digits = 0
  even_digits = card_number_reversed[1::2]
  for digit in even_digits:
      number = int(digit) * 2
      if number >= 10:
          number = (number // 10) + (number % 10)
      sum_of_even_digits += number
  total = sum_of_odd_digits + sum_of_even_digits
  return total % 10 == 0

In [None]:
card_number = '4111-1111-4555-1142'
clean = clear_card_number(card_number)
verify_luhn(clean)


In [None]:
card_number = '4111-1111-4555-1143'
clean = clear_card_number(card_number)
verify_luhn(clean)

### Можно ли написать лучше?

Вариант решения в функциональном стиле:

In [111]:
from functools import reduce

def compress(digit):
  return (digit // 10) + (digit % 10) if digit > 9 else digit

def verify_luhn2(str_of_digits):
  ints = list(map(lambda c: int(c), clean[::-1]))
  sum = reduce(lambda acc, pair: acc + (compress(pair[1]*2) if pair[0] % 2 == 0 else pair[1]), enumerate(ints, 1), 0)
  return sum % 10 == 0

In [None]:
card_number = '4111-1111-4555-1142'
clean = clear_card_number(card_number)
verify_luhn2(clean)

In [None]:
card_number = '4111-1111-4555-1143'
clean = clear_card_number(card_number)
verify_luhn2(clean)