# 04: **`str` - строки: методи, атрибути та корисні трюки**


## `Все, що, як вам здється, ви знаєте про текст — неправда`
## (с) Dive into Python

Коли ви кажете "текст", ви напевне маєте на увазі "букви та інші символи на екрані мого комп’ютера". Але комп’ютери не працюють з символами, вони працюють з бітами і байтами. Будь-який текст який ви бачите насправді зберігається в певному кодуванні. Говорячи дуже грубо, кодування символів - це бінарне відношення між зображенням символів які ви бачите на екрані, і даними які комп’ютер насправді зберігає в пам’яті та на диску. Існує багато різноманітних кодувань символів, деякі з них оптимізовані для конкретних мов, наприклад англійської, китайської або української, а інші можуть використовуватись в багатьох мовах.

Любий текст потребує декодуваня, прямо як шифр. Через купу кодувань на різних комп’ютерах виникали проблеми з відображенням багатомовного тексту або тексту на мовах, відмінних від англійської.

На привелике щастя зараз людство узгодило єдине кодуваня, що підтримується майже усіми і усюди: UTF-8 - система кодування Юнікоду змінної довжини.

## Строка — це більше ніж строка

Тип `str` у Python реалізує текстові рядки Unicode з операторами, вбудованими функціями, методами та спеціальними модулями. Дещо схожий тип `bytes` представляє довільні двійкові дані як послідовність байтів, також відому як байтовий рядок або `bytearray`. Над об'єктами обох типів можна виконувати багато операцій: оскільки ці типи є незмінними, методи здебільшого створюють і повертають новий рядок, крім випадків, коли повертають вхідний рядок незмінним.

Ми спочатку розглянемо методи, доступні для цих трьох типів, потім обговорено модуль string і форматування рядків (зокрема, форматовані рядкові літерали).

Строки є незмінними, що означає, що після створення рядка ви не можете змінити його вміст без створення нового рядка (або перезапису вмісту змнної).

**Рядки (строки) розглядаються як послідовності символів.** 

Це означає, що ви можете обробляти рядки, якщо це колекція окремих елементів (символів). Важливі риси рядків як послідовностей включають:

**Індексація:**

Символи в рядках можна отримати за допомогою індексації. Перший символ має індекс 0, другий - 1, і так далі

```python
рядок = "Привіт"
перший_символ = рядок[0]  # Повертає "П"
другий_символ = рядок[1]  # Повертає "р"
```

також можлива індексація “з кінця” — останній символ має індекс `[-1]`, передостанній `[-2]` і т.д.

```python
рядок = "Привіт"
останній_символ = рядок[-1]  # Повертає "т"
```

**Зрізи (Slices):**

У Python зрізи (slices) використовуються для отримання підстроки (зрізу) з ітерабельних об'єктів, таких як **рядки, списки та кортежі**. Синтаксис зрізів досить гнучкий та дозволяє вам вибирати підстроки за допомогою індексів. Синтаксис для зрізів виглядає так:

```python
iterable[start:stop:step]
```

- `start`: Початковий індекс (включно).
- `stop`: Кінцевий індекс (не включаючи).
- `step`: Крок, з яким вибираються елементи (за замовчуванням 1).

Ось кілька прикладів використання зрізів:

```python
# Приклад 1: Зріз рядка
text = "Hello, World!"
substring = text[7:12]  # Вибираємо "World"
print(substring)

# Приклад 2: Зріз списку
numbers = [0, 1, 2, 3, 4, 5]
sublist = numbers[2:5]  # Вибираємо [2, 3, 4]
print(sublist)

# Приклад 3: Крок у зрізі
sequence = "abcdefghij"
result = sequence[1:9:2]  # Вибираємо "bdfh"
print(result)

# Приклад 4: Вибір зрізу без початкового та кінцевого індексів
original_list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
partial_list = original_list[::2]  # Вибираємо елементи з кроком 2
print(partial_list)

```

Зрізи також можуть використовуватися для зміни значень в ітерабельних об'єктах або для створення копій зрізу зі зміненими значеннями.

**Довжина Рядка:**

Ви можете використовувати функцію `len()` для отримання довжини рядка (кількість символів).

```python
рядок = "Привіт"
довжина = len(рядок)  # Повертає 6
```

**Ітерація:**

Рядки можна ітерувати за допомогою циклу `for`, отримуючи кожен символ послідовно.

```python
рядок = "Привіт"
for символ in рядок:
    print(символ)
```

**Конкатенація:**

Строки можна об'єднувати (конкатенувати) за допомогою оператора `+` або методом `join`
```python
'! '.join(["гол", "гол"])
```

## Розділення строки на частини – split()

Функція `split()` використовується для розділення рядка на частини на основі певного роздільника та повертає список отриманих частин. Основні варіанти використання `split()`:

1. **Розділення за пробілом:**
    - Якщо не вказати конкретний роздільник, `split()` використовує пробіли (і інші пробільні символи) як роздільники.
        
        ```python
        line = "Привіт світ"
        parts = line.split()
        print(parts)
        # Результат: ['Привіт', 'світ']
        ```
        
- **Розділення за певним роздільником:**
    - Можна вказати власний роздільник для розділення рядка.
        
        ```python
        line = "apple,orange,banana"
        parts = line.split(',')
        print(parts)
        # Результат: ['apple', 'orange', 'banana']
        ```
        
- **Обмеження кількості розділень:**
    - Можна вказати, скільки разів роздільник повинен бути використаний для розділення.
        
        ```python
        line = "apple,orange,banana,grape"
        parts = line.split(',', 2)
        print(parts)
        # Результат: ['apple', 'orange', 'banana,grape']
        ```
        
- **Розділення за регулярним виразом:**
    - Можна використовувати регулярні вирази як роздільники.

## Перевірка початку `.startswith()` та закінчення `.endswith()`

Методи .startswith() та .endswith() використовуються для перевірки того, чи рядок починається або закінчується певною підстрічкою. 

**Перевірка, чи рядок починається з певної підстрічки**

```python
line = "Hello, World!"

# Перевірка, чи рядок починається з певної підстрічки
if line.startswith("Hello"):
    print("Рядок починається з 'Hello'")
else:
    print("Рядок не починається з 'Hello'")
```

**Перевірка, чи рядок закінчується певною підстрічкою**

```python
line = "Hello, World!"

# Перевірка, чи рядок закінчується певною підстрічкою
if line.endswith("World!"):
    print("Рядок закінчується на 'World!'")
else:
    print("Рядок не закінчується на 'World!'")
```

У вищенаведених прикладах `.startswith()` перевіряє, чи рядок починається з "Hello", а `.endswith()` перевіряє, чи рядок закінчується на "World!".

Обидва методи повертають булеве значення (`True` або `False`), що робить їх корисними для логічних перевірок та умов в коді.

## Регістр символів строки, перевірка і перетворення регістру

### Перевірка Регістру

1. **Перевірка, чи рядок складається тільки з великих літер:**
    
    ```python
    рядок = "HELLO"
    if рядок.isupper(): 
        print("Рядок складається тільки з великих літер.")
    ```
    
- **Перевірка, чи рядок складається тільки з малих літер:**
    
    ```python
    рядок = "hello"
    if рядок.islower(): 
        print("Рядок складається тільки з малих літер.")
    ```
    
- **Перевірка, чи перший символ рядка є великою літерою:**
    
    ```python
    рядок = "Hello"
    if рядок.istitle():
        print("Перший символ рядка є великою літерою.")
    ```
    

### Перетворення Регістру

1. **Перетворення всіх літер рядка у великі:**
    
    ```python
    рядок = "hello"
    великі_літери = рядок.upper()
    print(великі_літери)
    ```
    
- **Перетворення всіх літер рядка у малі:**
    
    ```python
    рядок = "HELLO"
    малі_літери = рядок.lower()
    print(малі_літери)
    ```
    
- **Перетворення першої літери рядка у велику:**
    
    ```python
    рядок = "hello"
    велика_перша_літера = рядок.capitalize()
    print(велика_перша_літера)
    ```
    
- **Перетворення першої літери кожного слова у велику:**
    
    ```python
    рядок = "hello world"
    великі_перші_літери = рядок.title()
    print(великі_перші_літери)
    ```
    
- **Перетворення великих літер у малі і навпаки:**
    
    ```python
    рядок = "Hello World"
    інверсія_регістру = рядок.swapcase()
    print(інверсія_регістру)
    ```
    

Ці методи дозволяють вам ефективно перевіряти та змінювати регістр символів у рядках в залежності від ваших потреб.

## Пошук у строці: .find()

Метод `.find()` використовується для пошуку підстрічки в рядку і повертає індекс першого входження знайденої підстрічки. Якщо підстрічка не знайдена, повертається -1.

Ось приклад використання методу `.find()`:

```python
string = "Це приклад для пошуку у рядку."

# Пошук індексу першого входження підстрічки
index = string.find("пошук")
if index != -1:
    print(f"Знайдено на позиції {index}.")
else:
    print("Підстрічка не знайдена.")
```

У цьому прикладі, якщо слово "пошук" знаходиться в рядку, програма виведе позицію першого входження. Якщо слово не знайдено, виведеться повідомлення про те, що підстрічка не знайдена.

Також слід зазначити, що метод `.find()` може приймати додаткові аргументи для обмеження діапазону пошуку:

```python
index = line.find("пошук", початковий_індекс, кінцевий_індекс)
```

У цьому випадку, пошук буде виконуватися тільки у підстрічці рядка від `початковий_індекс` до `кінцевий_індекс`.

## Заміна у строці: .replace()

Метод `.replace()` використовується для заміни входжень певної підстрічки іншою підстрічкою в рядку. Ось приклад використання:

```python
рядок = "Це приклад для заміни у рядку."

# Заміна слова "заміни" на "підміни"
новий_рядок = рядок.replace("заміни", "підміни")

print("Оригінальний рядок:", рядок)
print("Результат заміни:", новий_рядок)
```

У цьому прикладі всі входження слова "заміни" у рядку будуть замінені на слово "підміни". Важливо зазначити, що `.replace()` повертає новий рядок, і оригінальний рядок залишається незмінним.

Також метод `.replace()` може приймати третій аргумент, який вказує кількість входжень, які потрібно замінити. Наприклад:

```python
рядок = "Це приклад для заміни у рядку, заміни лише перше входження."

# Заміна першого входження слова "заміни" на "підміни"
новий_рядок = рядок.replace("заміни", "підміни", 1)

print("Оригінальний рядок:", рядок)
print("Результат заміни:", новий_рядок)
```

У цьому випадку буде замінено лише перше входження слова "заміни".

## Обрізання зайвих символів строки: strip(), lstrip() та rstrip()

Методи `strip()`, `lstrip()`, та `rstrip()` використовуються для обрізання зайвих (пробільних або інших) символів з початку та/або кінця рядка відповідно. Ось їх приклади:

1. **`strip()`: Обрізка з обох кінців**

```python
рядок = "    Привіт, світ!    "
очищений_рядок = рядок.strip()

print("Оригінальний рядок:", рядок)
print("Очищений рядок:", очищений_рядок)  # > Привіт, світ!
```

**2. `lstrip()`: Обрізка з початку рядка**

```python
рядок = "    Привіт, світ!    "
очищений_рядок = рядок.rstrip()

print("Оригінальний рядок:", рядок)
print("Очищений рядок:", очищений_рядок)  # > Привіт, світ!       
```

**3. `rstrip()`: Обрізка з кінця рядка.**
```python
рядок = "    Привіт, світ!    "
очищений_рядок = рядок.strip()

print("Оригінальний рядок:", рядок)
print("Очищений рядок:", очищений_рядок)  # >     Привіт, світ!
```

## Комбінування строкових змінних ','.join(str)

Метод `','.join(str)` використовується для об'єднання (комбінування) рядка зі списку або ітерабельного об'єкту за допомогою певного роздільника. Ось приклад використання:

```python
# Список рядків
str_list = ["apple", "orange", "banana"]

# Об'єднання рядків зі списку за допомогою роздільника ','
joined_strs = ','.join(str_list)

print("Список рядків:", str_list)
print("Об'єднані рядки:", joined_strs)
```

У цьому прикладі метод `','.join()` об'єднує рядки зі списку `["apple", "orange", "banana"]` за допомогою коми як роздільника, і результат виглядає так:

```less
Список рядків: ['apple', 'orange', 'banana']
Об'єднані рядки: apple,orange,banana
```

Цей метод особливо корисний, коли вам потрібно об'єднати елементи списку в рядок з певним роздільником.

## Перетворення строкових даних в інший тип даних

В Python існують різні функції для перетворення строкових даних в інші типи даних. Ось кілька основних прикладів:

**У ціле число (int):**

```python
рядок = "123"
ціле_число = int(рядок)
```

**У дійсне число (float):**

```python
рядок = "123.45"
дійсне_число = float(рядок)
```

**У список (list) елементів, розділених певним роздільником:**

```python
рядок = "1,2,3,4,5"
список = рядок.split(',')
```

**У кортеж (tuple) елементів, розділених певним роздільником:**

```python
рядок = "1,2,3,4,5"
кортеж = tuple(рядок.split(','))
```

**У булеве значення (bool):**

```python
рядок = "True"
булеве_значення = bool(рядок)
```


### 💡 **НЕБЕЗПЕЧНИЙ МОМЕНТ:**

```python
string = "False"
bool_var = bool(string)
```

### 💡 `bool_var`  буде мати значення `True`, оскільки усе, що не пуста строка - `True`

Важливо враховувати, що перетворення може викликати виникнення виключень, якщо рядок не може бути коректно перетворений у вказаний тип. Тому рекомендується обробляти винятки або використовувати функції, які надають можливість безпечно перевірити можливість перетворення перед його виконанням (наприклад, `isdigit()` для перевірки, чи рядок містить тільки цифри перед спробою перетворення в ціле число).

## Форматовані строки

Для вбудовування значення змінних в рядок використовується літерал `f` перед рядком, а потім фігурні дужки `{}` для вставки значення.

```python
ім_я = "Василь"
вік = 25
рядок = f"Привіт, {ім_я}! Тобі {вік} років."
```

- **Вбудовані Вирази:**
    
    Можна вбудовувати вирази в фігурні дужки, і вони будуть обчислюватися при форматуванні.
    
    ```python
    а = 5
    б = 10
    рядок = f"Сума чисел {а} та {б} дорівнює {а + б}."
    ```
    
- **Форматування Змінних:**
    
    Можна вказати специфікатори форматування для змінних, такі як кількість знаків після коми для чисел.
    
    ```python
    число = 3.14159265359
    рядок = f"Значення числа: {число:.2f}"  # Виводить 2 знаки після коми
    ```
    
- **Використання Зворотніх Складених Дужок:**
    
    Якщо вам потрібно вивести фігурну дужку у ф-стрічці, використовуйте подвійні фігурні дужки.
    
    ```python
    змінна = "значення"
    рядок = f"Це {{змінна}} буде вставлено: {змінна}"
    ```
    

f-стрічки роблять код більш зрозумілим і зручним, особливо при складних рядках, де багато виразів та значень змінних вставляються в текст.

## Висновок

На лекції ми розглянули основні методи роботи зі строками та способи обробки та пошуку даних у строках