<a href="https://colab.research.google.com/github/cpython-projects/python_da_06_11_25/blob/main/lesson_06.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1. Що таке стрічка (String)

**Стрічка — це впорядкована, незмінювана (immutable) послідовність символів у Python.**

Використовується для зберігання:

* тексту
* ідентифікаторів
* кодів помилок
* назв категорій
* URL, email
* токенів API
* даних, які приходять через CSV/JSON як текст
* тощо

## Три ключові властивості

### Впорядкованість (ordered)

* У кожного символа свій індекс.
* Можна робити slicing, ітеруватися, обирати підрядки.

### Незмінюваність (immutable)

* Не можна змінити символ у стрічці.
* Будь-яка модифікація → створення нової стрічки.

### Елементи — символи Unicode (utf-8)

* Можна комбінувати текст різних мов.

# 2. Створення стрічок

# 3. Операції зі стрічками

**Конкатенація**

**Повторення**

**Перевірка належності**

**Індексація**

**Зрізи (slicing)**

# 4. Основні методи стрічок

**`.lower()`, `.upper()`, `.title()`**

**`.replace()`**

**`.split()`**

**`.join()`**

**`.find()` і `.index()`**

**`.lstrip()`, `.rstrip()`, `.strip()`**

**Перевірки**

# 5. Порівняння рядків

Python порівнює рядки **лексикографічно (словниково)**.

Це означає:

* порівнюються коди символів (ASCII/Unicode)
* порівняння йде **символ за символом**
* враховується **регістр** (“A” < “a”)

---

### **Приклади**

```python
"apple" < "banana"
```

```
True   # 'a' < 'b'
```

```python
"Data" < "database"
```

```
True   # порівняння по символах: D == d? Ні → порівнюються коди
```

### **Регістр важливий**

```python
"Apple" < "apple"
```

```
True  # великий символ має менший код
```

### **Числа у рядках порівнюються як текст**

```python
"100" < "9"
```

```
True   # '1' < '9'
```

### **Порівняння на рівність**

```python
"data" == "data"
```

```
True
```

```python
"data" == "Data"
```

```
False  # регістр має значення
```

### **Порівняння довжин**

```python
len("Python") > len("R")
```

```
True
```

# 6. Типові помилки при роботі зі стрічками

❌ спроба змінити символ

```python
s[0] = "A"  # error
```

❌ змішування типів

```python
"age: " + 25  # TypeError
"age: " + str(25)
```

❌ неправильне порівняння строк з числами

```python
"100" > "20"   # False (бо порівнюється як текст)
```

# 7. Задачі

## **1. Знайти домен з email-адреси**

У CRM-систему завантажили список email-клієнтів. Для подальшої сегментації потрібно визначити, з яких поштових сервісів вони частіше пишуть.

```python
email = "user123@gmail.com"
# результат: "gmail.com"
```

## **2. Зробити першу літеру великою**

Під час імпорту даних з Excel усі імена клієнтів збереглися в нижньому регістрі.
Потрібно виправити формат перед записом у базу.

```python
s = "analytics"
# результат: "Analytics"
```

## **3. Отримати всі слова довжиною > 5**

Під час аналізу ключових фраз з опису курсу потрібно вибрати довгі ключові терміни.

```python
text = "Big Data Analytics with Python"
# результат: ['Analytics', 'Python']
```

## **4. Очищення текстових полів**

Під час збору цін із різних джерел форматування виявилося нерівномірним: різні валюти, пробіли, перенос рядка.
Потрібно привести ціни до числового формату, а потім — до одного стандартного вигляду.

```python
prices = ["$50", "  45$", "60 USD", "\n70$"]
```

Завдання:

4.1. Перетворити всі значення в **int**  
4.2. Знайти **середню ціну**  
4.3. Отримати **мінімальну** та **максимальну** ціну  
4.4. Вивести всі ціни у вигляді: `"45 USD"`  

## **5. Парсинг логів (реальна ситуація адміністрування)**

Під час моніторингу серверів отримано логи, кожен з яких містить тип повідомлення, дату та деталі проблеми.
Потрібно виділити ключову інформацію для подальшої класифікації інцидентів.

```python
log = "ERROR 2025-11-25 14:03:10: CPU overload"
```

Завдання:

5.1. Отримати тип повідомлення: `"ERROR"`  
5.2. Виділити дату: `"2025-11-25"`  
5.3. Отримати саме повідомлення: `"CPU overload"`  

## **6. Робота з CSV-рядком**

Під час створення DataFrame колонка приходить у форматі одного рядка.
Потрібно дістати список назв полів та привести їх до стандартного стилю.

```python
row = "id,age,country,salary"
```

Завдання:

6.1. Зробити список: `['id', 'age', 'country', 'salary']`  
6.2. Перетворити всі назви у **snake_case** (на випадок, якщо будуть складні поля)  
6.3. Перевірити, чи є `"salary"` серед колонок  