# Строки

**Лекция**

1. Строки и работа с ними
2. Форматирование
3. Конкатенация

**Практика** 

1. Форматирование строк с помощью f-строк 
2. Конкатенация строк и переменных 
3. Форматирование чисел в выводе (десятичные, процентные)
4. Использование .upper(), .lower(), .strip(), .split()
5. Практика с многострочными строками
6. Разделение строк
7. Подсчет и замена символов


**Результаты обучения:**

* Применение основных методов обработки и форматирования строк
* Знание способов экранирования специальных символов в строках
* Использование приёмов среза срок и индесации

**Вопросы:**

1. Что такое строка ?
2. Приведите пример ?
3. Как хранятся строки в памяти компьютера ?

4. Как часто Data Scitntist работает со строками ?

## Основные определения

**Строка**(string) – это упорядоченная неизменяемая последовательность символов. 

Для определения переменной, содержащей постоянный текст, необходимо	взять этот текст в одиночные или двойные кавычки:
```Python
greeting = "Привет, Миша-байке!"
command = 'Через двести метров поверните налево'
```

Класс объекта: `<class 'str'>`

Тип данных | назначение | Изменяемость | Класс |	Пример
--- | --- |  :---: |  :---: |  :---
Строка <br>string       |  хранение строковых данных<br> напр. HTML код| нет 	| str   | "Hello World" <br>'5'
 
Проверка типа данных произовольной переменной 'x' возможна с помоью команды type(x)

In [None]:
s = "fff"
print(type(s)) # <class 'str'>

## Печать строк 

Функция print() позволяет выводить значения переменных в консоль. При этом результат печати форматируют для удобства чтения. Существует несколько способов форматирования строк:
* базовый `print('Hello World')`
* f-strings  `print(f"Hello {var}")`
* .format `print("Hello {}".format("World"))`

In [None]:
world_var = 'World'
print('Hello World')
print(f"Hello {world_var}")
print() # вернет пустую строку
print("Hello {}".format("World"))

In [None]:
print("""Hello World""")

Аргумент sep: управляет разделителем между несколькими аргументами (по умолчанию — пробел).

In [None]:
print("apple", "banana", "cherry")              ## apple banana cherry
print("apple", "banana", "cherry", sep=", ")    ## apple, banana, cherry

Аргумент end: определяет, что печатается в конце вызова print() (по умолчанию — символ новой строки `\n`). `\t` - табуляция

In [None]:
print("Hello", end=" ")
print("world!") # Output: Hello world!
print('abc')

In [None]:
print('Куда, \tкуда вы удалились, \nВесны моей златые дни? \nЧто день грядущий мне готовит? \nЕго мой взор напрасно ловит..')
print(' ')
print("А.С. Пушкин, \nАрия Ленского 'Куда, куда вы удалились' из оперы 'Евгений Онегин'")

In [None]:
# Экранирование апострофа в строке
print("My name's Alex")
print('My name\'s Alex')

### Print(var) vs var 

In [None]:
var = 'a'
var

In [None]:
var_2 = 'b'
print('Hello World')

## [Объединение строк и переменных](https://docs.python.org/3.3/library/string.html#format-examples)

В Python строки можно объединять с помощью оператора `+` или f-строк (`f""`). Это позволяет легко соединять текст и переменные.

In [None]:
# объединение через +
name = 'Анна'
greeting = 'Привет, ' + name
print(greeting)

In [None]:
# объединение через f-строку
age = 25
info = f'Мне {age} лет.'
print(info)

In [None]:
# объединение нескольких строк
city = 'Москва'
country = 'Россия'
location = city + ', ' + country
print(location) ## Москва, Россия

In [None]:
# объединение нескольких строк c повторением
'{0}{1}{0}'.format('абра', 'кад') ## 'абракадабра'

### Сложный случай

С помощью строк и переменных можно форматировать текст на печати. Например, в виде таблицы. Её границы задаются символами, а ячейки имеют фиксированную ширину.

In [None]:
title = '|  ' + ' {:^52} ' .format( 'Cereal Yields (kg/ha)') + ' |'
border_h = '+ ' + '-' *16 + '+' + ( '-' *9 + '+' )*4
row = '| {:<14}  | ' + ' {:6,d} | ' *4
header = '| {:^15s} | ' .format( 'Country' ) + ( ' {:^6d} | ' * 4).format(1980, 1990,
2000, 2010)

print(' +' + '-' *(len(title)-2) + '+ ',
    title ,
    border_h,
    header,
    border_h,
    row.format( 'China', 2937, 4321, 4752, 5527),
    row.format( 'Germany', 4225, 5411, 6453, 6718),
    row.format( 'United States', 3772, 4755, 5854, 6988),
    border_h,
sep= ' \n ' )

## [Форматирование чисел при печати](https://docs.python.org/3/tutorial/inputoutput.html)
 
Форматирование позволяет выводить переменные и числа с нужным количеством знаков после запятой или в процентном формате.

Форматированный строковый литерал или **f-строка** — это строковый литерал с префиксом 'f' или 'F'. Эти строки могут содержать поля замены, которые являются выражениями, разделенными фигурными скобками { }. В то время как другие строковые литералы всегда имеют постоянное значение, форматированные строки на самом деле являются выражениями, вычисляемыми во время выполнения.

[Официальная документация по префиксам](https://docs.python.org/3.3/library/string.html#formatspec)

In [None]:
import math
print('Число Пи приблизительно равно:', math.pi)

In [None]:
# Отображение десятичного числа с двумя знаками после запятой
PI = 3.14159
print(f'Число Пи приблизительно равно: {PI:.2f}')
print( 'Число Пи приблизительно равно: {:.2f}'.format(PI))

In [None]:
# отображение со знаком процента
progress = 0.051
print(f'Выполнено: {progress:.0%}')

In [None]:
# вывод числа с ведущими нулями
number = 7
print(f'Число с ведущими нулями: {number:03}')

In [None]:
# вывод числа в научном формате
number = 123400000
print('Число в научном формате: {:.2e}'.format(number))
print('Число в научном формате: {:.2E}'.format(number))

## Работа с многострочными строками

Многострочные строки можно создавать с помощью тройных кавычек ''' или """. Это удобно для хранения больших текстов или вывода форматированного текста.

In [None]:
# создание однострочной строки
text = """Привет, мир! Это Python."""
print(text)

In [None]:
# многострочная строка с одинарными кавычками
another_text = '''Это 
тоже 
многострочная строка.'''
print(another_text)

In [None]:
# использование переноса строк внутри строки
# Плохая реализация
message = "Строка с\nпереносом\nстрок"
print(message)


In [None]:
# Хорошая реализация
message = "Строка с\
    \nпереносом\
    \nстрок"
print(message)

## Методы строк: .upper(), .lower(), .strip(), .split(), .replace()



### Методы в программировании

**Метод** (в объектно-ориентированном программировании) — это функция или процедура, принадлежащая какому-то классу или объекту.

Как и процедура в процедурном программировании, метод состоит из некоторого количества операторов для выполнения какого-то действия и имеет набор входных аргументов.

**Пример**

```python
строка.метод(аргумент)
```

Методы строк позволяют изменять текст без создания новых функций:

* `.upper()` — переводит все буквы в верхний регистр;
* `.lower()` — переводит в нижний регистр;
* `.strip()` — убирает пробелы в начале и конце строки;
* `.split()` — разбивает строку на список по разделителю;
* `.replace()` - Заменяет все вхождения старой подстроки.

In [None]:
# верхний регистр
text = 'привет'
print(text.upper())  # ПРИВЕТ

In [None]:
# нижний регистр
text = 'ПРИВЕТ'
print(text.lower())  # привет

In [None]:
# удаление лишних пробелов
text = '   привет   '
print(text.strip())  # 'привет'

In [None]:
# разделение строки
fruits = 'яблоко,банан,киви'
print(fruits.split(sep=','))  # ['яблоко', 'банан', 'киви']

Вопрос: что это за скобки ?

In [None]:
# Замена символов string.replace(old, new)
porrige = 'колба'
porrige.replace('кол', 'пол')

## Подсчет и замена символов. Методы len(), .count(), .replace()

* `len(string)` - отображает длину строки
* `.count()` подсчитывает количество вхождений подстроки.
* `.replace()` заменяет одну подстроку на другую.

In [None]:
# Длина строки
my_string = "Настройка базовой интегрированной среды разработки (IDE)"
print(len(my_string)) # Длина строки составляет 56 символов

In [None]:
# Посчитайте количество букв 'о' в строке 'молоко'.
milk = 'молоко'
print(milk.count('о')) # строка содержит три буквы "о"

In [None]:
# Замените все 'w' на 'и' в слове 'пwнгwн'.
bird = 'пwнгwн'
print(bird.replace('w', 'и'))

In [None]:
# Замените слово 'старый' на 'новый' в фразе.
sentence = 'Это старый дом.'
print(sentence.replace('старый', 'новый'))

## Срезы строк и индексация (slicing)
 
С помощью срезов можно получить часть строки, используя синтаксис [начало:конец:шаг].

<p align="center"> <img src="./figures/3. String slicing arguments.png" width="400" > </td>

Нумерация индексов начинается с 0.
* [0] – 1-й символ
* [-1] – последний символ
* [ начало : конец : шаг ]
* [ : : -1] обратный порядок


<p align="center"> <img src="./figures/2. String slicing.png" width="600" > </td>

In [None]:
# взять первые 5 символов
word = 'программирование'
print(word[:5])  # 'прогр'

In [None]:
# взять символы с 5 по 10
print(word[5:11])  # 'амми'

In [None]:
# взять последние 4 символа
print(word[-4:])  # 'ние'

In [None]:
# пропуск символов через один
print(word[::2])  # 'прогрмирвание'

In [None]:
# реверс строк
print('еинавримргорп'[::-1])  # 'прогрмирвоие'