# Строковый тип данных (Python Only)

Строки это ключевой, особенный тип данных. О строках можно говорить очень долго, сама задача хранения и манипуляции текста порождает множество подходов к работе. Здесь мы кратко пройдёмся скорее по внешней стороне вопроса: что использует для манипуляции и видит сам программист, когда работает со строками. 

## Как они устроены? 

Говоря простейшим образом, задача хранения строк сводится к двум подзадачам:
1. Хранение и кодирование символов
2. Хранение наборов символов (строк)  

In [None]:
# Для хранения в памяти компьютера символам присваиваются числовые коды
# То, какие коды мы используем, называется "кодировка": например UTF-8, UTF-16, ASCII, КОИ-8

a = 'A' # в языке python записывать в переменную значение строки/символа можно с помощью строковых литералов
b = "B" # для этого мы помещаем буквы в кавычки (не важно двойные или одинарные - разницы нет)

# В это время внутри переменной у нас сохраняется код, его можно узнать функцией ord()
print(ord('a'), ord(a), ord(b))

# Чтобы получить символ из кода, возпользуемся функцией chr
c = chr(98)
print("Символ 98:", c)

97 65 66
Символ 98: b


Будем честны, работать с символьными кодами напрямую не приходится почти никогда, но знать о том, что они существуют нужно.   

In [6]:
# В языке python не существует явного разделения строковых и символьных типов на уровне литералов
# Строки создаются и манипулируются таким же образом, как и символы
a = "Hello, "
b = 'world!'

# Строки можно конкатенировать(складывать)
print(a + b)
# Понятие вычитания для строк смысла не имеет

# строки возможно перезаписывать
a = 'Goodb'
a = a + 'y' # Даже так: новое = старое + 'y'
a += 'e, ' # Или то же, но короче
print(a)

# строки можно герерировать с помощью "умножения"
ten_zeros = '0' * 10 # повторим 10 раз
print(ten_zeros) 

Hello, world!
Goodbye, 
0000000000


Для продвижения вперёд по теме рекомендуется ознакомиться с массивами/списками.

In [16]:
# Логично предположить, что строки должны быть устроены внутренне похоже на коллекции вроде массивов или списков
# Методы манипуляции над строками посимвольно - совпадают с возможностями списков

c = 'Длинная строка для изысканий'
print("Длина строки:", len(c))

print(c[3]) # получаем элемент по индексу, индексация с 0

for i in range(len(c)): # индексируемся в строке по длинне
    print(c[i], end=' ') # получим доступ к каждой букве
print('')

c = 'стеклянный оловянный и деревянный солдатики коллекционировали штукатурку'
no_doubled = '' # давайте создадим строку без повторов букв по порядку
for i in range(len(c) - 1): # у последней нет соседа, если обратимся за длинну - будет ошибка
    if c[i] == c[i+1]: # если буква совпадает со следующей
        continue # проппускаем
    no_doubled += c[i]
no_doubled += c[-1] # обращение [-n] это n-я буква с конца, удобно. c[-1] - последняя буква
print(no_doubled) 

# строки, в отличии от списков, иммутабельны (неизменяемы)
# d[2] = 'и' - ошибка
d = 'ошЫбка'
d = d[:2] + 'и' + d[3:] # [:2] - от начала, до 2-х (не включая 2), [3:] - от 3-х до конца (3 включительно)
print(d)

Длина строки: 28
н
Д л и н н а я   с т р о к а   д л я   и з ы с к а н и й 
стекляный оловяный и деревяный солдатики колекционировали штукатурку
ошибка


## Строковые функции

In [18]:
# в распоряжении имеется целый набор удобных функций для манипуляции над строками

scream = 'я кричу'.upper() # к верхнему регистру
whisper = 'Я ШЕПЧУ'.lower() # к нижнему регистру
print(scream, whisper)

fruits = 'яблоки бананы груши мандарины'.split() # разбить по символу(по стандарту ПРОБЕЛ)
veggies = 'морковь-капуста-картошка'.split('-')
print(fruits, veggies)

# 'разделитель'.join(коллекция) - создать строку, склеив слова из коллекции разделителем
together = 'У меня в корзинке: ' + ', '.join(fruits + veggies) # списки можно склеивать [1, 2] + [3, 4] = [1, 2, 3, 4]
print(together)

Я КРИЧУ я шепчу
['яблоки', 'бананы', 'груши', 'мандарины'] ['морковь', 'капуста', 'картошка']
У меня в корзинке: яблоки, бананы, груши, мандарины, морковь, капуста, картошка


In [None]:
right_spaces = 'зажал пробел          '.rstrip()
left_spaces = '         зажал пробел'.lstrip()
center_spaces = '    много лишнего    '.strip()
print(repr(right_spaces), repr(left_spaces), repr(center_spaces))

'зажал пробел' 'зажал пробел' 'много лишнего'
