# Строки

Строки в Python - упорядоченные последовательности символов, используемые для хранения и представления текстовой информации, поэтому с помощью строк можно работать со всем, что может быть представлено в текстовой форме.

In [3]:
s = "It's a car"
print(s)
s = 'It"s a car'
print(s)

It's a car
It"s a car


In [2]:
1+int('1')

2

Нет никакой разницы в создании строк через апострофы или кавычки. Наличие обоих вариантав обусловлено добавлением данных символов в строку, не используя экранирование

### Экранирование

<b>Экранирование</b> символов — замена в тексте управляющих символов на соответствующие текстовые подстановки.

Возьмем тот же пример:

In [6]:
s = 'It\'s a car'
print(s)
s = "It\"s a car"
print(s)

It's a car
It"s a car


В данном случае, из-за применения экранирования апострофа и кавычки, строка не закрывается

Соответственно, экранирование в специальной последовательности, позволяет вставить в строки символы, которые невозможно вставить в одинарную строку

Самые популярные экранированные последовательности - \n и \t <br>
\n отвечает за перевод на новую строку <br>
\t отвечает за горизонтальную табуляцию <br>

In [15]:
print("I'm\nhere\n")
print("I'm\there")

I'm
here

I'm	here


Остальные экранированные последовательности присутствуют в оф. документации и/или учебниках

Соответственно, если \ - экранирует строку, и необходимо отобразить данный символ, нам необходимо дважды написать \

In [17]:
print("C:\\Users\\Milovanov\\Documents\\")

C:\Users\Milovanov\Documents\


### "Сырая" строка

Сырая строка подавляет экранирование. Данной строкой пользуются в случаях создания регулярных выражений и/или написания путей к файлу

Сырые строки начинаются с символа r до начала апострофов или кавычек

In [18]:
print(r'C:\Users\Milovanov\Documents')

C:\Users\Milovanov\Documents


Однако сырая строка не может заканчиваться на \\. Иначе будет вызываться исключение <b>SyntaxError</b>

In [24]:
print(r'C:\Users\Milovanov\Documents\')

SyntaxError: EOL while scanning string literal (<ipython-input-24-b8696830456f>, line 1)

In [26]:
print(r'C:\Users\Milovanov\Documents\\')
print(r'C:\Users\Milovanov\Documents\\'[:-1])

C:\Users\Milovanov\Documents\\
C:\Users\Milovanov\Documents\


### Многострочный текст

Когда необходимо необходимо написать многострочный текст, необходимо использовать тройные кавычки или апострофы

In [29]:
s = '''Вот так
Я
Могу писать в несколько
строк'''
print(s)

Вот так
Я
Могу писать в несколько
строк


### Индекс и Срезы

Чтобы взять какой-либо символ из строки, необходимо использовать его индекс. Как и во многих других языках программирования, индексы в Python начинаются с 0

In [30]:
string = "Мой дядя самых честных правил"

In [31]:
string[0]

'М'

In [32]:
string[15]

'ч'

Если попытаться взять индекс, который превышает длину строки, появится исключению IndexError

In [33]:
string[1234]

IndexError: string index out of range

Индексы в Python поддерживают отрицательные значения. -1 элемент - последний элемент в строке

In [36]:
string[-1], string[-5], string[-10]

('л', 'р', 'н')

Срезы - набор элементов <br>
Синтаксис: str[start:end:step] <br> Все элементы являются необязательными <br>
Если не указать step, то по умолчанию он равен 1 (каждый следующий символ) <br>
Если не указать end, то по умолчанию он равен последнему элементу <br>
Если не указать start, То по умолчанию он равен 0 (индекс первого элемента)

In [38]:
print(string[:5])
print(string[5:])

Мой д
ядя самых честных правил


Надо учитывать, что параметр <b>start</b> учитывает данный элемент в срезе, а параметр <b>end</b> не учитывает

In [46]:
print(string[::2])
print(string[::-1])
print()
print(string[4:9])
print(string[4:9:2])
print()
print(string[9:4:-1])

Мйдд аы еты рвл
ливарп хынтсеч хымас ядяд йоМ

дядя 
дд 

с ядя


Если мы делаем шаг отрицательным, то start должен быть больше end

In [48]:
print(string[:4:2])
print(string[5::4])

Мй
ясхсха


#### Неизменяемость

Всегда учитывайте, что строки - неизменяемый тип данных, то есть, вы не можете изменить строку

In [51]:
s = "Hello world! I'm here"
s[5] = 'f'

TypeError: 'str' object does not support item assignment

Для изменения символа необходимо делать следующее

In [54]:
s = s[:5] + 'f' + s[6:]
s

"Hellofworld! I'm here"

В ячейке сверху представлена <b> конкатенация </b>строк, т.е. сложение строк. Конкатенация <b>НЕ</b> изменяет строку, а создает новую

## Функции и методы строк

### Конкатенация (сложение строк)

In [56]:
s = "Hello" + " " + 'World'
print(s)

Hello World


### Повторение строки

In [59]:
s = "Я повторяюсь 13 раз\t" * 13
print(s)

Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	Я повторяюсь 13 раз	


### Длина строки (функцт len() )

In [61]:
string = 'Я строка из 23 символов'
print(len(string))

23


### Поиск в строке ( string.find() и string.rfind(), string.index() и string.rindex() )

.find(str[,start, end]) - ищет первое вхождение заданного шаблона в строку <br>
.rfind(str[,start,end]) - ищет последние вхождение заданного шаблона в строку <br>
start и end - необязательные параметры, которые говорят, что ищем внутри данного среза <br>
Если данные методы не находят элемента, то возвращают -1, иначе индекс элемента в строке (срезы не учитываются в подсчете индекса)

In [2]:
string = "Hello"
print(string.find('l'))
print(string.find('l', 2))
print(string.find('l', 3))
print(string.find('l', 5))

2
2
3
-1


In [67]:
print(string.rfind('l'))
print(string.rfind('l', 2))
print(string.rfind('l', 5))

3
3
-1


In [71]:
print(string.find('el'))
print(string.find('elll'))

1
-1


.index(str[,start,end]) - ищет первое вхождение заданного шаблона в строку. Отличие от find - в случае не нахождения шаблона, возвращает исключение ValueError, а не -1 <br>
.rindex(str[,start,end]) - ищет последнее вхождение заданного шаблона в строку. Отличие от rfind - в случае не нахождения шаблона, возвращает исключение ValueError, а не -1

In [72]:
print(string.index('l'))
print(string.index('l', 2))
print(string.index('l', 5))

1


ValueError: substring not found

In [73]:
print(string.rindex('l'))
print(string.rindex('l', 2))
print(string.rindex('l', 5))

3
3


ValueError: substring not found

### Замена шаблона

string.replace(from, to) - находит шаблон(from) и меняет его (to). Если метод не находит такого шаблона, то строка не меняется

In [74]:
string = "Hello world"

In [75]:
string.replace('world', 'МИР')

'Hello МИР'

In [78]:
#Касаемо неизменяемость строк. Мы только что выполнили метод replace, однако переменная string не изменила своего значения
print(string)

Hello world


In [76]:
string.replace('World', 'МИР')

'Hello world'

### Разбиение строки по разделителю

.split(sep[, maxsplit]) - разбивает данную строку по данному pattern (по умолчанию pattern=" "). Возвращает список из строк. при указании параметра maxsplit, делает такое количество разбиений, сколько вы указали. (Именно разбиений, а не количество частей)

In [79]:
string = "Name;Surname;Age"

In [80]:
string.split(';')

['Name', 'Surname', 'Age']

In [81]:
string = "Name Surname Age"
string.split()

['Name', 'Surname', 'Age']

In [87]:
string.split(" ",1)

['Name', 'Surname Age']

### Методы возвращающие True или False

<table>
  <tr>
    <th>Метод</th>
    <th>Описание</th>
  </tr>
  <tr>
    <td>string.isdigit()</td>
    <td>Состоит ли строка из цифр</td>
  </tr>
  <tr>
    <td>string.isalpha()</td>
    <td>Состоит ли строка из букв</td>
  </tr>
  <tr>
    <td>string.isalnum()</td>
    <td>Состоит ли строка из букв и цифр</td>
  </tr>
  <tr>
    <td>string.islower()</td>
    <td>Все ли символы в нижнем регистре</td>
  </tr>
  <tr>
    <td>string.isupper()</td>
    <td>Все ли символы в верхнем регистре</td>
  </tr>
  <tr>
    <td>string.isupper()</td>
    <td>Все ли символы в верхнем регистре</td>
  </tr>
  <tr>
    <td>string.isspace()</td>
    <td>Состоит ли строка из неотображаемых символов (пробел + см.экранирование)</td>
  </tr>
  <tr>
    <td>string.istitle()</td>
    <td>Начинаются ли слова в строке с заглавной буквы</td>
  </tr>
  <tr>
    <td>string.startswith(str)</td>
    <td>Начинается ли строка с шаблона str</td>
  </tr>
  <tr>
    <td>string.endswith(str)</td>
    <td>Заканчивается ли строка с шаблона str</td>
  </tr>
</table>

### Методы, возвращающие измененные строки

<b>.upper()</b> - переводит все символы в верхний регистр<br>
<b>.lower()</b> - переводит все символы в нижний регистр<br>
<b>.capitalize()</b> - Первый символ становится заглавным, остальные в нижнем регистре<br>
<b>.title()</b> - Первый символ каждого слова становится заглавным, остальные в нижнем регистре<br>
<b>.lstrip()</b> - Удаляет лишние пробельные символы слева<br>
<b>.rstrip()</b> - Удаляет лишние пробельные символы справа<br>
<b>.strip()</b> - Удаляет лишние пробельные символы с обеих сторон<br>
<b>.swapcase()</b> - Верхний регистр становится нижним и наоборот<br>

In [94]:
s = "sadfas".upper()
print(s)
s = s.lower()
print(s)
s = s.capitalize()
print(s)
print("hello world asd asd fad".title())
print('         adsf        '.lstrip())
print('         adsf        '.rstrip())
print('         adsf        '.strip())
print('AbCdEfGhIjKlMnOpQrStUvWxYz'.swapcase())

SADFAS
sadfas
Sadfas
Hello World Asd Asd Fad
adsf        
         adsf
adsf
aBcDeFgHiJkLmNoPqRsTuVwXyZ


### .join([list])

Данный метод соединяет все элементы списка (если они строки) в строку с разделителем

In [171]:
'->'.join([1,2,3,4,5,6])

TypeError: sequence item 0: expected str instance, int found

In [173]:
lst = [str(i) for i in range(1,7)]
print(lst)
'->'.join(lst)

['1', '2', '3', '4', '5', '6']


'1->2->3->4->5->6'

### Работа с символами 

In [2]:
ord('a') # код симовола

97

In [3]:
chr(97) # символ по коду

'a'

In [4]:
rl = []
for i in range(ord('a'), ord('z')+1):
    rl.append(chr(i))
rl

['a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z']

Полный список методов по ссылке: https://docs.python.org/3.7/library/string.html

### Print

print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False) <br>
Функция, выводящая на печать значения <br>
параметр <b>sep</b> - разделитель между значениями <br>
параметр <b>end</b> - чем заканчивается строка <br>
параметр <b>file</b> - в какой файл транслировать информацию <br>

In [146]:
print("Hello")

Hello


In [147]:
print("Hello", "World")

Hello World


In [148]:
print("Hello", "World", sep='---')

Hello---World


In [149]:
print("Hello", "World", end='---')

Hello World---

In [151]:
sourceFile = open('python.txt', 'w')
print("Hello", "World", end='---', file = sourceFile)
sourceFile.close()

### Форматирование строки с помощью метода формат

Пример

In [3]:
num = 5 * 5
#Без участия форматирования
print('5 * 5 = ' + str(num))
#С форматирвоанием
print('5 * 5 = {}'.format(num))

5 * 5 = 25
5 * 5 = 25


In [98]:
name = "Вася"
age = 123
facultet = "ПМиИТ"
kurs = 1
#Без форматирования
print("Студент по имени " + name + " возраста " + str(age) + " лет - студент факультета " + facultet + " " + str(kurs) + "курса")

Студент по имени Вася возраста 123 лет - студент факультета ПМиИТ 1курса


In [99]:
print("Студент по имени {} возраста {} лет - студент факультета {} {} курса".format(name,age,facultet,kurs))

Студент по имени Вася возраста 123 лет - студент факультета ПМиИТ 1 курса


In [102]:
'{0} {1} {0}'.format('abra', 'cad')

'abra cad abra'

можно использовать последовательность и из списка, воспользовавшись оператором *

In [111]:
words = ['abra', 'cad']
'{0} {1} {0}'.format(*words)

'abra cad abra'

Можно использовать и именованные аргументы:

In [105]:
'{first} {second} {first}'.format(first='abra', second='cad')

'abra cad abra'

Соответственно можно использовать такую же фишку, как и со списком, только со словарями

In [107]:
dicti = {'first' : 'abra',
         'second': 'cad'}
'{first} {second} {first}'.format(**dicti)

'abra cad abra'

Внутри поля подстановки {} мы можем указать : и число, что будет указывать длину форматируемому элементу. По умолчанию стоит выравнивание по правой стороне

In [115]:
'|{:30}|'.format(48484)

'|                         48484|'

Однако мы можем сами менять выравнивание. <br>
<b><</b> Выравнивание по левой стороне<br>
<b>></b> Выравнивание по правой стороне<br>
<b>^</b> Выравнивание по центру<br>

Если перед знаком выравнивания поставить какой-либо символ, то все пробельные символы (вне результата) будут заполняться данным символом

In [117]:
print('{:<30}'.format('left aligned'))
print('{:>30}'.format('right aligned'))
print('{:^30}'.format('centered'))
print('{:*^30}'.format('centered'))
print('{:*^30}'.format('centered my text'))

left aligned                  
                 right aligned
           centered           
***********centered***********
*******centered my text*******


Если мы хотим добавить ведущие знаки перед числом, то перед длиной мы должны поставить знак +

In [130]:
print('{:*^+30}, {:o^+30}'.format(15, -15))

*************+15**************, ooooooooooooo-15oooooooooooooo


Добавляем в конце букву f, если хотим, чтобы числа представлялись в вещественном виде

In [134]:
print('{:*^+30f}, {:o^+30f}'.format(15, -15))

**********+15.000000**********, oooooooooo-15.000000oooooooooo


А теперь ограничиваем количество символов после точки (пишется перед f)

In [7]:
print('{:*^+30.3f}, {:o^+30.2f}'.format(15.149214324324134, -15))

***********+15.149************, oooooooooooo-15.00oooooooooooo


Поддерживаются классические операторы для даты и времени

In [138]:
import datetime
d = datetime.datetime(2018, 7, 4, 12, 15, 58)
'{:%Y-%m-%d %H:%M:%S}'.format(d)

'2018-07-04 12:15:58'

Для метода format еще достаточно правил. Смотрите документацию по оф. ссылке: https://docs.python.org/3.4/library/string.html

Мы можем строку сделать шаблоном, после чего постоянно к ней применять метод формат

In [161]:
pattern = '|{:*^+30.2f}|'

In [162]:
for i in range(10,15):
    print(pattern.format(i**2))

|***********+100.00************|
|***********+121.00************|
|***********+144.00************|
|***********+169.00************|
|***********+196.00************|


### F-строки

f-строка - строка с форматированием, начинающаяся с символа f До кавычек или апострофов. Отличие от format - здесь можно использовать вычисления. Все остальные элементы метода формат поддерживаются, кроме шаблонов

In [164]:
f'{25*13}'

'325'

In [165]:
f'{25*13:*^+30.2f}'

'***********+325.00************'

In [167]:
name = "Вася"
age = 123
facultet = "ПМиИТ"
kurs = 1
f"Студент по имени {name} возраста {age} лет - студент факультета {facultet} {kurs} курса"

'Студент по имени Вася возраста 123 лет - студент факультета ПМиИТ 1 курса'