# Базовые коллекции

## Строки (```str```)

[Строковый тип](https://docs.python.org/3.9/library/stdtypes.html#text-sequence-type-str) данных в Python называется ```str```. Для создания строки можно использовать либо функцию ```str``` либо строковые литералы. Их в Python четыре вида: одинарные кавычки, двойные кавычки, тройные одинарные кавычки и тройные двойные кавычки. 

In [4]:
s_1 = ''
s_2 = "foo"
s_3 = '''bar'''
s_4 = """baz"""
print('type(s_1) ->', type(s_1))
print('type(s_2) ->', type(s_2))
print('type(s_3) ->', type(s_3))
print('type(s_4) ->', type(s_4))

type(s_1) -> <class 'str'>
type(s_2) -> <class 'str'>
type(s_3) -> <class 'str'>
type(s_4) -> <class 'str'>


Внутри одинарных кавычек можно использовать дойные, а внутри тройных можно использовать одинарные и двойные без дополнительного экранирования. Использование одинарных кавычек внутри строки, созданной с помощью одинарных кавычек, потребует экранирования. Оно осуществляется с помощью символа ```\```, который указывается перед экранируемым символом.

In [7]:
s_1 = '"Flying Circus"'
s_2 = '\'Monty Python\''
s_3 = '''"spam", 'spam', spam'''
print(s_1)
print(s_2)
print(s_3)

"Flying Circus"
'Monty Python'
"spam", 'spam', spam


В строках есть целый ряд специальных символов, обозначающихся с помощью экранирования, например, перенос строки ```\n```, табуляция ```\t```, перевод каретки ```\r```, backspace ```\b``` и другие.

In [9]:
s = '\tspamalot\n2006\b4'
print(s)

	spamalot
2004


В Python реализовано несколько видов строк, которые обозначаются разными префиксами перед открывающей кавычкой. Обычные строки не используют никаких кавычек. Обратите внимание, что при использовании функции ```print``` специальные символы были интерпретированы как невидимые. Для того, чтобы оставить эти символы "как есть" в Python используется префикс ```r```, означающий "сырые" строки. В таких строках экранированные символы, остаются без изменений.

In [10]:
s = r'\tspamalot\n2006\b4'
print(s)

\tspamalot\n2006\b4


Еще один вид строк - это байтовые строки. Они обозначаются префиксом ```b```. При этом тип такой строки будет уже не ```str```, а ```bytes```.

In [13]:
s = b'\tspamalot\n2006\b4'
print(s)
print('type(s) ->', type(s))

b'\tspamalot\n2006\x084'
type(s) -> <class 'bytes'>


Подробнее со спец. символами и префиксами строк можно ознакомиться в [документации](https://docs.python.org/3.9/reference/lexical_analysis.html#strings).

### Операции со строками

Строки это одна из коллекций. Одной из базовый операций с коллекциями является получение её длины. Для этого в Python используется встроенная функций ```len```. В качестве аргумента она принимает любую коллекцию.

In [14]:
s = 'foo_bar'
print('len(s) ->', len(s))

len(s) -> 7


Строки - это коллекция строк. Нет, не символов. В Python нет символа как отдельного типа данных. Каждый символ также является строкой. Представление строки как коллекции позволяет выполнять ряд действий, характерных для коллекций, например, брать элемент по индексу или брать срез. Индексирование любой последовательности в Python, как и в большинстве других языков, начинается с нуля. Для получения элемента по его индексу достаточно указать коллекцию и в квадратных скобках указать его индекс.

In [15]:
s = 'foo_bar'
print('s[0] =', s[0])
print('s[1] =', s[1])
print('type(s[0]) ->', type(s[0]))
print('type(s[1]) ->', type(s[1]))

s[0] = f
s[1] = o
type(s[0]) -> <class 'str'>
type(s[1]) -> <class 'str'>


Тот факт, что один символ в Python тоже является строкой позволяет бесконечно обращаться по индексу.

In [16]:
s = 'eggs'
print('s[2] =', s[2])
print('s[2][0] =', s[2][0])
print('s[2][0][0][0][0][0] =', s[2][0][0][0][0][0])

s[2] = g
s[2][0] = g
s[2][0][0][0][0][0] = g


В Python существуют не только неотрицательные индексы, но и отрицательные. В этом случае индекс равный ```-1``` указывает на последний элемент коллекции. Использование отрицательных индексов, особенно ```-1```, очень полезно. Это позволяет удобно получать последний элемент коллекции, без необходимости писать длинной выражение ```len(s) - 1```. Обратите внимание, что для получения последнего элемента от длины необходимо отнять 1, т. к. индексация начинается с нуля.

In [17]:
s = 'spiced ham'
print('s[0] =', s[0])
print('s[-1] =', s[-1])
print('s[len(s) - 1] =', s[len(s) - 1])

s[0] = s
s[-1] = m
s[len(s) - 1] = m


На следующей схеме показано каким индексам какие элементы соответствуют. В верхней части указаны отрицательные индексы, а в нижней неотрицательные.

<img src="image/index.png" align="center">

Стоит помнить, что обращение к несуществующим индексам вызывает ошибку ```IndexError```. 

In [18]:
s = 'pacman'
print(s[6])

IndexError: string index out of range

### Форматирование строк

## Списки (```list```)

Одной из базовых коллекций в Python являются списки. Списки призваны хранить упорядоченный набор элементов, которые могут быть разных типов. Литералами списка выступают квадратные скобки ```[]```. Списки имеют тип ```list```. Для создания пустого списка достаточно использовать следующие выражения:

In [1]:
xs = []
ys = list()
print('type(xs) ->', type(xs))
print('type(ys) ->', type(ys))

type(xs) -> <class 'list'>
type(ys) -> <class 'list'>


В списках разрешено хранить объекты любых типов. Однако, их рекомендуется использовать для хранения однотипных данных, например, только чисел, только строк и тд. 

In [2]:
xs = [42, 42., 'foo_bar', [1, 2, 3], None, False]
print(xs)

[42, 42.0, 'foo_bar', [1, 2, 3], None, False]


### Операции со списками

## Словари  (```dict```)

### Операции со словарями

## Кортежи (```tuple```)

### Операции с кортежами

## Множества (```set```)

### Операции со множествами

## Преобразования коллекций

## Полезные сслыки

1. [Документация по структурам данных](https://docs.python.org/3/tutorial/datastructures.html)
2. 