## 1. Коллекции: списки, кортежи, range, (строки), множества, словари и др. Понятие последовательности

### Строки

Строковые константы можно задавать и с помощью одинарных кавычек, и с помощью двойных, и с помощью тройных:

In [None]:
s1 = 'ab"c'
s2 = "ab'c"
s3 = """abc
aaaaaa
aaaaa
a
aa
"""

s1 == s2 == s3

False

In [113]:
print(s3)
print()
s3

NameError: ignored

In [None]:
a = 'a\naaaa'
print(a)
a

a
aaaa


'a\naaaa'

In [None]:
a[3]

'a'

**Внимание:** строки иммутабельны (неизменяемы)!

In [None]:
a[1] = 'b'

TypeError: ignored

Функция `len` — получить длину строки (определена для всех коллекций):

In [None]:
len("abc")

3

[1, 2, [1, 2, 3]]

У типа str большое количество встроенных строковых методов:
* .find — найти подстроку
* .upper — перевести строку в верхний регистр
* .lower — перевести строку в нижний регистр
* .strip — обрезать по краям поданные символы (по умолчанию пробельные)
* ...

https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str

Все они возвращают новый экземпляр строки!

In [None]:
s3.replace('a', '10')

'10bc\n101010101010\n1010101010\n10\n1010\n'

In [None]:
s1.find('b')

1

In [None]:
s1[-1]

'c'

In [None]:
sl = s1.upper()
sl

'AB"C'

In [None]:
s1.upper().lower()

'ab"c'

In [None]:
"a   ".strip()

'a'

In [None]:
z = '      z.      '

In [None]:
z.strip()

'z.'

In [None]:
z.rstrip()

'      z.'

In [None]:
z.lstrip()

'z.      '

Продвинутая индексация: Слайсы

In [None]:
s = 'abcde'

In [None]:
'b' + s[1:]

'bbcde'

In [None]:
s[1:]

'bcde'

In [None]:
s[1:-1]

'bcd'

In [None]:
s_new = s[2:4]
print(s)
s_new

abcde


'cd'

s[start:finish:step]

* start — начало среза
* finish — конец среза (не входит в срез!!!)
* step — шаг

Индексы в питоне могут быть отрицательными! В таком случае считаем с конца (или двигаемся в обратном направлении, если это step)

In [None]:
s = '0123456789'

In [None]:
s[::2]

'02468'

In [None]:
s[-1:1:-1]

'98765432'

In [None]:
s[::-2]

'97531'

In [None]:
s[::3]

'0369'

Срез равный всей строке:

In [None]:
s[0:len(s):1]

'0123456789'

Cрез с шагом 2:

In [None]:
s[0:len(s):2]

'02468'

Срез равный одному элементу:

In [None]:
s[5:6:1]

'5'

Строки, как мы помним, можно складывать и умножать:

In [None]:
s_new + s3

'cdabc\naaaaaa\naaaaa\na\naa\n'

In [None]:
s_new * 5

'cdcdcdcdcd'

### Списки

In [None]:
a = [1, 2, 3, 2, 0]

В список могут входить любые объекты:

In [2]:
a = [1, '2', '3', [4, 5]]
a.append(1.2)
a

[1, '2', '3', [4, 5], 1.2]

Списки тоже поддерживают многие операции!

* cложение списков (+) — конкатенация списков
* умножение списка на целое число n (*) — повтороение списка n раз
* слайсы!

Всё это вместе называется концепцией последовательности. К "последовательным" типам относятся списки, кортежи (иммутабельные списки), range(), строки (в качестве символьных последовательностей)

Помимо упомянутых операций сложения, умножения, слайсов, измерения длины, поддерживаются операции in (not in), min, max, index (поиск), count

In [None]:
b = [1, '2']
a + b

[1, '2', '3', [4, 5], 1.2, 1, '2']

In [None]:
a * 2

[1, '2', '3', [4, 5], 1.2, 1, '2', '3', [4, 5], 1.2]

In [None]:
a[::-1]

[1.2, [4, 5], '3', '2', 1]

In [None]:
'2' in a + b

True

In [None]:
2 not in a + b

True

In [3]:
min(a) # работает не всегда!

TypeError: ignored

In [4]:
max([10, 1000, 1, 2, 5000, 3])

5000

In [5]:
min(['1', '2', '3', 'abc', "абв"])

'1'

In [7]:
a.index([4, 5])
#[4, 5] in a

3

In [None]:
a.count(2)

0

Другие коллекции тоже поддерживают многое из этого!

**Внимание:** список — изменяемый объект!

Можно менять элементы списка, можно добавлять новые элементы и удалять старые (`.append` и `.pop`).

In [8]:
a[0] = '123'
a

['123', '2', '3', [4, 5], 1.2]

In [9]:
a.append('data science')
a

['123', '2', '3', [4, 5], 1.2, 'data science']

### Преобразования списков и строк

Два основных строковых метода для взаимодействия списков и строк:

* .split — разделить строку на список строк по определённому сепаратору
* .join — соеденить список строк в одну большую строку по определённому сепаратору

In [10]:
s = 'one,two,three'
s.split(',')

['one', 'two', 'three']

In [11]:
", ".join(['arb', 'borb', 'kork'])

'arb, borb, kork'

### Другие коллекции

**Кортежи**: иммутабельные списки

In [12]:
a = (1, )
a

(1,)

In [13]:
a = (1, 2, 3)
a

(1, 2, 3)

In [14]:
a[0] = 7

TypeError: ignored

In [15]:
c = ('1', 2, 3)
c

('1', 2, 3)

**range**: итерируемый объект

In [16]:
a = range(3, 17, 3)
a

range(3, 17, 3)

In [17]:
for x in a:
  print(type(x))

<class 'int'>
<class 'int'>
<class 'int'>
<class 'int'>
<class 'int'>


**Множество**: коллекция без повторов

In [23]:
a = {1, 2, 3, 3, 2, 4}
a
a.add('1')
a
a.add((1, 2, 3))
a
a.add(1)
a

{(1, 2, 3), 1, '1', 2, 3, 4}

In [36]:
{1} - a

set()

In [29]:
a.add(frozenset({1, 3, 7}))

In [30]:
a

{(1, 2, 3), 1, '1', 2, 3, 4, frozenset({1, 3, 7})}

In [24]:
a[1]

TypeError: ignored

In [39]:
b = frozenset('aabc1')
b

frozenset({'1', 'a', 'b', 'c'})

In [40]:
a & b

{'1'}

In [41]:
a | b

{(1, 2, 3), 1, '1', 2, 3, 4, 'a', 'b', 'c', frozenset({1, 3, 7})}

In [43]:
help({1, 2})

Help on set object:

class set(object)
 |  set() -> new empty set object
 |  set(iterable) -> new set object
 |  
 |  Build an unordered collection of unique elements.
 |  
 |  Methods defined here:
 |  
 |  __and__(self, value, /)
 |      Return self&value.
 |  
 |  __contains__(...)
 |      x.__contains__(y) <==> y in x.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iand__(self, value, /)
 |      Return self&=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __ior__(self, value, /)
 |      Return self|=value.
 |  
 |  __isub__(self, value, /)
 |      Return self-=value.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __ixor__(self, value, /)
 |      Return self^=value.


In [45]:
# 0 ^ 0 = 0
# 0 ^ 1 = 1
# 1 ^ 0 = 1
# 1 ^ 1 = 0

In [46]:
a ^ b

{(1, 2, 3), 1, 2, 3, 4, 'a', 'b', 'c', frozenset({1, 3, 7})}

In [47]:
a.symmetric_difference(b)

{(1, 2, 3), 1, 2, 3, 4, 'a', 'b', 'c', frozenset({1, 3, 7})}

In [50]:
a.symmetric_difference_update(b)
a

{(1, 2, 3), 1, 2, 3, 4, 'a', 'b', 'c', frozenset({1, 3, 7})}

**Словари**: набор пар ключ-значение, индексируемый ключами (хеши)

In [33]:
d = {1: 3, '1': 4, (1, 2, 3): 5, b: 10}
d

{1: 3, '1': 4, (1, 2, 3): 5, frozenset({'a', 'b', 'c'}): 10}

In [35]:
d[frozenset('abbbbc')]

10

In [54]:
c = {(): 3}

## 3. Итерируемся!

В анализе данных нужно много итерироваться по коллекциям!

In [55]:
for i in a:
  print(i)

1
2
3
4
a
frozenset({1, 3, 7})
(1, 2, 3)
b
c


In [60]:
for i, j in enumerate(a):
  print(i, j)
k, b, c = (1, 2, 3)
print(k, b, c)
# x, y = [1, 2, 3]
# print(x, y)

0 1
1 2
2 3
3 4
4 a
5 frozenset({1, 3, 7})
6 (1, 2, 3)
7 b
8 c
1 2 3


In [64]:
print(d)

{1: 3, '1': 4, (1, 2, 3): 5, frozenset({'a', 'b', 'c'}): 10}


In [63]:
for k in d:
  print(k)

1
1
(1, 2, 3)
frozenset({'a', 'b', 'c'})


In [65]:
for i in sorted([2, 4, 3, 1, 5, 8, 7]):
  print(i)

1
2
3
4
5
7
8


In [None]:
for k, v in sorted(d.items()):
  print(k, v)

TypeError: ignored

In [None]:
from itertools import *

In [68]:
import itertools
for elem in itertools.chain('ABC', 'DEF', [1, 2, 3]):
  print(elem)

A
B
C
D
E
F
1
2
3


In [74]:
a = [1, 2, 3, 4]
b = [1, 2, 3, 4, 5, 6]
for i, j, k in zip(a * 2, b, d.items()):
  print(i, j, k)

1 1 (1, 3)
2 2 ('1', 4)
3 3 ((1, 2, 3), 5)
4 4 (frozenset({'a', 'b', 'c'}), 10)


In [76]:
l = [1, 2, 3, 4, 5, 5]
for i in reversed(l):
  print(i)

5
5
4
3
2
1


In [77]:
for i in sorted(set(reversed(l))):
  print(i)

1
2
3
4
5


## 4. Функции

In [91]:
def plus(a, b):
  '''This is function to summarize two elements'''
  return a + b

print(plus)
plus

<function plus at 0x799f0a246cb0>


<function __main__.plus(a, b)>

In [85]:
plus.__call__.__call__.__call__(1, 2)

3

In [92]:
help(plus)

Help on function plus in module __main__:

plus(a, b)
    This is function to summarize two elements



In [79]:
dir(plus)

['__annotations__',
 '__builtins__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

In [96]:
locals()

{'__name__': '__main__',
 '__doc__': 'Automatically created module for IPython interactive environment',
 '__package__': None,
 '__loader__': None,
 '__spec__': None,
 '__builtin__': <module 'builtins' (built-in)>,
 '__builtins__': <module 'builtins' (built-in)>,
 '_ih': ['',
  'min(a) # работает не всегда!',
  "a = [1, '2', '3', [4, 5]]\na.append(1.2)\na",
  'min(a) # работает не всегда!',
  'max([10, 1000, 1, 2, 5000, 3])',
  'min([\'1\', \'2\', \'3\', \'abc\', "абв"])',
  'a.index([4, 5])\n[4, 5] in a',
  'a.index([4, 5])\n#[4, 5] in a',
  "a[0] = '123'\na",
  "a.append('data science')\na",
  "s = 'one,two,three'\ns.split(',')",
  '", ".join([\'arb\', \'borb\', \'kork\'])',
  'a = (1, )\na',
  'a = (1, 2, 3)\na',
  'a[0] = 7',
  "c = ('1', 2, 3)\nc",
  'a = range(3, 17, 3)\na',
  'for x in a:\n  print(type(x))',
  "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na\na.add((1, 2, 3))\na",
  'a = {1, 2, 3, 3, 2, 4}\na',
  "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na",
  "a = {1, 2, 3, 3, 2, 4}\na\

In [94]:
def print_locals():
  print(locals())

In [95]:
print_locals()

{}


In [97]:
globals()

{'__name__': '__main__',
 '__doc__': 'Automatically created module for IPython interactive environment',
 '__package__': None,
 '__loader__': None,
 '__spec__': None,
 '__builtin__': <module 'builtins' (built-in)>,
 '__builtins__': <module 'builtins' (built-in)>,
 '_ih': ['',
  'min(a) # работает не всегда!',
  "a = [1, '2', '3', [4, 5]]\na.append(1.2)\na",
  'min(a) # работает не всегда!',
  'max([10, 1000, 1, 2, 5000, 3])',
  'min([\'1\', \'2\', \'3\', \'abc\', "абв"])',
  'a.index([4, 5])\n[4, 5] in a',
  'a.index([4, 5])\n#[4, 5] in a',
  "a[0] = '123'\na",
  "a.append('data science')\na",
  "s = 'one,two,three'\ns.split(',')",
  '", ".join([\'arb\', \'borb\', \'kork\'])',
  'a = (1, )\na',
  'a = (1, 2, 3)\na',
  'a[0] = 7',
  "c = ('1', 2, 3)\nc",
  'a = range(3, 17, 3)\na',
  'for x in a:\n  print(type(x))',
  "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na\na.add((1, 2, 3))\na",
  'a = {1, 2, 3, 3, 2, 4}\na',
  "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na",
  "a = {1, 2, 3, 3, 2, 4}\na\

In [100]:
def print_globals():
  print(globals())

In [101]:
print_globals()

{'__name__': '__main__', '__doc__': 'Automatically created module for IPython interactive environment', '__package__': None, '__loader__': None, '__spec__': None, '__builtin__': <module 'builtins' (built-in)>, '__builtins__': <module 'builtins' (built-in)>, '_ih': ['', 'min(a) # работает не всегда!', "a = [1, '2', '3', [4, 5]]\na.append(1.2)\na", 'min(a) # работает не всегда!', 'max([10, 1000, 1, 2, 5000, 3])', 'min([\'1\', \'2\', \'3\', \'abc\', "абв"])', 'a.index([4, 5])\n[4, 5] in a', 'a.index([4, 5])\n#[4, 5] in a', "a[0] = '123'\na", "a.append('data science')\na", "s = 'one,two,three'\ns.split(',')", '", ".join([\'arb\', \'borb\', \'kork\'])', 'a = (1, )\na', 'a = (1, 2, 3)\na', 'a[0] = 7', "c = ('1', 2, 3)\nc", 'a = range(3, 17, 3)\na', 'for x in a:\n  print(type(x))', "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na\na.add((1, 2, 3))\na", 'a = {1, 2, 3, 3, 2, 4}\na', "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na", "a = {1, 2, 3, 3, 2, 4}\na\na.add('1')\na\na.add((1, 2, 3))\na", "a = {1, 2,

In [110]:
def print_locals():
  a = 10
  print(locals())
  variable_name = input('Напишите переменную, значение которой хотите узнать: ')
  print(locals()[variable_name])

In [111]:
print_locals()

{'a': 10}
Напишите переменную, значение которой хотите узнать: a
10


In [112]:
variable_name = input('Напишите переменную, значение которой хотите узнать: ')
print(globals()[variable_name])

Напишите переменную, значение которой хотите узнать: _i10
s = 'one,two,three'
s.split(',')


In [120]:
def func():
  pass

In [121]:
func()['a']

TypeError: ignored

In [122]:
None

In [123]:
type(None)

NoneType

In [124]:
help(None)

Help on NoneType object:

class NoneType(object)
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      True if self else False
 |  
 |  __repr__(self, /)
 |      Return repr(self).
 |  
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.



In [125]:
if None:
  print(1)

In [135]:
def func():
  print(1)
  return 2

In [136]:
func()

1


2

In [143]:
my_globals = globals

In [144]:
type(my_globals)

builtin_function_or_method

In [145]:
my_globals_return_value = globals()

In [146]:
type(my_globals_return_value)

dict

In [137]:
my_object = func()
my_new_func = func

1


In [138]:
my_object == None

False

In [139]:
my_object

2

In [140]:
my_object()

TypeError: ignored

In [141]:
my_new_func

<function __main__.func()>

In [142]:
my_new_func()

1


2

In [119]:
dictionary = globals()
dictionary[variable_name]

"s = 'one,two,three'\ns.split(',')"

**Рекурсия**

In [117]:
def sum(a, b):
  sum(a + 3 * b, 2 * a - 2 * b)

In [118]:
sum(1, 2)

RecursionError: ignored