## Словари

Новая структура данных -- словарь (`dict`)

Эта структура данных хранит пары ключ-значение и предоставляет быстрый доступ по ключу

In [81]:
# оценки разных людей
marks = {
    'bob': 5,
    'alice': 4,
    'dan': 5,
    'bill': 3
}
marks

{'alice': 4, 'bill': 3, 'bob': 5, 'dan': 5}

In [77]:
marks['bob']

5

In [3]:
marks['alice'] = 5
marks['anonymus'] = 1
marks

{'alice': 5, 'anonymus': 1, 'bill': 3, 'bob': 5, 'dan': 5}

In [4]:
print('alice' in marks)
print('mary' in marks)

True
False


In [80]:
print(marks.keys())
print(marks.values())
print(marks.items())

dict_keys(['bob', 'alice', 'dan', 'bill'])
dict_values([5, 4, 5, 3])
dict_items([('bob', 5), ('alice', 4), ('dan', 5), ('bill', 3)])


In [6]:
for key in marks:
    print(key, marks[key])

bob 5
alice 5
dan 5
bill 3
anonymus 1


In [82]:
d = {[1, 2]: 1}

TypeError: unhashable type: 'list'

**порядок итерации по словарю произволен**

в отличие от ситуации со списком списка, элементы в словаре не упорядочены, а лежат в соответствии со своими хешами

**ключом словаря может быть только неизменяемый тип данных**

например: строки, числа, кортежи

не могут быть ключами: списки, словари, множества и тд

## Кортежи

Кортеж -- неизменяемый список

Одно из применений -- можно использовать как ключ словаря

In [11]:
c = (1, 2, 'Hello')
c

(1, 2, 'Hello')

In [83]:
c[0:2]

(1, 2)

In [12]:
c[0] = 0

TypeError: 'tuple' object does not support item assignment

In [85]:
d = {
    (1, 2): 'a',
    (1, 3): 'b',
    (2, 1): 'c'
}
d

{(1, 2): 'a', (1, 3): 'b', (2, 1): 'c'}

## Множества

в этом типе данных все элементы уникальны

множество поддерживает операцию `in` за константное время (в случае со списком это `O(n)`)

In [87]:
s = set([1, 2, 3, 4, 3, 2, 1])
s

{1, 2, 3, 4}

In [88]:
print(1 in s)
print(5 in s)
print(5 not in s)

True
False
True


In [92]:
s.add(10)
s

{1, 2, 3, 4, 10}

In [93]:
s.add(1)
s

{1, 2, 3, 4, 10}

**элементы множества неупорядочены также как и ключи в массиве**

In [90]:
s[0]

TypeError: 'set' object does not support indexing

доступ к элементам множества можно получить через `for ... in` или `list(s)`

In [94]:
list(s)

[1, 2, 3, 4, 10]

Также есть много удобных функций для множеств, например объединение двух множеств

In [34]:
s1 = {1, 2, 3, 4}
s2 = {2, 3, 4, 5}
s1.union(s2)

{1, 2, 3, 4, 5}

или разность

In [48]:
s1 - s2

{1}

Множества позволяют элегантно решать некоторые задачи, например нахождение количества уникальных слов в тексте

In [99]:
with open('sherlock.txt') as f:
    text = f.read().lower()

word_list = text.split()
word_list[:10]

['the',
 'adventures',
 'of',
 'sherlock',
 'holmes',
 'arthur',
 'conan',
 'doyle',
 'table',
 'of']

In [100]:
word_set = set(word_list)

In [101]:
len(word_set)

14093

найдем, какие буквы не встречаются в данной фразе

In [108]:
s = 'Neque porro quisquam est qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit'

In [111]:
print(ord('a'))
print(ord('z'))
print(chr(98))

97
122
b


In [47]:
set(map(chr, range(ord('a'), ord('z')+1))) - set(s.lower())

{'b', 'f', 'g', 'h', 'j', 'k', 'w', 'x', 'y', 'z'}

In [173]:
from collections import Counter

c = Counter()
c.update(text.split())

In [176]:
c.update(['the', 'the'])

In [177]:
c['the']

5252

## Работа с файлами

In [168]:
with open('sherlock.txt', encoding='utf8') as f:
    text = f.read()

In [121]:
with open('untitled.txt', ) as f:
    print(f.read())

русский


In [117]:
with open('out.txt', 'w') as f:
    f.write("\nI'm writing to file!!!\n")

In [115]:
with open('sherlock.txt') as f:
    i = 0
    for line in f:
        i += 1
print(i)

12195


In [52]:
import os

In [119]:
os.listdir()

['out.txt',
 'func.ipynb',
 'Homework2.ipynb',
 '.ipynb_checkpoints',
 'Lesson3.ipynb',
 'Homework1.ipynb',
 'Lesson1-2.ipynb',
 'sherlock.txt']

Мини задачка: пройдите по всем файлам в текущей директории и выведите имя и первые 100 символов каждого файла (вам понадобится функция `os.path.isfile`)

In [125]:
os.path.isfile('.ipyn')

False

In [129]:
for path in os.listdir():
    if os.path.isfile(path):
        try:
            with open(path, encoding='utf8') as f:
                print(f.read()[:100])
        except:
            pass

I'm writing to file!!!I'm writing to file!!!
I'm writing to file!!!

{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Элементы фун
русский
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Второе домашн
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Словари"
   
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Первое домашн
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "На наших заняти




                        THE ADVENTURES OF SHERLOCK HOLMES

                               Arthur


In [163]:
marks = {
    'bob': {
        'city': 'a',
        'age': 1
    },
    1: 4,
    'dan': [1, 2],
    'bill': 3
}

In [155]:
import json

In [164]:
s = json.dumps(marks)
s

'{"bob": {"city": "a", "age": 1}, "1": 4, "dan": [1, 2], "bill": 3}'

In [165]:
json.dump(marks, open('out.txt', 'w'))

In [161]:
s = '{"1": 2}'
json.loads(s)

{'1': 2}

In [166]:
json.load(open('out.txt'))

{'1': 4, 'bill': 3, 'bob': {'age': 1, 'city': 'a'}, 'dan': [1, 2]}

In [167]:
json.load(open('Lesson3.ipynb'))

{'cells': [{'cell_type': 'markdown', 'metadata': {}, 'source': ['## Словари']},
  {'cell_type': 'markdown',
   'metadata': {},
   'source': ['Новая структура данных -- словарь (`dict`)\n',
    '\n',
    'Эта структура данных хранит пары ключ-значение и предоставляет быстрый доступ по ключу']},
  {'cell_type': 'code',
   'execution_count': 81,
   'metadata': {},
   'outputs': [{'data': {'text/plain': ["{'alice': 4, 'bill': 3, 'bob': 5, 'dan': 5}"]},
     'execution_count': 81,
     'metadata': {},
     'output_type': 'execute_result'}],
   'source': ['# оценки разных людей\n',
    'marks = {\n',
    "    'bob': 5,\n",
    "    'alice': 4,\n",
    "    'dan': 5,\n",
    "    'bill': 3\n",
    '}\n',
    'marks']},
  {'cell_type': 'code',
   'execution_count': 77,
   'metadata': {},
   'outputs': [{'data': {'text/plain': ['5']},
     'execution_count': 77,
     'metadata': {},
     'output_type': 'execute_result'}],
   'source': ["marks['bob']"]},
  {'cell_type': 'code',
   'execution_cou