# Задача перед консультацией 31 мая 2020
Имеем два списка целых чисел. Необходимо найти общее число элементов

In [1]:
a = [1, 2, 3]
b = [2, 3, 4]

Решение в лоб:

In [2]:
intersection_count = 0

for x in b:
    if x in a:
        intersection_count += 1
        
print(intersection_count)

2


Посмотрим насколько быстро работает. Возьмем списки побольше и многократно прогоним цикл:
- список a принимает значения от 10 до 10 тысяч
- список b принимает значения от 100 до 100 тысяч
- замеряем время выполнения с помощью магической команды %%time

In [3]:
a = list(range(10, 10**4))
b = list(range(10**2, 10**5))

In [4]:
%%time
intersection_count = 0

for x in b:        
    if x in a:
        intersection_count += 1
        
print(intersection_count)

9900
CPU times: user 11.1 s, sys: 72.8 ms, total: 11.1 s
Wall time: 11.7 s


# Время для оптимизации
Заменим список a на множество. Множество устроено на основе хэш-таблиц, поэтому в большинстве случаев поиск по нему не зависит от времени. И в случае большого числа элементов происходит гораздо быстрее, чем по списку. Итак, меняем объявление списка a на множество:
```python
a = set(range(10, 10**4))
```

In [5]:
a = set(range(10, 10**4))
b = list(range(10**2, 10**5))

In [6]:
%%time
intersection_count = 0

for x in b:        
    if x in a:
        intersection_count += 1
        
print(intersection_count)

9900
CPU times: user 11.1 ms, sys: 2.46 ms, total: 13.5 ms
Wall time: 17.3 ms


Теперь проверим, что от размера множества a теперь мало что зависит. Попробуем увеличить его размеры на порядок.

In [7]:
a = set(range(10, 10**5))

In [8]:
%%time
intersection_count = 0

for x in b:        
    if x in a:
        intersection_count += 1
        
print(intersection_count)

99900
CPU times: user 14.4 ms, sys: 553 µs, total: 15 ms
Wall time: 15.7 ms


Увеличим еще на порядок

In [9]:
a = set(range(10, 10**6))

In [10]:
%%time
intersection_count = 0

for x in b:        
    if x in a:
        intersection_count += 1
        
print(intersection_count)

99900
CPU times: user 13.8 ms, sys: 737 µs, total: 14.5 ms
Wall time: 16.4 ms


И еще на порядок

In [11]:
a = set(range(10, 10**7))

In [12]:
%%time
intersection_count = 0

for x in b:        
    if x in a:
        intersection_count += 1
        
print(intersection_count)

99900
CPU times: user 16.6 ms, sys: 906 µs, total: 17.5 ms
Wall time: 17.6 ms


Число элементов для поиска растет, а время выполнения - нет. Множества это круто.