## Дополнительные упражнения на списки

In [1]:
def test(got, expected):
    """Функция test() используется далее для сравнения того,
    что возвращает функция, с тем, что она должна возвращать.
    """
    if got == expected:
        prefix = ' OK '
    else:
        prefix = '  X '
    print('%s got: %s expected: %s' % (prefix, repr(got), repr(expected)))

In [2]:
from math import inf

**E. Без повторов**

Дан список произвольных элементов. Требуется построить список в котором удалены  
идущие подряд одинаковые элементы (аналогично uniq в linux), например:  

    [5, 1, 1, 5, 5] -> [5, 1, 5]

Сделать это надо за линейное время, то есть без вложенных циклов – как явных (`for`/`while`), так и  
неявных (см.скорость выполнения методов list в моих [методах базовых классов](https://docs.google.com/document/d/1sl7M8btPx3OaEOZnLo4d2KG5FhxFIpVHcUiXMT_obBk/edit#heading=h.a76diaht0wqm) или на [wiki.python.org](https://wiki.python.org/moin/TimeComplexity)).

Исходный список должен остаться неизменным.

In [3]:
import itertools

def remove_adjacent_old(nums):
    return [a[0] for a in itertools.groupby(nums)]

def remove_adjacent(nums):
    if(len(nums) == 0): 
        return []
    result = []
    result.append(nums[0])
    for i in range(1,len(nums)):
        if(nums[i] != nums[i-1]):
            result.append(nums[i])
    return result


test(remove_adjacent(''), [])
test(remove_adjacent([1]), [1])
test(remove_adjacent([1, 1, 1, 2, 1]), [1, 2, 1])
test(remove_adjacent([None, None, []]), [None, []])
test(remove_adjacent([7, 3, 3, 1, 1, 6, 7, 7, 1]), [7, 3, 1, 6, 7, 1])
test(remove_adjacent([-1, -1, -1, None, None, (), '', '', [], [], []]),
                     [-1, None, (), '', []])
test(remove_adjacent('a...   caaaat!!!'), list('a. cat!'))
test(remove_adjacent('уууууурррррааааааа'), list('ура'))

 OK  got: [] expected: []
 OK  got: [1] expected: [1]
 OK  got: [1, 2, 1] expected: [1, 2, 1]
 OK  got: [None, []] expected: [None, []]
 OK  got: [7, 3, 1, 6, 7, 1] expected: [7, 3, 1, 6, 7, 1]
 OK  got: [-1, None, (), '', []] expected: [-1, None, (), '', []]
 OK  got: ['a', '.', ' ', 'c', 'a', 't', '!'] expected: ['a', '.', ' ', 'c', 'a', 't', '!']
 OK  got: ['у', 'р', 'а'] expected: ['у', 'р', 'а']


Для списка из 3 миллионов элементов

In [4]:
import random
random.seed(100)
a = []
for i in range(10**5):
    a.append(random.randint(0, 100))
b = a*30

надо уложиться в 1 секунду:

In [5]:
%timeit -n1 -r1 c = remove_adjacent(b)

1.21 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)


**F. Линейное объединение**

Даны два отсортированных списка. Необходимо построить новый список, содержащий элементы  
исходных в отсортированном порядке за линейное время, то есть за один проход как по исходным  
спискам, так и по результирующему. Исходные списки должны остаться неизменными.

In [6]:
def linear_merge(list1, list2):
    result = []
    len_list_1, len_list_2 = len(list1), len(list2)
    if(len_list_1 == 0 and len_list_2 == 0):
        return result
    
    if(len_list_1 == 0):
        return list2
    
    if(len_list_2 == 0):
        return list1
    
    i = 0
    j = 0
    while i < len_list_1 and j < len_list_2:
        if list1[i] > list2[j]:
            result.append(list2[j])
            j += 1
        else:
            result.append(list1[i])
            i += 1
    if i != len_list_1:
        return result + list1[i:]
        
    return result + list2[j:]

test(linear_merge([], []), [])
test(linear_merge([1], []), [1])
test(linear_merge([], [1]), [1])
test(linear_merge([1, 8, 9], [2, 5, 6]), [1, 2, 5, 6, 8, 9])
test(linear_merge([1, 8], [2, 5, 6]), [1, 2, 5, 6, 8])
test(linear_merge([1, 8, 9], [2, 5]), [1, 2, 5, 8, 9])
test(linear_merge([-2, 0, inf], [-1, 8]), [-2, -1, 0, 8, inf])
test(linear_merge(list('az'), list('def')), list('adefz'))
test(linear_merge(list('abz'), list('def')), list('abdefz'))
test(linear_merge(list('aez'), list('df')), list('adefz'))
test(linear_merge([ (), ((),(),()) ],
                  [ ((),()),  ((),)*5 ]),
                  [ (), ((),()), ((),(),()), ((),)*5 ])

 OK  got: [] expected: []
 OK  got: [1] expected: [1]
 OK  got: [1] expected: [1]
 OK  got: [1, 2, 5, 6, 8, 9] expected: [1, 2, 5, 6, 8, 9]
 OK  got: [1, 2, 5, 6, 8] expected: [1, 2, 5, 6, 8]
 OK  got: [1, 2, 5, 8, 9] expected: [1, 2, 5, 8, 9]
 OK  got: [-2, -1, 0, 8, inf] expected: [-2, -1, 0, 8, inf]
 OK  got: ['a', 'd', 'e', 'f', 'z'] expected: ['a', 'd', 'e', 'f', 'z']
 OK  got: ['a', 'b', 'd', 'e', 'f', 'z'] expected: ['a', 'b', 'd', 'e', 'f', 'z']
 OK  got: ['a', 'd', 'e', 'f', 'z'] expected: ['a', 'd', 'e', 'f', 'z']
 OK  got: [(), ((), ()), ((), (), ()), ((), (), (), (), ())] expected: [(), ((), ()), ((), (), ()), ((), (), (), (), ())]


Для двух списков по 150k элементов каждый

In [7]:
a = list(range(0, 3*10**5, 2))
b = list(range(1, 3*10**5, 2))
c = linear_merge(a, b)
test(sorted(c)==c, True)

 OK  got: True expected: True


решение должно укладываться в 1 секунду

In [8]:
%timeit -n1 -r1 c=linear_merge(a, b)

171 ms ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)


Надо заметить, что `sorted(a+b)` укладывается в этот лимит. Но здесь имеется в виду другое решение. 

Когда будем проходить numba, разгоним это другое решение до скорости большей, чем `sorted(a+b)`.