In [1]:
# display all outputs, not only last one
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
print('done')

done


In [2]:
%load_ext line_profiler
%load_ext memory_profiler

In [None]:
# %load mapping_list.py
import random

from memory_profiler import profile


ABC = 'abcdefghijklmnopqrstufwxyzABCDEFGHIJKLMNOPQRSTUFWXYZ'


def prepare_data(letters, words):
    return [''.join(random.sample(ABC, letters)) for _ in range(words)]


def to_upper_v1(data):
    return map(lambda x: x.upper(), data)


def to_upper_v2(data):
    return (word.upper() for word in data)


def to_upper_v3(data):
    return [word.upper() for word in data]


def to_upper_v4(data):
    result = []
    for word in data:
        result.append(word.upper())
    return result


In [None]:
# %load test_mapping_list.py
from mapping.mapping_list import to_upper_v1, to_upper_v2, to_upper_v3, to_upper_v4


def test_to_upper_v1():
    actual = list(to_upper_v1(['abc', 'deFgH', 'ijKL']))
    expected = ['ABC', 'DEFGH', 'IJKL']
    assert actual == expected


def test_to_upper_v2():
    actual = list(to_upper_v2(['abc', 'deFgH', 'ijKL']))
    expected = ['ABC', 'DEFGH', 'IJKL']
    assert actual == expected

    
def test_to_upper_v3():
    actual = to_upper_v3(['abc', 'deFgH', 'ijKL'])
    expected = ['ABC', 'DEFGH', 'IJKL']
    assert actual == expected


def test_to_upper_v4():
    actual = to_upper_v4(['abc', 'deFgH', 'ijKL'])
    expected = ['ABC', 'DEFGH', 'IJKL']
    assert actual == expected


In [6]:
!python -m pytest -v test_mapping_list.py

platform win32 -- Python 3.7.4, pytest-5.4.3, py-1.9.0, pluggy-0.13.1 -- F:\!EPAM\HW_Lesson12\venv\Scripts\python.exe
cachedir: .pytest_cache
rootdir: F:\!EPAM\HW_Lesson12\mapping
collecting ... collected 0 items / 1 error

____________________ ERROR collecting test_mapping_list.py ____________________
ImportError while importing test module 'F:\!EPAM\HW_Lesson12\mapping\test_mapping_list.py'.
Hint: make sure your test modules/packages have valid Python names.
Traceback:
test_mapping_list.py:1: in <module>
    from mapping.mapping_list import to_upper_v1, to_upper_v2, to_upper_v3, to_upper_v4
E   ModuleNotFoundError: No module named 'mapping'
ERROR test_mapping_list.py
!!!!!!!!!!!!!!!!!!! Interrupted: 1 error during collection !!!!!!!!!!!!!!!!!!!!


In [None]:
data = prepare_data(24, 10000)

In [None]:
print('First version (with map-function):')
%timeit to_upper_v1(data)
print('\nSecond version (with generator):')
%timeit to_upper_v2(data)
print('\nThird version (with list comprehansion):')
%timeit to_upper_v3(data)
print('\nFourth version (with for-loop):')
%timeit to_upper_v4(data)

In [None]:
import cProfile

data = prepare_data(24, 10000)

def benchmark(n):
    for i in range(n):
        to_upper_v1(data)
        to_upper_v2(data)
        to_upper_v3(data)
        to_upper_v4(data)


cProfile.run('benchmark(1000)', sort='tottime')

In [None]:
%lprun -f benchmark benchmark(1)

Timer unit: 1e-07 s

Total time: 0.0164431 s
File: <ipython-input-8-6760ac1f87d9>
Function: benchmark at line 5

Line       Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     5                                           def benchmark(n):
     6         2        121.0     60.5      0.1      for i in range(n):
     7         1         78.0     78.0      0.0          to_upper_v1(data)
     8         1         71.0     71.0      0.0          to_upper_v2(data)
     9         1      60037.0  60037.0     36.5          to_upper_v3(data)
    10         1     104124.0 104124.0     63.3          to_upper_v4(data)

In [None]:
# %load mapping_list_memory_profiling.py
from memory_profiler import profile

from mapping_list import to_upper_v1, to_upper_v2, to_upper_v3, to_upper_v4, prepare_data


@profile
def run_all():
    data = prepare_data(24, 10000)
    result1 = to_upper_v1(data)
    result2 = to_upper_v2(data)
    result3 = to_upper_v3(data)
    result4 = to_upper_v4(data)

    
if __name__ == '__main__':
    run_all()


In [None]:
!python mapping_list_memory_profiling.py

Если результат работы функций `to_upper_v1` и `to_upper_v2` нужно использовать для дальнейшей обработки в виде итерируемого объекта, то можно возвращать не собственно список, а генератор или map-объект, тогда получаем и значительный выигрыш по быстродействию (ведь фактически из-за "ленивости" генератора и map-объекта вычисления именно в момент вызова функции не производятся, они будут производится позже, по мере необходимости), и по экономии памяти. Хуже всего работает чистый цикл `for` (очевидно, из-за того, что в каждой итерации происходит обращение к памяти для добавления в список нового элемента).

__Попробуем изменить первые две функции, чтобы они тоже возвращали список.__

In [None]:
def to_upper_v1_to_list(data):
    return list(map(lambda x: x.upper(), data))


def to_upper_v2_to_list(data):
    return list(word.upper() for word in data)


def to_upper_v3(data):
    return [word.upper() for word in data]

In [None]:
%timeit to_upper_v1_to_list(data)
%timeit to_upper_v2_to_list(data)
%timeit to_upper_v3(data)

In [None]:
data = prepare_data(24, 10000)

def benchmark_2(n):
    for i in range(n):
        to_upper_v1_to_list(data)
        to_upper_v2_to_list(data)
        to_upper_v3(data)


cProfile.run('benchmark_2(1000)', sort='tottime')

In [None]:
%lprun -f benchmark_2 benchmark_2(1)

Timer unit: 1e-07 s

Total time: 0.0215237 s
File: <ipython-input-17-3abed70fe950>
Function: benchmark_2 at line 3

Line       Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     3                                           def benchmark_2(n):
     4         2         87.0     43.5      0.0      for i in range(n):
     5         1      86059.0  86059.0     40.0          to_upper_v1_to_list(data)
     6         1      70513.0  70513.0     32.8          to_upper_v2_to_list(data)
     7         1      58578.0  58578.0     27.2          to_upper_v3(data)

In [None]:
%%writefile mapping_list_memory_profiling_2.py
from memory_profiler import profile

from mapping_list_2 import to_upper_v1_to_list, to_upper_v2_to_list, to_upper_v3, to_upper_v4, prepare_data


@profile
def run_all():
    data = prepare_data(24, 10000)
    result1 = to_upper_v1_to_list(data)
    result2 = to_upper_v2_to_list(data)
    result3 = to_upper_v3(data)
    result4 = to_upper_v4(data)

    
if __name__ == '__main__':
    run_all()


In [None]:
!python mapping_list_memory_profiling_2.py

Таким образом, получаем, что операция преобразования генератора в список "съедает" практически весь выигрыш от его "ленивости", и в целом он работает даже медленнее, чем list comprehension.

В целом, выигрыш от функции map или генератора будет ощутим, если результаты его работы будут передаваться для дальнейшей обработки в виде итератора. При этом если в итоге будут обработаны все элементы списка, то мы получим лишь выигрыш по памяти, поскольку время на их обработку может оказаться даже больше, чем при использовании list comprehension (возможно, за счет дополнительных операций по созданию самого генератора и работы с элементами списка через него).