Функции

In [3]:
from datetime import datetime

def current_seconds():
    # ниже указана строка docstring, которая описывает, 
    # что делает функция, публикуется в help
    """return current second""" 
    return datetime.now()

current_seconds()

datetime.datetime(2023, 1, 2, 12, 32, 4, 376916)

In [5]:
help(current_seconds)

Help on function current_seconds in module __main__:

current_seconds()
    return current second



In [6]:
print(type(current_seconds))

<class 'function'>


In [8]:
# Выводит docstring
print(current_seconds.__doc__)
# Полный список методов функции
print(dir(current_seconds))

return current second
['__annotations__', '__call__', '__class__', '__closure__', '__code__', '__defaults__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__get__', '__getattribute__', '__globals__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__kwdefaults__', '__le__', '__lt__', '__module__', '__name__', '__ne__', '__new__', '__qualname__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']


In [9]:
# Создаем alias для фунции
func = current_seconds
func()

datetime.datetime(2023, 1, 2, 12, 36, 33, 759072)

In [10]:
def add(a,b):
    return a+b

def power(a,b):
    return a**b

def sub(a,b):
    return a-b

key = 'power'

func = {'add': add, 'power': power, 'sub': sub}[key]

func(2,3)

8

In [11]:
func = {'add': add, 'power': power, 'sub': sub}[key]
print(type(func))

<class 'function'>


In [15]:
func = {'add': add, 'power': power, 'sub': sub}
print(type(func))
print(type(func[key]))

<class 'dict'>
<class 'function'>


In [18]:
# В функции можно создавать атрибуты
def func():
    func.counter+=1
    print(func.counter)
    return func.counter

func.counter = 0

for i in range(0,3):
    func()

1
2
3


In [21]:
# Можно проверять существует ли атрибут внутри функции оператором hasattr
# Создавать атрибут функции можно оператором setattr
def func():
    if not hasattr(func, 'counter'):
        setattr(func, 'counter', 0)
    func.counter += 1

In [22]:
for i in range(0,5,1):
    func()

print(func.counter)

5


In [26]:
# Внутри функции можно объявлять другие функции

def func():
    def bar():
        print('33')
    print('here')
    return(bar())

func()

here
33


In [32]:
# Когда используется объявление функции внутри функции? Когда ей никто больше пользоваться не будет.
# Второй хороший пример - декораторы.
def load_data(filename):
    def parse(s):
        doc_id, url, ts = s.split('\t')
        doc_id = int(doc_id)
        ts = datetime.fromtimestamp (int(ts))
        return doc_id, url, ts

    with open (filename) as f:
        f = map (parse, f)
        for doc_id, url, ts in f:
            pass
    return data

In [37]:
def func(a,b,c,d):
    print(f"a={a}, b={b}, c={c}, d={d}")

In [39]:
print(func(1,3,2,4))
# Сначала всегда идут позиционные аргументы и только потом именованные
print(func(1,2,c=4,d=6))

a=1, b=3, c=2, d=4
None
a=1, b=2, c=4, d=6
None


In [40]:
# Распаковка аргументов с помощью здвездочки. 
# Распаковка распаковывает аргументы и передает позиционным образом.

args = (1,2,3,4)
func(*args)

a=1, b=2, c=3, d=4


In [42]:
args = ['str1','str2', 'str3']
print(*args, sep=';')

str1;str2;str3


In [43]:
# Если аргументы имеют длинные названия
def func_complex(learning_rate, item_alpha, user_alpha, option):
    return('33')

kwargs = {'learning_rate': 1, 'item_alpha': 2, 'user_alpha': 3, 'option': 4}

func_complex(**kwargs)

'33'

In [45]:
args = (1,2)
kwargs = {'d': 3, 'c': 4}

# сначала передаем позиционные аргументы, затем именованные
func(*args, **kwargs)

a=1, b=2, c=4, d=3


In [46]:
# Функция, которая принимает все, что угодно (сначала позиционные, затем именованные)
def func (*args, **kwargs):
    pass

func()
func (5, 6, 7)
func([4], 5, b=12, d=6)
func (a=6, b=8)

In [50]:
# Создаем функцию, 2 аргумента являются обязательными
# args-позиционные (кортеж), kwargs - именованные (словарь)
def func(a, b, *args, **kwargs):
    print ("Function has started.")
    print("a = {}" .format(a))
    print("b = {}". format(b))
    print ("args = {}".format(args) )
    print ("kwargs = {}" .format(kwargs) )
    print ("Function has finished.")

In [51]:
func(1, 4)

Function has started.
a = 1
b = 4
args = ()
kwargs = {}
Function has finished.


In [52]:
func(1, 4, 2, 3, f=6, n=7, m=12)

Function has started.
a = 1
b = 4
args = (2, 3)
kwargs = {'f': 6, 'n': 7, 'm': 12}
Function has finished.


In [54]:
# Пример распаковки кортежа и списка
tpl = ('jdfg',2,'j','k')
*a,b = tpl
print(a,'\n',b)

['jdfg', 2, 'j'] 
 k


In [55]:
# Оператор *_ игнорирует значения
a, *_, b = tpl
print(a,b)

jdfg k


In [56]:
# Где применяется?
def func():
    return('asdf',1,'fg','k')

a, *_ = func()
print(a)

asdf


In [60]:
# Изменение данных по ссылке
# Ниже пример, как не работает
def assign(u_before, u_after):
    u_before = u_after
    print(u_before,'\n',u_after,'\n')

a = ['Nastya', '16.07.1987']
b = ['Ivan', '11.03.1900']

assign(a,b)
print(a, '\n', b)

['Ivan', '11.03.1900'] 
 ['Ivan', '11.03.1900'] 

['Nastya', '16.07.1987'] 
 ['Ivan', '11.03.1900']


In [66]:
# Заменить данные можно либо оператором, который заменяет данные,
# либо обратившись к данным по значению
def assign(u_before, u_after):
    u_before.extend(u_after)

a = ['Nastya', '16.07.1987']
b = ['Ivan', '11.03.1900']

assign(a,b)
print(a, '\n', b)

['Nastya', '16.07.1987', 'Ivan', '11.03.1900'] 
 ['Ivan', '11.03.1900']


In [62]:
# Заменить данные можно либо оператором, который заменяет данные,
# либо обратившись к данным по значению
def assign(u_before, u_after):
    u_before[:] = u_after

a = ['Nastya', '16.07.1987']
b = ['Ivan', '11.03.1900']

assign(a,b)
print(a, '\n', b)

['Ivan', '11.03.1900'] 
 ['Ivan', '11.03.1900']


In [67]:
# Внутри картежа значения можно поменять, если они изменяемые
def change_tuple(a):
    a[0].append('module')
    return a

a = ([],)
b = change_tuple(a)

print(a, '\n', id(a))
print(b, '\n', id(b))

(['module'],) 
 140568648903184
(['module'],) 
 140568648903184


Области видимости

Local -> Enclose -> Global -> Built-In

In [69]:
# Области видимости относительно функции foo
# Поиск переменной идет следующим образом: Local -> Enclose -> Global -> Built-In 

# global
def bar():
    # enclosed - опоясывающая
    def foo():
        pass # local
    # enclosed
    return foo

# global

In [72]:
 result = 'global'

 def func():
    print('local \t',result)

func()

local 	 global


In [74]:
 result = 'global'

 def func():
    result='local'
    print('local \t',result)

print('global \t',result)
func()
print('global \t',result)

local 	 local
global 	 global


In [79]:
#  магическое слово global
result = 'global'

def func():
    global result
    result='local'
    print('local \t',result)

print('global \t',result)
func()
print('global \t',result)

global 	 global
local 	 local
global 	 local


In [2]:
result = 'Global'

def func_outer():
    result = 'Enclosed'
    print('Enclosed \t', result, '\n')

    def func():
        # разрешает менять переменную вне локальной области видимости
        # в нашем случае - enclosed
        nonlocal result
        result = 'Local'
        print('Local \t', result, '\n')

    func()
    print('Enclosed \t', result, '\n')

func_outer()
print('Global \t', result, '\n')

Enclosed 	 Enclosed 

Local 	 Local 

Enclosed 	 Local 

Global 	 Global 



Аргументы по умолчанию

In [4]:
# могут передаваться аргументы по умолчанию, должны идти в конце функции
def sum_list(a, start_with=0):
    return sum(a[start_with:])

a = [1,2,3]
print(sum_list(a),'\n')
print(sum_list(a,1))

6 

5


Элементы функционального программирования, Lambda-функции

In [10]:
result = {'b': 1, 'd': 2, 'a': 3, 'c': 4}

print(sorted(result))
print(result.items())
# сортировка идет по ключу
print(sorted(result.items(), reverse=True))

['a', 'b', 'c', 'd']
dict_items([('b', 1), ('d', 2), ('a', 3), ('c', 4)])
[('d', 2), ('c', 4), ('b', 1), ('a', 3)]


In [17]:
def func_key(pair):
    # должны возвращать имена словаря, а именно значения
    return pair[1]

sorted(result.items(), key=func_key, reverse=False)

[('b', 1), ('d', 2), ('a', 3), ('c', 4)]

In [20]:
# lambda потом указывается аргументы, которая функция принимает, 
# потом указывается значение которое возвращает функция

sorted(result.items(), key = lambda pair: pair[1], reverse=True)

# Мнемоническое правило
# def <lambda>(pair):
    # return pair[1]

[('c', 4), ('a', 3), ('d', 2), ('b', 1)]

In [23]:
from operator import itemgetter
print(sorted(result.items(), key = itemgetter(1), reverse = False), '\n')
print(sorted(result.items(), key = itemgetter(0), reverse = False), '\n')

[('b', 1), ('d', 2), ('a', 3), ('c', 4)] 

[('a', 3), ('b', 1), ('c', 4), ('d', 2)] 



In [27]:
a = list(range(-5,5,1))
print(a)
sorted(a, key = lambda x: x**2, reverse=False)

[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]


[0, -1, 1, -2, 2, -3, 3, -4, 4, -5]

In [28]:
# в модуле functools мы можем вызвать функцию partial, 
# которая позволяет зафиксировать часть значений
import functools

func = functools.partial(sorted, key = itemgetter(1))
func(result.items())

[('b', 1), ('d', 2), ('a', 3), ('c', 4)]

In [29]:
lambda *a, **b: len(a) + len(b)

<function __main__.<lambda>(*a, **b)>

In [32]:
# Map применяет функцию к каждому элементу из итерируемого объекта
a = range(1,10,1)
b = map(lambda x: x**2, a)

print(list(b))

[1, 4, 9, 16, 25, 36, 49, 64, 81]


In [35]:
a = [('a',1), ('b',2), ('c',3)]
print(type(a))
print(type(a[0]))

print(list(map(itemgetter(1),a)))

<class 'list'>
<class 'tuple'>
[1, 2, 3]


In [37]:
a = '1,2,3,4,5'
# приводим с помощью map некоторую строку str к int
b = list(map(int, a.split(',')))
print(type(b[1]))

<class 'int'>


In [38]:
# функция ord возвращает ascii код каждого элементы
a = 'abc123'
list(map(ord,a))

[97, 98, 99, 49, 50, 51]

In [55]:
import pandas as pd
import datetime

df = pd.read_csv('./documents.txt', sep = '\t')
print(df.head())

def parse(s):
    doc_id, url, ts = s.split('\t')
    doc_id = int(doc_id)
    url = str(url)
    ts = datetime.datetime.fromtimestamp(int(ts))
    return([doc_id, url, ts])

with open("./documents.txt", "r") as fname:
    for parts in map(parse, fname):
        print(*parts, sep='\t')
    print()
    print(*map(type, parts), sep='\t')

    426156754  https://habr.com/ru/company/mailru/blog/463045/  1565611920
0  4086447006  https://habr.com/ru/company/mailru/bloq/462769/  1565877120
1  3093770339  https://habr.com/ru/company/mailru/blog/463063/  1565345880
426156754	https://habr.com/ru/company/mailru/blog/463045/	2019-08-12 15:12:00
4086447006	https://habr.com/ru/company/mailru/bloq/462769/	2019-08-15 16:52:00
3093770339	https://habr.com/ru/company/mailru/blog/463063/	2019-08-09 13:18:00

<class 'int'>	<class 'str'>	<class 'datetime.datetime'>
