## Основы Python

О специфике языка, истории его создания и "великом пожизненном диктаторе" можно почитать в Вики:
https://en.wikipedia.org/wiki/Python_(programming_language) .

Для нас важно помнить, что Python:

- интерпретируемый;
- с динамической типизацией;
- имеет возможности как для ООП, так и для ФП;

Документация новых функций и рекомендации по их использованию изложены в т.н. Python Enhancement Proposals или PEP. Одним из PEP является т.н. "The Zen of Python" или PEP 20:
https://www.python.org/dev/peps/pep-0020/ .

# 1.0. Основы основ 

### Выражения

In [1]:
5 + 5

10

In [2]:
3 - 2

1

In [3]:
5 * 7

35

In [4]:
10 / 2

5

In [5]:
100 // 33

3

In [6]:
10 ** 2

100

In [7]:
x = 5
y = x
c = 2

In [8]:
y

5

In [9]:
print y

5


Как вы уже поняли, оператор присваивания это "=", а оператор сравнения - "==":

In [10]:
x = 10
if x == 10:
    print x
else:
    print y

10


In [11]:
%whos

Variable   Type    Data/Info
----------------------------
c          int     2
x          int     10
y          int     5


# 1.1. Модель данных

Часто можно услышать утверждение о том, что в питоне **все является объектом**. Утверждение верное, причем у каждого объекта есть:
- сущность (identity);
- тип (type);
- значение (value).

Сущность (identity) объекта не меняется после создания, можно думать о ней как об адресе в памяти компьютера.

Например, если мы пишем:

a = 42

создается объект типа int со значением 42. Сущность (identity) объекта в таком случае - это его адрес в памяти, а - имя указателя на этот адрес.

In [12]:
a = 42
b = 42
print id(a)
print id(b)
print a is b

94880932603256
94880932603256
True


In [13]:
b =99
print id(a)
print id(b)
print a is b

94880932603256
94880932603880
False


Тип (type) объекта - внутреннее описание объекта с учетом методов и операций, которые он поддерживает. Когда создается конкретный объект (например, целочисленный тип со значением 42), то этот конкретный объект называют экземпляром (instance) данного типа. 

После создания объекта его тип и сущность не могут быть изменены. Если значение объекта после создания может быть изменено, то такой объект называется **изменяемым (mutable)**, и **неизменяемым (immutable)** в противном случае.

Если объект содержит ссылки на другие объекты, то такой объект называется **контейнером (container)** или **коллекцией (collection)**.

Узнать тип объекта можно с помощью функции type(), а проверить принадлежность к типу можно с помощью isinstance():

In [14]:
x = 5
type(x)

int

In [15]:
if isinstance(x, int):
    print 'integer'

integer


** Для всех объектов ведется подсчет ссылок (reference count). **

Число ссылок увеличивается, если на объект ссылается новая переменная, либо же объект добавляется в контейнер:

In [28]:
a = 3.4
c = a
b = list()
b.append(a)
print id(a)
print id(b[0])

139629588197424
139629588197424


In [29]:
b

[3.4]

Обратное - если объект уничтожается с помощью del или ссылка перестает существовать - значение счетчика снижается:

In [30]:
del a
b[0]
id(b[0])

139629588197424

In [31]:
b

[3.4]

Как мы знаем, выражение вида a = b создает новую ссылку на объект b. **Если объект, на который ссылается b, immutable - то a создает копию b**.

In [34]:
b = 'hello'
print id(a)
print id(b)
a = b
print id(a)
print id(b)
a = 'world'
print id(a)
print id(b)
print b + a

139629795571680
139629796666512
139629796666512
139629796666512
139629795571920
139629796666512
helloworld


Для mutable несколько сложнее. Если мы просто дадим новое навзание ссылке на объект (a = b), то объект останется тем же:

In [36]:
b = [1,2,3]
print id(a)
print id(b)
a = b
print id(a)
print id(b)
a[0] = 4
print id(a)
print id(b)
print b

139629796181560
139629796678184
139629796678184
139629796678184
139629796678184
139629796678184
[4, 2, 3]


Если мы все же хотим сделать копию, то у нас 2 опции:

* **shallow copy**, когда создается новый объект, а ссылки в нем - на объекты из старого:

In [39]:
b = [ 1, 2, [3,4] ]
a = b[:]          # Create a shallow copy of b.
a.append(100)
print b
print id(a[1])
a[1] = -199
print id(a[1])
a[2][0] = -100
print b 

[1, 2, [3, 4]]
94880932602224
94880941345504
[1, 2, [-100, 4]]


* **deep copy**, когда создается копия объекта наряду с копией всех объектов, которые он содержит:

In [71]:
import copy
b = [1, 2, [3, 4] ]
print id(b)
a = copy.deepcopy(b)
print id(a)
a[2] = -100
print a
print b 

140067277113896
140067391762016
[1, 2, -100]
[1, 2, [3, 4]]


In [74]:
a = 5
import copy
#b = copy.copy(a)
a = b
print id(a)
print id(b)

94099482292520
94099482292520


## TLDR:

* все является объектом;
* принадлежность к типу стоит проверять через isinstance(object, type);
* объекты можно разделить на mutable (изменяемые) и immutable (неизменяемые);
* при копировании важно помнить, что для immutable копия создается непосредственно, а для mutable - создается новая ссылка на объект либо shallow cipy либо deep copy.

# 1.2. Основные типы

* **NoneType**: отдельный тип для обозначения null

In [41]:
x = None
type(x)

NoneType

Проверку на NoneType следует осуществлять следующим образом:

In [47]:
print(x is None)
print (x==0)

True
False


In [48]:
if x :
    print 'a'
else:
    print 'b'

b


- **str** : immutable, последовательность Unicode codepoints (мы вернемся к этому позднее),
- **unicode** : immutable, последовательность Unicode codepoints (мы вернемся к этому позднее).

Оба наследуют basestring.

In [49]:
x = 'This is a test string'

In [50]:
type(x)

str

In [51]:
isinstance('test str', basestring)

True

In [52]:
isinstance(u'test str', basestring)

True

- **int**: Immutable, целое число (отдельного типа long в python нет: https://www.python.org/dev/peps/pep-0237/)

In [53]:
x = 5
type(x)

int

- **float**: Immutable, число с плавающей точкой.

In [54]:
x = 5.0
type(x)

float

In [1]:
x = 5
type(float(5))

float

In [8]:
type(2**1000000)

long

In [9]:
a = 5
print id(a)
a = 7
print id(a)
a

94099482292520
94099482292472


7

**2 vs 3** : При делении важно помнить, что поделив (int на int), float вы не получите, поэтому важно явно привести к float один из аргументов (Python 2).

In [10]:
print 5/2
print 5.0/2
print 5/2.0

2
2.5
2.5


**2 vs 3** : В Python 3 такой проблемы нет.

In [11]:
from __future__ import division

print 5/2

2.5


In [12]:
5//2

2

* **bool**: булевая перменная 

In [14]:
a = bool(1)
print id(a)
a = 0
print id(a)
a

94099471503952
94099482292640


0

* **complex**: комплексное число

In [15]:
a = 1.5 + 0.5j

In [16]:
a.real

1.5

In [17]:
a.imag

0.5

- **list**: mutable, динамический список

In [24]:
x = [2,3,'string']

In [25]:
x[2] = 4

In [26]:
x

[2, 3, 4]

In [27]:
x.append(51)
x

[2, 3, 4, 51]

* **dict**: пары "ключ-значение"

In [46]:
x = {'this':'str_value', 'that_int': 5} 
y = {'first':1, 'second':2}
for t in y.viewkeys():
    print t

second
first


* **tuple**: кортеж, immutable

In [68]:
x = (1,2,3)

In [69]:
x[2] = 4

TypeError: 'tuple' object does not support item assignment

In [70]:
(1,2,3) + (4,)
(1, 2,3) + (3,)
import copy
y = copy.deepcopy(x)
z = x[:]
print id(x)
print id(y)
print id(z)
z

140067391949552
140067391949552
140067391949552


(1, 2, 3)

* **set**: множество объектов, mutable

In [75]:
s = set([1,2,3])
s

{1, 2, 3}

In [76]:
s.add(5)
s

{1, 2, 3, 5}

* **frozenset**: immutable версия множества

In [77]:
s = frozenset([1,2,3])

In [78]:
s.add(5)

AttributeError: 'frozenset' object has no attribute 'add'

## TLDR:

* помним про разделение объектов на mutable и immutable;
* лучше делать импорт: from __future__ import divivision.

# 1.3. Контрольные конструкции

**if/elif/else**

Думаю, что все понятно

In [79]:
if 3 == 5:
    print 'broken'
elif 3 == 0:
    print 'broken again'
else:
    print 'working'

working


Также из примера выше видно, что блоки отделяются с помощью отступов.

**while/break/continue**

In [80]:
z = 1 + 1j
while abs(z) < 100:
    z = z**2 + 1

In [81]:
z

(-134+352j)

In [82]:
abs(z)

376.64306710730784

**for** - итерация по коллекции объектов

In [83]:
for i in xrange(10):
    print i, i**2

0 0
1 1
2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81


-- N: в Python 2 лучше использовать xrange, так как данное выражение не инициализирует новый массив. В Python 3 разницы между range/xrange нет.

In [84]:
print type(range(2))
print type(xrange(2))

<type 'list'>
<type 'xrange'>


** enumerate ** - если требуется не только пройти по коллекции, но и пронумеровать шаг итерации, можно использовать enumerate:

In [85]:
for ind,ch in enumerate(['a', 'b', 'c']):
    print ind, ch
print type(enumerate([1, 2, 3]))

0 a
1 b
2 c
<type 'enumerate'>


## TLDR:

* проверка на равенство "==";
* в Python 2 использовать xrange.

# 1.4. Функции

** Функция, как и все прочее, является объектом**. Новая функция объявляется с помощью ключевого слова def. Возвращаемое значение опционально.

In [46]:
def product(a):
    res = 1
    for i in a:
        res *= i 
    return res

In [47]:
a = product([12,3,4])
print a

144


In [48]:
def product(a):
    res = 1
    for i in a:
        res *= i 

In [49]:
a = product([12,3,4])
print a

None


**Общий синтаксис:**

1. def;
2. имя функции;
3. аргументы в скобках;
4. тело функции;
5. (опционально) возвращаемое значение.

Для функции можно задать аргументы по умолчанию:

In [None]:
def accum_sum(iterable, start=0):
    for item in iterable:
        start += item
    return start

In [None]:
accum_sum([1,2,3])

Сигнатуру функции можно задать через "\*args", "\*\*kwargs", где "\*args" - кортеж аргументов, "\*\*kwargs" - словарь аргументов.

In [51]:
def signature_example(*args, **kwargs):
    for ind,arg in enumerate(args):
        print '{0}\t{1}'.format(ind, arg)
    kw = kwargs.get('ka')
    print '"ka"\t{0}'.format(kw)

In [52]:
signature_example('a','c','b', ka='test')

0	a
1	c
2	b
"ka"	test


-- N: значения по умолчанию инициализируются во время создания функции, поэтому если вы определите ссылку на mutable или immutable объект в качестве значения по умолчанию, то следует учесть свойства объекта (при вызове функции с immutable объектом вы каждый раз будете получать объект, созданный во время инициализации, а для immutable - возможность изменить его и сохранить изменения во время каждого вызова).

In [88]:
bigx = 10
print id(bigx)
def double_it(x=bigx):
    print id(x)
    return x * 2
print double_it()
print bigx
bigx = 1e9
print double_it()

94099482292400
94099482292400
20
10
94099482292400
20


In [90]:
def add_to_dict(args={'a': 1, 'b': 2}):
    print id(args)
    for i in args.keys():
        args[i] += 1
    print args
add_to_dict()
add_to_dict()
add_to_dict()

140067391314192
{'a': 2, 'b': 3}
140067391314192
{'a': 3, 'b': 4}
140067391314192
{'a': 4, 'b': 5}


Итак, мы подошли к следующему: если есть подобные нюансы в доступе к переменным внутри функции, как разрешаются имена переменных?

** LEGB ** : **Local -> Enclosing -> Global -> Built-in**

In [None]:
a_var = 'global variable'

def a_func():
    a_var = 'local variable'
    print(a_var)

a_func()
print a_var

In [None]:
a_var = 'global value'

def outer():
    a_var = 'enclosed value'

    def inner():
        a_var = 'local value'
        print(a_var)

    inner()

outer()

In [None]:
a_var = 'global value'

def outer():
    a_var = 'enclosed value'

    def inner():
        print(a_var)

    inner()

outer()

Если мы хотим изменить глобальную переменную, то стоит это сделать явно с помощью global:

In [None]:
a_var = 'global value'

def a_func():
    a_var = 'changed value'

a_func()
print a_var

In [None]:
a_var = 'global value'

def a_func():
    global a_var
    a_var = 'changed value'

a_func()
print a_var

При желании, можно произвести явную проверку на наличие в словаре locals() и globals():

In [None]:
def t_func():
    a = 5
    print 'a' in locals()
    
t_func()

-- N: Будьте осторожнее с for/in:

In [54]:
a = 5
for a in xrange(7, 9):
    print a

a

7
8


8

Как мы знаем, узнать о том, для чего предназначена функция можно (в IPython) с помощью ?, ?? и help(func_name). 

In [58]:
def funcname(*args):
    
    """
    Concise one-line sentence describing the function. ....:
        :param args:
        compl_1: ...
    Extended summary which can contain multiple paragraphs.
    """
    # function body
    pass

In [59]:
funcname?

Так как функция является объектом, никто не может вам запретить присвоить переменной ссылку на функцию:

In [56]:
def test_func():
    print 'test'
a = test_func
a()
type(a)

test


function

## TLDR:

* функции - объекты первого класса (first-class objects);
* резолюция имен - с помощью LEGB;
* инициализация значений по умолчанию - в момент объявления.

# 1.5. Модули

Технически, различия между скриптом и модулем нет: оба из них можно добавить в текущее пространство имен с помощью ключевого слова import.

Тем не менее, обычно под скриптом понимают набор инструкций, которые выполняеются при запуске, а под модулем определенный набор констант и функций, предназначенных для дальнейшего использования.

Как запустить скрипт - нам уже известно:

** %run test.py **

или из комадной строки:

** python test.py **

--N: если мы запускаем скрипт из IPython, то определенные в нем переменные будут доступны из ноутбука.

In [None]:
%ls

In [None]:
%who

In [None]:
%run test.py

In [None]:
%who

В скрипт можно передать параметры. **Парсить параметры вручную не стоит, для этого есть пакеты argparse, optparse, docopt**.

In [None]:
%run arg_parse_test.py -i 1 2 3

Импорт модуля возможен следующими способами:

In [None]:
import sys
import numpy as np
from urllib2 import urlparse

-- N: Так делать **не надо**: 

from scipy import *

Модули кэшируются, поэтому если вы внесли изменения в модуль - вы их не увидите, необходимо попросить интерпретатор перезагрузить модуль:

In [None]:
reload(sys)

Как быть, если вы хотите, чтобы часть данных была доступна для импорта, но определенные инструкции выполнялись только если скрипт запускается как отдельная программа? 

Следует указать: if \_\_name\_\_ == '\_\_main\_\_'. У каждого модуля определено имя, и в случае если скрипт запускается отдельно, то он получает имя \_\_main\_\_.

Узнать, какие объекты определены в модуле, можно с помощью dir():

In [None]:
dir(np)

Вызов dir() без аргумента перечислит список объектов в текущем пространстве имен:

При импорте поиск модуля с заданным именем осуществляется следующим образом:

* built-ins;
* текущая директория;
* PYTHONPATH;
* прочие пути, определенные пользователем при установке.

In [None]:
import sys
print sys.path

Для ускорения загрузки, Python добавляет скомпилированные версии импортируемых пакетов в файле *.pyc.

## TLDR:

* если вы используете какой-то кусок кода чаще одного раза - следует его обернуть в функцию;
* если какая-то функция используется больше, чем в одном скрипте - добавьте ее в модуль;
* если от модуля нужна функциональность только при вызове - добавьте ее в часть, которая вызывается if \_\_name\_\_ == '\_\_main\_\_'.

# 1.6. Пакеты

Набор моодулей, объединенных по какому-либо признаку - называется пакетом (package). Чтобы дать понять Питону, что что-то явлвяется пакетом, следует создать файл \_\_init.py\_\_ (можно пустой).

Если думать о модулях как о способе организации пространства имен (оставив в стороне повторное использование кода), то пакет - способ организации более высокого уровня - в добавок к имени модуля добавляется точка

In [None]:
from numpy.linalg import svd

Хороший пример из стандартной документации (https://docs.python.org/3/tutorial/modules.html): 

In [None]:
'''
sound/                          Top-level package
      __init__.py               Initialize the sound package
      formats/                  Subpackage for file format conversions
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  Subpackage for sound effects
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  Subpackage for filters
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...

'''

pass

* импорт индивидуального модуля - import sound.effects.echo;
* абсолютный импорт - from sound.effects import echo (может быть полезно, если у вас есть перекрестные ссылки между суб-модулями);
* относительный импорт (например, в surround.py) - from . import echo, from .. import formats, from ..filters import equalizer.  

## TLDR:

* для создания пакета следует создать в директории файл \_\_init\_\_.py;
* кросс-импорт между суб-модулями не возбраняется, но слудет пдумать - действительно ли была выбрана оптимальная организация структуры?

# 1.7. Классы

Мало отличий от прочих языков - создание классов с помощью ключевого слова class, любой класс либо наследует от object, либо от другого класса:

In [14]:
class MyClass_parent(object):
    def __init__(self, arg):
        self.data = arg
    def get_data(self):
        return self.data
    
class MyClass_child(MyClass_parent):
    def set_data(self, new_arg):
        self.data = new_arg

In [18]:
c1 = MyClass_parent(5)
c1.get_data()

5

In [None]:
c2 = MyClass_child(10)
c2.set_data(5)
c2.get_data()

Деления на приватные и публичные методы/аттрибуты не существует, но принята конвенция, согласно которой методы, начинающиеся с _ считаются приватными:

In [None]:
class MyClass_secret(MyClass_parent):
    def _square_data(self):
        self.data = self.data**2

In [None]:
c = MyClass_secret(2)
c._square_data()
c.get_data()

--N: избегайте общих mutable объектов для экземпляров классов!

В рамках данного курса мы будем редко использовать классы, в основном для организации пространства имен.

## TLDR:

* классы предоставляют все возможности для ООП в Питоне;
* в дальнейших местах курса мы будем касаться отдельных аспектов, например \_\_eq\_\_ и \_\_hash\_\_.

# 1.8. Ввод / вывод

Стандартный синтаксис для чтения/записи файлов выглядит так:

In [93]:
f1 = 'test.py'
r_f = open(f1, 'r')
print(r_f.read(10))
r_f.close()

12345



In [96]:
f1 = 'test.py'
w_f = open(f1, 'a')
w_f.write('hello')
#with open(f1, 'a') as w_f:
 #   for ind, item in enumerate(w_f):
  #      w_f.write('{0}\t{1}\n'.format(ind, item))

Режим 'w' записывает новый файл, если нужно добавить - исопльзуйте 'a'. Можно спокойно открывать несколько файлов внутри одной конструкции with:

In [None]:
with open(newfile, 'w') as outfile, open(oldfile, 'r', encoding='utf-8') as infile:
    for line in infile:
        outfile.write(line)

Для чтения/записи json пользуйтесь готовыми пакетами json и ujson:

In [None]:
try:
    import ujson as json
except ImportError:
    import json

In [None]:
json.dumps({'a':1, 'b':2})

In [None]:
json.loads(json.dumps({'a':1, 'b':2}))

Если нужно записать текстовые данные, то помните про кодировку!

Читать gzip тоже просто:

In [None]:
import gzip

with gzip.open('f.gz') as f:
    for line in f:
        ...

Для сохранения внутренних объектов в бинарном формате удобно использовать pickle:

In [None]:
try:
    import cPickle as pickle
except ImportError:
    import pickle

In [None]:
favorite_color = { "lion": "yellow", "kitty": "red" }
pickle.dump( favorite_color, open( "save.p", "wb" ) )

In [None]:
favorite_color = pickle.load( open( "save.p", "rb" ) )

In [None]:
favorite_color

## TLDR:

* для чтения/записи файлов пользуйтесь готовыми форматами;
* помните про кодировки при записи текстовых данных.

# 1.9. Обработка исключений

Использование обработки исключений вы уже видели при импорте пакетов. Общая конструкция:

In [29]:
1/0

ZeroDivisionError: integer division or modulo by zero

In [35]:
try:
    raise ZeroDivisionError
except 1:
    print type(ZeroDivisionError)
    print 'zero division'

ZeroDivisionError: 

Можно передавать несколько типов ошибок через кортеж : except (TypeError, ValueError) ...

Если есть часть кода, которая должна быть вызвана вне зависимости от успеха/неуспеха остально части, следует воспользоваться конструкцией try/except/finally:

In [27]:
try:
    1/0
except :
    pass
finally:
    print 1/1

1


Подробнее предлагается прочитать тут - https://docs.python.org/2/tutorial/errors.html.

Общее правило: **Easier to ask for forgiveness than permission**.

** Если использование try/except ведет к более быстрому и/или чистому коду (что обычно верно - нельзя же придумать if/else на каждый гипотетический случай), следует предпочесть try/except. **

## TLDR:

* Цитата из ZEN (PEP 20):
" Errors should never pass silently.
  Unless explicitly silenced. "
* "Easier to ask for forgiveness than permission"

# 1.10. os/sys

**os**: доступ к функционалу операционной сиситемы.

In [36]:
import os

In [37]:
os.getcwd()

'/media/sf_Documents/CodeBlocks/MSU/sphere.mail/1 \xd1\x81\xd0\xb5\xd0\xbc\xd0\xb5\xd1\x81\xd1\x82\xd1\x80/\xd0\x92\xd0\xb2\xd0\xb5\xd0\xb4\xd0\xb5\xd0\xbd\xd0\xb8\xd0\xb5 \xd0\xb2 \xd0\xb0\xd0\xbd\xd0\xb0\xd0\xbb\xd0\xb8\xd0\xb7 \xd0\xb4\xd0\xb0\xd0\xbd\xd0\xbd\xd1\x8b\xd1\x85/lec1'

In [38]:
os.listdir(os.curdir)

['.ipynb_checkpoints',
 'containers.ipynb',
 'Intro.ipynb',
 'python_basics.ipynb',
 'requirements.txt',
 'test.py']

In [39]:
os.mkdir('trash')

In [40]:
'trash' in os.listdir(os.curdir)

True

In [41]:
os.rmdir('trash')

In [42]:
'trash' in os.listdir(os.curdir)

False

In [43]:
%ls

[0m[01;32mcontainers.ipynb[0m*  [01;32mpython_basics.ipynb[0m*  [01;32mtest.py[0m*
[01;32mIntro.ipynb[0m*       [01;32mrequirements.txt[0m*


In [44]:
os.path.abspath('Intro.ipynb')

'/media/sf_Documents/CodeBlocks/MSU/sphere.mail/1 \xd1\x81\xd0\xb5\xd0\xbc\xd0\xb5\xd1\x81\xd1\x82\xd1\x80/\xd0\x92\xd0\xb2\xd0\xb5\xd0\xb4\xd0\xb5\xd0\xbd\xd0\xb8\xd0\xb5 \xd0\xb2 \xd0\xb0\xd0\xbd\xd0\xb0\xd0\xbb\xd0\xb8\xd0\xb7 \xd0\xb4\xd0\xb0\xd0\xbd\xd0\xbd\xd1\x8b\xd1\x85/lec1/Intro.ipynb'

In [45]:
os.path.split(os.path.abspath('Intro.ipynb'))

('/media/sf_Documents/CodeBlocks/MSU/sphere.mail/1 \xd1\x81\xd0\xb5\xd0\xbc\xd0\xb5\xd1\x81\xd1\x82\xd1\x80/\xd0\x92\xd0\xb2\xd0\xb5\xd0\xb4\xd0\xb5\xd0\xbd\xd0\xb8\xd0\xb5 \xd0\xb2 \xd0\xb0\xd0\xbd\xd0\xb0\xd0\xbb\xd0\xb8\xd0\xb7 \xd0\xb4\xd0\xb0\xd0\xbd\xd0\xbd\xd1\x8b\xd1\x85/lec1',
 'Intro.ipynb')

In [46]:
os.path.exists('Intro.ipynb')

True

In [47]:
os.path.isfile('Intro.ipynb')

True

In [48]:
os.environ.keys()

['LESSOPEN',
 'LOGNAME',
 'USER',
 'PATH',
 'HOME',
 'DISPLAY',
 'LANG',
 'TERM',
 'SHELL',
 'XAUTHORITY',
 'LANGUAGE',
 'SHLVL',
 'SUDO_USER',
 'USERNAME',
 'XDG_RUNTIME_DIR',
 'JPY_PARENT_PID',
 'SUDO_UID',
 'GIT_PAGER',
 'XDG_SESSION_ID',
 'DBUS_SESSION_BUS_ADDRESS',
 '_',
 'SUDO_COMMAND',
 'SUDO_GID',
 'LESSCLOSE',
 'MPLBACKEND',
 'OLDPWD',
 'CLICOLOR',
 'PWD',
 'COLORTERM',
 'MAIL',
 'LS_COLORS',
 'PAGER']

sys: информация о системе

In [49]:
import sys
sys.platform

'linux2'

In [50]:
sys.version

'2.7.13 (default, Jan 19 2017, 14:48:08) \n[GCC 6.3.0 20170118]'

In [51]:
sys.path

['',
 '/usr/lib/python2.7',
 '/usr/lib/python2.7/plat-x86_64-linux-gnu',
 '/usr/lib/python2.7/lib-tk',
 '/usr/lib/python2.7/lib-old',
 '/usr/lib/python2.7/lib-dynload',
 '/usr/local/lib/python2.7/dist-packages',
 '/usr/lib/python2.7/dist-packages',
 '/usr/local/lib/python2.7/dist-packages/IPython/extensions',
 '/root/.ipython']

In [58]:
print sys.getsizeof([1,2,3])
print sys.getsizeof('abcdef')

96
43


# Дополнительный материал 2: Unicode и str

Классический справочный материал - http://www.joelonsoftware.com/articles/Unicode.html .

Самое важное утверждение оттуда:

**There Ain't No Such Thing As Plain Text.**

**Unicode** - последовательность абстрактных codepoints;

**Кодировка** - способ представления кодировок в памяти.

In [None]:
x = 'base string'
x.decode('ascii')

In [None]:
x = u'base string'
x.encode('ascii')

string.decode(encoding) - получаем unicode (последовательность codepoints);
unicode.encode(encoding) - получаем string (последовательность байтов).

**string.decode(encoding).encode(encoding) == string**

Справка - https://docs.python.org/2/howto/unicode.html

Как работать с текстовыми данными?

Правило, позволяющее сэкономить кучу сил:
** Внтури программы использовать unicode. При необходимости передачи строки за пределы программы - пользоваться кодировкой (предпочтительно utf-8).**