# Python 101

**TLDR** - один из лучших языков программирования.  
И что в нем особенного?

## Особенности
### Интерпретрируемый язык

Создадим Hello World

In [1]:
!echo "a = 1; print('Hello world, and the number is %d' % a)" > interpreted.py

In [2]:
!python interpreted.py

Hello world, and the number is 1


Как видим, ничего компилировать не пришлось.  
Что осталось на выходе?

In [80]:
!ls -al | grep *.py*

In [82]:
def hello_world():
    print("Hello friends!")

import dis
dis.dis(hello_world)

  2           0 LOAD_GLOBAL              0 (print)
              2 LOAD_CONST               1 ('Hello friends!')
              4 CALL_FUNCTION            1
              6 POP_TOP
              8 LOAD_CONST               0 (None)
             10 RETURN_VALUE


У нас не остается никаких бинарных исполняемых файлов

### Кроссплатформенность

Python - кроссплатформенный (если есть интерпретатор для вашей платформы)

![platforms](images/platforms.png)

###  Динамическая типизация

In [4]:
variable_a = 1
print(type(variable_a))

<class 'int'>


In [5]:
variable_a = "123"
print(type(variable_a))

<class 'str'>


### Язык с удобным синтаксисом

**Java** (без модных API) - https://pastebin.com/Rk3L67eU

![java](images/java.png)

**Python-версия**

In [6]:
def repeat_string(data, times=7):
    if data and times > 0:
        print(data*times)
    else:
        print("Incorrect data")

repeat_string('REP', 3)

REPREPREP


**Вопрос** - при каком случае сломается этот код?

### Большое число библиотек на любой случай

**Стандартная библиотека**  
https://docs.python.org/3/library/  
  
  
**Real-Case**  
Сбор данных о погоде в разных городах и укладка для дальнейшего использования  
https://www.metaweather.com/api/

In [7]:
import json
import requests
import pandas as pd

In [8]:
location_api = 'https://www.metaweather.com/api/location/search/?query={city}'
weather_api = 'https://www.metaweather.com/api/location/{id}'

cities = ['london', 'paris', 'moscow']
df_raw = []

for c in cities:
    print(c)
    woeid = requests.get(location_api.format(city=c)).json()[0]['woeid']
    desc = requests.get(weather_api.format(id=woeid)).json()
    if isinstance(desc, list):
        df_raw.append(desc[0])
    else:
        df_raw.append(desc['consolidated_weather'][0])

df = pd.DataFrame(df_raw)

london
paris
moscow


In [9]:
df

Unnamed: 0,id,weather_state_name,weather_state_abbr,wind_direction_compass,created,applicable_date,min_temp,max_temp,the_temp,wind_speed,wind_direction,air_pressure,humidity,visibility,predictability
0,5268017250304000,Heavy Rain,hr,SSE,2020-03-04T12:16:02.402074Z,2020-03-04,3.43,8.205,7.01,3.651427,164.34189,1008.5,69,7.27315,77
1,4757901367312384,Heavy Rain,hr,S,2020-03-04T12:36:05.400612Z,2020-03-04,4.055,8.79,6.31,5.74556,191.0,1012.5,80,6.690925,77
2,4825981833445376,Heavy Cloud,hc,SE,2020-03-04T12:27:32.621772Z,2020-03-04,1.915,5.2,5.705,3.00696,127.327692,1017.0,89,11.097068,71


In [10]:
df.to_excel('weather_dataset.xlsx', index=False)

## Недостатки

### Быстродействие
Говорят что Python медленный.  
Не всегда

In [11]:
%%time
!cd /Users/lancer/KIB\ Python\ Course/CentralRepo/lecture_1 && java StringRep

Original string: PHP

After repeating 7 times: PHPPHPPHPPHPPHPPHPPHP
CPU times: user 16.2 ms, sys: 15.1 ms, total: 31.3 ms
Wall time: 504 ms


In [12]:
%%time
!cd /Users/lancer/KIB\ Python\ Course/CentralRepo/lecture_1 && python string_rep.py

REPREPREP
CPU times: user 6.52 ms, sys: 11.2 ms, total: 17.8 ms
Wall time: 187 ms


При математических операциях особенно

In [13]:
%%time
sum(range(2**6))

CPU times: user 13 µs, sys: 1e+03 ns, total: 14 µs
Wall time: 20 µs


2016

Подключим математическую библиотеку

In [14]:
%%time
import numpy as np
np.sum(np.array(range(2**6)))

CPU times: user 417 µs, sys: 180 µs, total: 597 µs
Wall time: 592 µs


2016

### Ошибку можно словить только в рантайме

In [15]:
data = ['a', 'b', 12]
for d in data:
    print("String operation completed=", d.replace(d, d*2))

String operation completed= aa
String operation completed= bb


AttributeError: 'int' object has no attribute 'replace'

## Снова к плюсам  
  
Универсальность, развитое сообщество привели к широкому распространению языка -> **Востребованность**  
Востребованность порождает разнообразие  
* backend  
* web  
* devops  
* data science


![hh_python](images/hh.png)  
![hh_cpp](images/cpp.png)  
  
### Баян про зарплату
![salary](images/salary.jpeg)  

  
### Мораль такова - прокачанный разработчик всегда найдет хорошее место и оклад

## Ладно, убедили, я хочу питонить!!!111  
  
   
  
Существуют несколько реализаций Python:
* CPython - стандартная реализация
* Jython
* IronPython
* PyPy  
  
  
  
### Установка CPython
* Собрать самому из исходников (make install ...)
* Готовый пакет (deb/rpm/msi)
* Anaconda
  
   
  
### В чем создавать скрипты
* Любой текстовый редактор
* Любая годная IDE
* Pycharm Community
* Jupyter Notebook


## Jupyter  
![jup_arch](images/jupyter.png)  

In [48]:
!ps aux | grep python | grep -v grep

lancer           27228   0.0  0.7  4314132  57708 s000  S+    4:02PM   0:06.75 /Users/lancer/anaconda3/bin/python /Users/lancer/anaconda3/bin/jupyter-notebook
lancer           28057   0.0  0.7  4611776  60512   ??  Ss    5:01PM   0:04.08 /Users/lancer/anaconda3/bin/python -m ipykernel_launcher -f /Users/lancer/Library/Jupyter/runtime/kernel-7e9c7b7c-dc29-47c6-a647-432201f4374a.json


In [49]:
!ps aux -o ppid | grep 28057 | grep -v grep

lancer           28057   4.3  0.7  4611776  60512   ??  Ss    5:01PM   0:04.11 /Users/lancer/an 27228
lancer           28389   3.0  0.0  4270384   1184 s003  Ss+   5:12PM   0:00.01 /bin/sh -c ps au 28057


## Синтаксис  


Логически, код на Python разделяется на строки  

In [50]:
logical_string = 'cool'

Разделяются строки переносом строки, либо ';'

In [51]:
today = 'is'; the_great = 'day'

Переменная может быть объявлена любой алфавитной последовательностью + нижний слэш, но не должна начинаться с цифры

In [71]:
джигурда = 'с бородой'
and_your_mentors = 'без'

In [73]:
7sdf = None

SyntaxError: invalid syntax (<ipython-input-73-3c71bc0fb4be>, line 1)

Комментарий - через #

In [52]:
# результат этого кода видят только ...
data = None

Иногда нужно делать длинные вызовы, условия  
Используем обратный slash

In [56]:
big_data = \
    10*2 + \
    23+3
print(big_data)

46


Иногда backslash не нужен (в основном в коллекциях)

In [58]:
container = [1,2,3,4,
            5,6,7,8,
            10]
print(container)

[1, 2, 3, 4, 5, 6, 7, 8, 10]


Функции объявляются с помощью ключевого слова **def**

In [61]:
def inverter(number):
    print(number * -1)
    
inverter(100)

-100


Тело функций и других похожих по смыслу конструкций выделяется с помощью отступов  (с помощью пробелов или табуляции)  
Отступы должны быть везде одинаковые

In [67]:
def ok_indent():
    print("Все по-пацански")
    print(1)
    if 1 != 2:
        print(2)
ok_indent()


Все по-пацански
1
2


In [69]:
def notok_indent():
    print("Все по-пацански")
     print(1)
  if 1 != 2:
        print(2)
ok_indent()

IndentationError: unindent does not match any outer indentation level (<tokenize>, line 4)

#### Операторы  

In [74]:
a = 5 + 2;  
print('Сложение:  5+2 =', a)
a = 5 - 2;  
print('Вычитание: 5-2 =', a)
a = 5 * 2;  
print('Умножение: 5*2 =', a)
a = 5 ** 2; 
print('Степень:   5^2 =', a)
a = 5 / 2;  
print('Деление:   5/2 =', a)
a = 5 // 2; 
print('      Целое:    ', a)
a = 5 % 2;  
print('      Остаток:  ', a)

Сложение:  5+2 = 7
Вычитание: 5-2 = 3
Умножение: 5*2 = 10
Степень:   5^2 = 25
Деление:   5/2 = 2.5
      Целое:     2
      Остаток:   1


Побитовые операторы предназначены для работы с данными в битовом (двоичном) формате.

`&` - побитовый "И"

`|` - побитовый "ИЛИ"

`^` - побитовый "Исключающее ИЛИ"

`~` - побитовое отрицание (дополнение) - унарная операция

`<<` - побитовый сдвиг влево

`>>` - побитовый сдвиг право

In [76]:
print("101 & 011 = ", 5 & 3, "(", bin(5 & 3), ")")
print("101 | 011 = ", 5 | 3, "(", bin(5 | 3), ")")
print("101 ^ 011 = ", 5 ^ 3, "(", bin(5 ^ 3), ")")
print("~101 = ", ~5, "(", bin(~5), ")")
print("101 << 2 = ",5 << 1, "(", bin(5 << 1), ")")
print("101 >> 2 = ",5 >> 1, "(", bin( 5>> 1), ")")

#bin() - представление числа в двоичной системе счисления

101 & 011 =  1 ( 0b1 )
101 | 011 =  7 ( 0b111 )
101 ^ 011 =  6 ( 0b110 )
~101 =  -6 ( -0b110 )
101 << 2 =  10 ( 0b1010 )
101 >> 2 =  2 ( 0b10 )


#### Условия

In [77]:
a = 5
b = 3

if a > b:
    a += 1
    print('Yes.')
elif a < b:
    a -= 1
    print('No')
else:
    print('Equal.')

Yes.


In [None]:
a = 1
b = 2
c = 3
d = 4

if (a == 1 and b == 2 and
    c == 3 and d == 4):
    print('1')

if [a == 1 and b == 2 and
    c == 3 and d == 4]:
    print('2')
    
if {a == 1 and b == 2 and
    c == 3 and d == 4}:
    print('3')

#### Циклы

In [None]:
# Цикл от 0 до n-1:
for i in range(8):
    print(i)

# Цикл от m до n-1. 
# Посчитаем факториал числа 8
f = 1
for i in range(2, 9):
    f = f * i
print(f)

# Цикл по итерируемому объекту

tup = (1, 2, 5)
for i in tup:
    print(i)

s = 'КСБ'
for letter in s:
    print(letter.lower())

d = {1: 'one', 2: 'two'}
for el in d:
    print(el, ':', d[el])

for k, v in d.items():
    print(k, ':', v)

# Цикл while
# Сумма четных чисел от 2 до n

n = 20
i = 2
sum = 0

while i < n:
    sum += i
    i += 2
print(sum)

In [None]:
(       )       [       ]       {       }
,       :       .       ;       @       =       ->
+=      -=      *=      /=      //=     %=      @=
&=      |=      ^=      >>=     <<=     **=

### Zen of Python

In [78]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Ключевые принципы Python  
* Все есть объект  
![hier](images/type_hier.png)  