## Учимся Python!

Написать самую простую программу на Python очень просто:

In [None]:
print("Hello, human!")

Мы можем не писать `print`, если код в ячейке содержит несколько простых операций. Например, посчитаем число часов в году:

In [None]:
365*24

### Переменные

Для запоминания каких-то промежуточных значений используют **переменные**. Например:

In [None]:
seconds_in_a_day = 24*60*60
print('Секунд в году: ',seconds_in_a_day*365)
print('Миллион секунд в днях:',1000000/seconds_in_a_day)

Можно представлять себе, что переменная является своего рода корзиной, в которой могут храниться **значения** различных видов (называемые **типами**). Основные типы:
 * int (Целочисленные значения): 1,2,13, ...
 * float (Вещественные значения): 3.1415, 0.5
 * str (Строки): "привет"

С переменными разных типов можно выполнять разные операции:

In [None]:
name = "Peter"
print("Hello, "+name)

В зависимости от типа операции будут выполняться по-разному:

In [None]:
print("13"+"7")
print(13+7)

А что будет, если сложить строку и число?

In [None]:
"Привет"+7

Вы видите **сообщение об ошибке**. Если Python не может выполнить какую-то команду: он пишет об этом.

## Библиотеки

Основная мощь Python - это возможность подключать **библиотеки**, чтобы делать что-то интересно: от создания чат-ботов до компьютерных игр!

Например, чтобы вычислять сложные математические выражения - подключаем библиотеку `math`

In [None]:
import math
math.sin(math.pi/2)

Или так:

In [None]:
from math import sin, pi
sin(pi/2)

Нестандартные библиотеки нужно сначала установить специальной командой `pip`. Например, чтобы работать с **черепашьей графикой**, установим библиотеку `jturtle`:

In [None]:
!pip install jturtle

### Черепашья Графика

Библиотека, которую мы только что установили, позволяет нам использовать несколько простых команд рисования - так называемая **черепашья графика**. Эти команды управляют воображаемой *черепахой*, которая может перемещаться по экрану, поворачиваться и т.д., Оставляя след позади. Например, если я хочу нарисовать треугольник, я могу использовать следующие команды:

In [None]:
import jturtle as turtle
turtle.forward(100)
turtle.right(120)
turtle.forward(100)
turtle.right(120)
turtle.forward(100)
turtle.right(120)
turtle.done()

## Циклы

Для рисования треугольника нам нужно повторять одни и те же действия три раза. Чтобы не писать много раз одно и то же, существует специальная конструкция: **цикл**.

Предположим, нам нужно поздравить всех наших друзей:

In [None]:
for friend in ["Вася", "Петя", "Коля"]:
  print("Привет, "+friend)

Перечисленные имена друзей в квадратных скобках называются **списком**. Конструкция `for` позволяет выполнить какие-то действия над каждым элементом списка.

Обратите внимание на отступ! Он показывает, что именно будет выполняться несколько раз внутри цикла, а что - после. Например, попробуйте в следующем коде расставить отсупы по-разному:

In [None]:
for friend in ["Вася", "Петя", "Коля"]:
  print("Привет, "+friend)
print("Идём гулять!")

С помощью цикла упростим рисование треугольника. Чтобы повторить код заданное число раз, вместо списка можно писать `range(n)`:

In [None]:
for i in range(3):
  turtle.forward(100)
  turtle.right(120)

turtle.done()

**Задание**: Нарисуй какой-нибудь интересный узор с помощью циклов

In [None]:
# Решение

## Вложенные циклы

Предположим, мы хотим напечатать таблицу умножения. В этом случае нам нужно будет перебрать все числа от 1 до 9, и для каждого числа напечатать все варианты его умножения на все числа от 1 до 9. Для этого придётся один цикл повторять внутри другого

In [None]:
for a in range(1,10):
  print(f"Таблица умножения на {a}")
  for b in range(1,10):
    print(f"{b} * {a} = {b*a}")

Обратите внимание, как мы печатали значения переменных внутри строк! Это специальный приём, называемый **f-строки**.

Можем попробовать напечатать более красивую компактную таблицу умножения:

In [None]:
for a in range(1,10):
  for b in range(1,10):
    print(f"{b} * {a} = {b*a:2}  |  ",end='')
  print()

Здесь мы используем хитрые приёмы:
* Пишем `end=''`, чтобы операция print не переводила печать на другую строку
* Используем **формат печати** `:2` - это значит, что число будет всегда занимать две позиции. Так таблица получается ровной.

------

**Задание**: Нарисуйте ещё что-то красивое с помощью вложенных циклов

In [None]:
# Решение


## Функции

Вернёмся к геометрическим фигурам. Предположим, мы хотим нарисовать домик. У него квадратная форма, треугольная крыша и квадратное окно. Чтобы не писать много раз код для рисования квадратов, мы можем описать **функцию** рисования многоугольника со стороной заданной длины `x`:

In [None]:
def poly(x,n):
  for i in range(n):
    turtle.forward(x)
    turtle.right(360/n)

poly(100,6)
turtle.done()

Теперь, чтобы нарисовать домик, рисуем квадрат, а потом треугольник:

In [None]:
poly(100,4)
turtle.penup()
turtle.forward(100)
turtle.right(30)
turtle.pendown()
poly(100,3)
turtle.done()

Здесь мы использовали функцию `penup` и `pendown` для поднятия и опускания пера. Попробуйте использовать эти функции, чтобы нарисовать внутри домика окно.

## Условия

Предположим, мы хотим нарисовать узор вот такого вида:



In [None]:
turtle.right(90)
for i in range(5):
  turtle.forward(10)
  turtle.left(90)
  turtle.forward(10)
  turtle.right(90)
  turtle.forward(10)
  turtle.right(90)
  turtle.forward(10)
  turtle.left(90)
turtle.done()

Видим, что внутри цикла действия очень похожи, но отличаются лишь направлением поворота. Мы можем упростить этот код, добавив условие на направление поворота:

In [None]:
turtle.right(90)
for i in range(20):
  turtle.forward(10)
  if i%4==0 or i%4==3:
    turtle.left(90)
  else:
    turtle.right(90)
turtle.done()

Здесь `i%4` означает остаток от деления `i` на 4, т.е. это число, которое меняется в диапазоне от 0 до 3. Когда оно равно 0 или 3 - мы поворачиваем влево, в противном случае - вправо.

## Красота программирования

Программирование - удивительное занятие, потому что мы можем написать очень короткий код для рисования бесконечно сложных вещей. Попробуем, например, нарисовать **снежинку Коха**

![](https://github.com/shwars/pycourse/blob/master/images/KochFlake.PNG?raw=true)

In [None]:
def koch_curve(n,x):
    if n==0:
        turtle.forward(x)
    else:
        koch_curve(n-1,x/3)
        turtle.left(60)
        koch_curve(n-1,x/3)
        turtle.right(120)
        koch_curve(n-1,x/3)
        turtle.left(60)
        koch_curve(n-1,x/3)

turtle.right(90)
koch_curve(4,100)
turtle.done()

In [None]:
def koch_snowflake(n,x):
    for _ in range(3):
        koch_curve(n,x)
        turtle.right(120)

koch_snowflake(3,100)
turtle.done()

## А как устроен анализ данных?

Python очень часто используется для анализа данных! Данные часто организованы в **таблицы**. Для работы с таблицами используется библиотека Pandas.

Рассмотрим пример. Все вы наверняка знаете историю с Титаником. Возьмём данные пассажиров Титаника:

In [None]:
import pandas as pd

df = pd.read_csv("https://storage.yandexcloud.net/mypub/data/ctitanic.csv")
df

Какова средняя вероятность выживания? Для этого посчитаем среднее значение колонки "Survived":

In [None]:
df['survived'].mean()

Давайте поймём, кому было проще выжить: мужчинам или женщинам? Пропускали ли мужчины женщин вперёд, или сражались за свою жизнь?

In [None]:
df.groupby('gender')['survived'].mean()

Можем построить это в виде графика:

In [None]:
df.groupby('gender')['survived'].mean().plot.bar()

**Задание**: Посмотрите, как меняется вероятность выживания в зависимости от класса пассажира?

In [None]:
# Решение

А как понять, как влияет возраст? Можно построить **гистограмму**, для разных значений колонки **survived**:

In [None]:
import seaborn as sns
sns.histplot(df,x='age',kde=True,hue='survived')

## Анализируем фото

Теперь задействуем искусственный интеллект чтобы решить сложную задачу - понять, насколько дети счастливы в летних школах. Для этого возьмём фотографии с предыдущей школы:

In [None]:
!wget https://storage.yandexcloud.net/junpub/junling2024.zip
!7za x junling2024.zip

Для работы с лицами на фото установим библиотеку `deepface`:

In [None]:
!pip install deepface

Посмотрим, что можно извлечь из фото с помощью этой библиотеки:

In [None]:
from deepface import DeepFace
DeepFace.analyze('images/img_0000.jpg')

Теперь обработаем все фотографии. На стадартном Google Colab это будет выполняться очень долго.

In [None]:
from tqdm.auto import tqdm
from glob import glob
res = []
for fn in tqdm(glob('images/*')):
  try:
    z = DeepFace.analyze(fn,silent=True)
  except ValueError:
    z = []
  for f in z:
    t = {
        "gender" : f['dominant_gender'],
        "age" : f['age'],
        "confidence" : f['face_confidence']
    }
    for k,v in f['emotion'].items():
      t[k] = v
    res.append(t)

Чтобы не ждать ответа, загрузим уже готовые данные:

In [None]:
import pandas as pd
df = pd.read_csv("https://storage.yandexcloud.net/junpub/junling2024.csv")
df

Посмотрим на возраст участников

In [None]:
sns.histplot(df,x='age',kde=True)

Давайте ответим на интересный вопрос: кто счастливее, мужчины или женщины?

In [None]:
df.groupby('gender')['happy'].mean().plot.bar()

А как уровень счастья зависит от возраста?

In [None]:
df['agegroup'] = df['age'] // 10 * 10
df.groupby('agegroup')['happy'].mean().plot.bar()

А каких эмоций больше?

In [None]:
import numpy as np

emotions = ['angry','disgust','fear','happy','sad','surprise','neutral']
df[emotions].apply(lambda x:emotions[x.argmax()],axis=1).value_counts()


## Выводы

Мы познакомились с языком Python. Он позволяет:
* Легко проводить вычисления прямо в интернет
* Рисовать бесконечно сложные узоры с помощью коротких фрагментов кода
* Анализировать данные и строить графики
* Работать с искусственным интеллектом