![Rick and My Job](https://raw.githubusercontent.com/homosociologicus/changellenge/master/images/rick_and_my_job.jpg)

# Упражнение 1: if elif else

Год является високосным, если:
- он делится на 4 и не делится на 100 или
- он делится на 400

Ввод: целое число >= 0

Вывод: `YES` если високосный, иначе `NO`

Пример:

`2020
YES`

In [None]:
A = int(input())
if A % 4 == 0 and A % 100 != 0 or A % 400 == 0:
    print('YES')
else:
    print('NO')

Выведите максимальное число из 3 заданных (не используйте функцию, это скучно)

Ввод: 3 целых числа

Вывод: максимальное число

Пример:

`1
2
3
3`

Бонусное упражнение

![Coordinates](https://raw.githubusercontent.com/homosociologicus/changellenge/master/images/coordinates.png)

Ввод: 4 ненулевых числа: x1, y1, x2, y2

Вывод: `YES` если они в одной четверти, иначе `NO`

Пример:

`1
-3
2
2
NO`

Подсказка: попробуйте понять, что объединяет точки в одной четверти и как это можно записать

# Упражнение 2: циклы for, while

Сумма последовательности

Ввод: случайные ненулевые целые числа, 0 заканчивает последовательность

Вывод: число, равное сумме последовательности

Пример:

`1
2
3
4
5
6
7
8
9
10
0
55`

Старые добрые числа Фибоначчи. "Нулевое" число 0, первое 1, второе 1, далее 2, 3, 5, 8, 13, 21, ...

Ввод: номер числа Фибоначчи >= 1

Вывод: соответствующее число Фибоначчи

Пример:

`8
21`

Снова делимость. Для каждого числа последовательности выведите ближайшее снизу число, делящееся на 9. Если само число делится на 9, выведите его. Считать последовательность на вводе можно с помощью

`my_list = list(map(int, input().split()))`

и, кстати, `list` здесь не нужен (если знаете почему, то это здорово!)

Ввод: последовательность целых чисел, разделенных пробелами

Вывод: последовательность чисел, каждое из которых на новой строке

Пример:

`1 10 21 28 36 44
0
9
18
27
36
36`

# <center> Настала пора сразиться с реальной задачей </center>

![How to Code Fast](https://raw.githubusercontent.com/homosociologicus/changellenge/master/images/how_to_code_fast.jpg)

# <center> Основные концепты: Business Question и Business Value </center>
Представьте, что к вам приходит заказчик - decision maker, будь то департамент или отдельный человек,
и дает (если повезет, иногда ведь вообще ничего не дадут), хм, скажем культурно - некрасивые данные,
а потом говорит:

"Дайте какие-нибудь интересные инсайты насчет того, какую энергию нам стоит использовать.
Мы хотим презентовать себя на рынке как экологичную компанию"

Что делать? Как не довести ситуацию до второго главного вопроса: кто виноват?

### Источники данных: [Our World in Data: Energy](https://github.com/owid/energy-data) & [Our World in Data: CO₂ and Greenhouse Gas Emissions](https://github.com/owid/co2-data)
### Описание данных: [Energy](https://github.com/owid/energy-data/blob/master/owid-energy-codebook.csv) & [GHG](https://github.com/owid/co2-data/blob/master/owid-co2-codebook.csv)

### Заметки
https://ourworldindata.org/energy

https://ourworldindata.org/co2-and-other-greenhouse-gas-emissions
- ископаемое топливо - уголь, нефть и газ (coal, oil, and gas)
- PEC, primary energy consumption - первичное потребление энергии
- GHG, greenhouse gases - парниковые газы

## Импорты и настройка графиков

In [None]:
# если у вас не установлены эти библиотеки, прогоните эту ячейку
!pip3 install --user --upgrade numpy pandas matplotlib seaborn tqdm

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# полезная библиотека для отслеживания прогресса с итераторами
from tqdm import tqdm


# векторные изображения более четко рендерятся
%config InlineBackend.figure_format = 'svg'
# никогда не используйте дефолтный стиль в plt, вы убьете себе глаза
plt.style.use('ggplot')

In [None]:
# как работает tqdm
for _ in tqdm(range(10000000)):
    _ = 100

## Данные
... ибо нам нужны аргументы для ответа бизнесу

In [None]:
energy_data = pd.read_csv('https://raw.githubusercontent.com/owid/energy-data/master/owid-energy-data.csv')
ghg_data = pd.read_csv('https://raw.githubusercontent.com/owid/co2-data/master/owid-co2-data.csv')

## EDA - Exploratory Data Analysis
... знай своего друга, своего врага и данные, которые в тебя бросили

Датасеты относительно ежедневных задач большие, давайте поглядим на них. Используйте методы `info(), head(), tail()` и, при необходимости, атрибут `columns`. Кстати, ввиду однородности столбцов с точки зрения naming conventions, есть смысл отсортировать названия столбцов перед выводом, если вдруг решите с ними ознакомиться

- Давайте возьмем данные с 2000 по наст. время: приведем столбцы `year` в обоих датасетах к типу datetime и возьмем данные с 2000 года
- Давайте исследовать глобальные тренды: выберите данные для всего мира
- Есть ли в датасетах первичный ключ? Если да, то почему бы не использовать его вместо бессмысленного номера строки?

Вам помогут: `pd.to_datetime(), df.set_index()`

### EDA для мировых данных
Теперь, когда мы выделили основные массивы, давайте посмотрим на то, что из себя представляют PEC и GHG. Проверьте на пропуски с помощью метода `isna()` и нужного агрегирующего метода. Видите столбец исключительно с пропусками? С большей частью? Есть ли в нем польза?

Орудие - метод `dropna()`

### Наблюдения
- раз
- два
- три


### Выбор данных
Много колонок => много переменных => много линий / других объектов на картинке => нечитаемые графики => никакой пользы
- Выберем наиболее важные фичи в PEC, которые отражают потребление и долю в PEC
- Аналогично выберем важные столбцы, касающиеся CO₂ and GHG (заметили, что во втором датасете нет столбцов share?)

Подсказка: благодаря авторам датасетов в названиях стоблцов видны подстроки, которые показывают принадлежность к смысловой группе

### Новые фичи
Видно, что в датасете PEC есть столбцы share, показывающие долю от всего PEC. Почему бы не создать такую же красоту в датасете GHG?

In [None]:
# только для главных столбцов, без per capita, total GHG and % growth
ghg_share_cols = []
for col in ghg.columns[:len(ghg_cols) - 2]:
    share_col = 

# Аллилуйя, графики!

### График 1: World PEC, GHG, and CO₂
Давайте построим агрегаты для всего мира:

In [None]:
fig, (ax0, ax1) = plt.subplots(2, sharex=True, figsize=(9, 8))

# world energy consumption
sns.lineplot(x=pec.index,
             y=pec.primary_energy_consumption,
             ax=ax0,
             color='black',
             marker='X',
             label='world PEC')

# world ghg


# world co2


# setting labels and legend
ax0.set_title('GHG Emissions and PEC in the World', x=0.45, y=1.05)
ax0.set_ylabel('energy consumption, TWh')
ax0.legend(loc='upper left')
ax1.set_ylabel('emissions, mln tonnes')
ax1.legend(loc='upper left')

# fig.savefig('graph_1.png', dpi=600)
plt.show()

### Наблюдения
- мысль 1
- мысль 2
- мысль 3

### График 2: World PEC by Source
Посмотрим на распределение потребления энергии в разбивке на источники:

In [None]:
# по аналогии с предыдущим заданием настройте график

# только долевые столбцы
sns.lineplot(data=pec[pec_share_cols],
             palette='Paired',
             marker='o',
             dashes=None)

# не забудьте лейблы

# plt.savefig('graph_2.png', dpi=600)


Есть ли лучшие варианты показать распределение долей? Какие типы графиков подходят для этого?

### Наблюдения
- раз
- два
- три

### График 3: World GHG Emissions by Source

In [None]:
# только долевые столбцы

# не забудьте лейблы


### Наблюдения
- уно
- дос
- трес

### График 4: Changes in World PEC Sources and CO₂
Посмотрим на изменения в PEC и выбросах CO₂:

In [None]:
fig, ax = plt.subplots()

# как всегда, не забудьте лейблы


### Observations
- ан
- дё
- труа

### График 5: World PEC per Capita by Source

In [1]:
# очевидно, только столбцы <что-то> на человека

# подписи хотят, чтобы вы их сделали


### Наблюдения
- если что, можно писать не 3 вывода

### График 6: GHG Emissions per Capita

### Наблюдения
- умный вывод

### График 7: Correlation Matrix between PEC and GHG Emissions
Сложный процесс, поэтому разобьем по шагам:
1. Вертикально соединяем таблицы с ключами
2. Подсчитали корреляцию
3. Выбрали корреляцию между столбцами двух матриц

In [None]:
fig, ax = plt.subplots(figsize=(15, 10))

sns.heatmap(
    pd.concat(
        [pec, ghg],
        axis=1,
        keys=['pec', 'ghg']).corr().loc['pec', 'ghg'],
    vmin=-1,
    vmax=1,
    annot=True,
    fmt='.2f',
    cmap='vlag',
    ax=ax
)
plt.title('Correlation between PEC and GHG Emissions in the World', x=0.45)

plt.show()

## Observations
Тут может быть очень много наблюдений, но вспомните бизнес вопрос и выделите только самые важные

## Выводы и ответ на бизнес вопрос