# Основы языка форматирования текста Markdown

Если в верхней строчке меню выбрать из выпадающего списка вместо типа ячейки `Code` тип `Markdown`, то мы получим возможность гибко оформлять текст.

Если вы используете знак `#` и обязательно пробел, то мы получим заголовки разных уровней. Чем больше знаков решетка, тем ниже уровень.

# Заголовок 1
## Заголовок 2
### Заголовок 3
...
###### Заголовок 6

Мы можем выделять текст используя символ `*`. Одна звездочка сделает текст *курсивом*, две звездочки - **жирным**. 

Полезная функция - создание списков. Для разметки неупорядоченных списков можно использовать или `*`, или `-`, или `+`:

Для разметки неупорядоченных списков можно использовать или `*`, или `-`, или `+`:

- элемент 1
- элемент 2
- элемент ...

Вложенные пункты создаются четырьмя пробелами перед маркером пункта:

* элемент 1
* элемент 2
    * вложенный элемент 2.1
    * вложенный элемент 2.2
* элемент ...

Упорядоченный список:

1. элемент 1
2. элемент 2
    1. вложенный
    2. вложенный
3. элемент 3

Не принципиально как пронумерованы элементы списка, интерпретатор сам правильно расставит нумерацию.

Иногда нужно выделить текст и мы будем использовать символ `>` с пробелом в начале строки.

> Это цитата

Код мы можем отмечать в строке используя апостроф (символ на той же клавише, что и буква Ё). Например, `print('Привет, мир!')`. Или стразу три апострофа, если хотим указать целый блок. После апострофа можем указать название интерпретатора, который должен использоваться для подсветки цветом.

```python
a='Привет, мир!'
print(a)
```

Более подробно можно познакомиться с языком и его возможностями, например, [здесь](https://paulradzkov.com/2014/markdown_cheatsheet/).

## Задание

Измените тип ячейки и попробуйте создать примера элементов:
- заголовок;
- нумерованный список;
- ненумерованный список;
- выделение кода в тексте.


# Оглавление

* [Основы языка Python и алгоритмические конструкции](#1)
    * [Основные переменные и преобразованиее типов](#1-1)
    * [Основные переменные и преобразованиее типов](#1-1)
    * [Списки](#1-2)
    * [Словари](#1-3)
    * [Операции со значениями](#1-4)
    * [Вводы данных пользователем](#1-5)
    * [Преобразование типов](#1-6)
    * [Циклы и ветвления](#1-7)
    * [Функции](#1-8)
    * [Импорт модулей](#1-9)
* [Объектно-ориентированное программирование](#2)
* [Загрузка/выгрузка данных из файлов и особенность форматов xlsx, csv, json, XML](#3)
    * [CSV](#3-1)
    * [Excel](#3-2)
    * [JSON](#3-3)
    * [XML](#3-4)
    * [From_dict](#3-5)
* [Получение данных с использованием REST/JSON API](#4)

# Основы языка Python и  алгоритмические конструкции <a class="anchor" id="1"></a>

Это язык программирования, который создавался как простой и понятный. В настоящее время является стандартом в области анализа данных и машинного обучения. 

Пару слов о синтаксисе. `#` используется для комментирования кода. Любая строка за этим символом будет игнорироваться интерпретатором. Для выводы на экран значения переменных мы используем функцию `print()`.

Интерпретатор выполняет все инструкции последовательно. Если находит ошибку - прекращает выполнение.

```python
print('Ищу ошибку в коде...')
рrint('Тут нет ошибки!')
print('Эту строку не смог выполнить...')
```

## Основные переменные и преобразованиее типов <a class="anchor" id="1-1"></a>
Базовыми переменными в Python являются:
- `integer` - целое число (2)
- `float` - число с дробной точкой (3.14). Разделитель точка
- `boolean` - логическая переменная: `True` или `Fals`e (истина или ложь)
- `string` - строки, чтобы интерпретатор Python понимал, что это строка, помещаем в кавычек. Например: `"это строка"`, `'это тоже строка'` и `"""это, не поверите, тоже строка"""`. Число записанное в кавычках `"3.14"` будет восприниматься как строка.

В Python не надо объявлять переменные заранее, вы можете вводить их по мере необходимости. А также переменная может менять тип. Для названия переменных вы можете использовать латинские буквы, цифры, знаки подчеркивания, тире. Никогда не используйте символы l (маленькая латинская буква «эль»), O (заглавная латинская буква «о») или I (заглавная латинская буква «ай») как однобуквенные идентификаторы. В некоторых шрифтах эти символы неотличимы от цифры один и нуля. Если очень нужно l, пишите вместо неё заглавную L. Часто возникает путаница с латинской "с" и русской "с". Также нельзя использовать зарезервированные языком слова. Например, <font color='green'>import</font>, <font color='green'>type</font> и тд. Такие слова Jupyter подсветит вам зеленым цветом.

Ниже пример.
```python
a = 12
b = 13.5
c = '12'
d = 'Ave Caesar!'
e = True
```

## Списки <a class="anchor" id="1-2"></a>

Важный тип данных, который мы будем часто использовать - списки. Иногда их называют массивами, что не совсем верно, но не принципиально. Как создать одномерный список. Есть несколько способов.

```python
#пустой список 
L1=[] #такое объявление очищает список, если он был ранее создан

L1.append('раз') #cписок из одного эллемента

L1.append('два') #список из двух элементов

print(L1) # >['раз', 'два']

```

Список можно объявить и так

```python
L2=['рубли', 'доллары', 'евро']

print(L2)
```

Чтобы получить доступ к элементу списка надо обратиться к нему по индексу в квадратных скобках индекс начинается с нуля, те в списке из 10 элементов последний индекс 9

```python
print(L2[2]) # >'евро'

#последний элемент списка через отрицательный индекс
print(L2[-1]) # >'евро'

#срез, некоторое количество элементов списка
print(L2[:2]) # >['рубли', 'доллары']
```

Используя индексы мы можем не только получать значение элемента списка, но и менять его.

```python
L2[2]='лиры'
print(L2[2]) # >'лиры'
```

Списки могут хранить элементы любых типов.

```python
L6=['one', 1, True, 3.14, [1,2,3]]
print(L6)
```

Списки могут быть также двумерными или трехмерными.

```python
L7=[[1,2,3], [4,5,6], [7,8,9]]

print(L7[1][2]) # >5

print(L7)
```

Доступ к элементу через два указателя: первый - строка, второй - столбец. 

Списки имеют свои собственные методы. Например, сортировка.

```python
L8=[2,4,2,6,8,9,3,5]
L8.sort()
print(L8)
```

Подробнее [здесь](https://pythonru.com/uroki/spiski-list-uroki-po-python-dlja-nachinajushhih)


### Задание

1. Создайте одномерный список из 10 элементов
2. Получите доступ (выведите значение) 4 элемента
3. Получите срез первых пять элементов
4. Получите последний элемент
5. Измените 3 элемент в списке
7. Создайте двумерный список (4 на 2 элемента)
7. Получите доступ к элементу к первому элементу второй строки.

## Словари <a class="anchor" id="1-3"></a>

Словари в Python - неупорядоченные коллекции произвольных объектов с доступом по ключу. Их иногда ещё называют ассоциативными массивами или хеш-таблицами.

Словари работают очень быстро и их понимание позволит нам разобраться, например, с json.

Чтобы работать со словарём, его нужно создать. Создать его можно несколькими способами. Во-первых, с помощью литерала:

```python
d = {}

d = {'dict': 1, 'dictionary': 2}

d # >{'dict': 1, 'dictionary': 2}
```

Обратиться к элементу можно двумя способыми.

```python
d['dict'] # >1
```

Если запрашиваемого элемента нет, то интерпретатор выдаст ошибку.

```python
d['словарь']
```

В таких случаях, лучше использовать метод `get()`.

```python
print(d.get('dict')) # >1

print(d.get('словарь')) # Выведет значение None, но исключения (ошибки) не будет

print(d.get('словарь', 'Нет такого ключа')) #

d['словарь']=3 #добавили новый элемент
      
```

Элементы списков и словаря можно перебирать при помощи циклов `for ... in...`.

Подробнее о словарях и методах [здесь](https://pythonru.com/uroki/slovar-dict-uroki-po-python-dlja-nachinajushhih).

### Задание

1. Создайте произвольный словарь из трех элементов
2. Добавьте четвертый элемент
3. Получите значение любого элемента двумя способами обращения к нему


## Операции со значениями <a class="anchor" id="1-4"></a>

В Python с переменными можно совершать операции присвоения использую символ `=`, а также:

```python
a = 13
b = 2
summ = a + b # сложение
print(summ)
sub = a - b # вычитание
print(sub)
mul = a * b # умножение
print(mul)
dev = a / b # деление
print(dev)
rem = a % b # нахождение остатка от деления
print(rem)
dvr = a //b # деление без остатка
print(dvr)
exp = a**b # возведение в степень
print(exp)
```

Например, операции сложения и умножения также можно выполнять над строками.

```python
s1="молоко 1"
s2="пастеризованное"
print('Суммирование строк: ', s1+' '+s2)
print('Удвоение строки: ',s1*2)
print('Разделим строку по пробелу: ', s1.split(' ')) 
```

Некоторые полезные строковые методы.

```python
s3='МоЛоКо'

print(s3.upper()) #переведет все в верхний регистр
print(s3.lower()) #переведет все в нижний регистр
print(s3.replace('о','0')) #заменит букву о на 0
```

Также над переменными можно выполнять логические операции.

```python
a = 10
b = 5

print(a + b > 14) # >True

print(a < 14 - b) # >False

print(a != b) # >True - оператор "не равно"

print(a == b) # >False - оператор равно
```

Сложные логические операции.

```python

x = 8
y = 13
y < 15 and x > 8 # >False

y < 15 or x > 8 # >True
```

## Ввод данных пользователем <a class="anchor" id="1-5"></a>

Для ввода данных с клавиатуры пользователем используем функцию `input()`.

```python
D1=input('Введите число: ') #значение введенное с клавиатуры будет присвоено переменной D1
D2=input('Введите второе число: ')
print(D1+D2)#Найдем сумму двух переменных

print(type(D1)) # выведет str, те тип переменной
```

## Преобразование типов <a class="anchor" id="1-6"></a>

Иногда надо преобразовать один тип переменной в другой. 

```python
type(int(D1))

new_int=int(D1)

print(int(D1)+int(D2)) #преобразование одной строкой
```

Полностью эквивалентный код
```python
Dd1=int(D1)
Dd2=int(D2)
print(type(Dd1), Dd1+Dd2)
```

Преобразование можно выполнять в любой тип
```python
z=3
z_float=float(z)
z_str=str(z)
```

Но важно помнить, что при преобразовании с числовые значения, не должно быть лишних символов. А десятичные знаки отделяются точкой.
```python
y='5,3'
y=int(y) #выдаст исключение
```

## Циклы и ветвления <a class="anchor" id="1-7"></a>

Давайте представим, что нам надо выполнять какую-то операцию несколько раз. Здесь нам пригодятся циклы, те конструкции, которые могут выполняться указанное количество раз. Проще говоря, повторение. Самый простой вид цикла - while.

```python
i=1 #переменная будет у нас выполнять подсчет выполненных циклов
while True: #исполнять пока истина, фактически это вечный цикл
    print('Выполняю повторение: ', i)
    i+=1 #подсчитываем количество выполненных циклов. Увеличиваем i на единицу. Эквивалентно i=i+1
```

Чтобы выйти из такого цикла можно использовать оператор `break`, он прервет исполнения цикла. А понять, когда надо прервать нам помогут операторы ветвления. В частности конструкция `if ... then ... else...`.

```python
# Давайте вспомним булевые переменные, которые принимают значение истина (True) или ложь (False)
K1=1
K2=3
print('Равенства K1==1', K1==1)
print('Меньше K1<K2', K1<K2) 
print('Больше K1>K2', K1>K2)
print('Больше или равно K1>=K2', K1>=K2)
print('Не равно K1!=K2', K1!=K2 )
print('Цепочка условий 0<K1<10', 0<K1<10)
```

Пример выполнения логических операций. Хочу обратить внимание, что на практике ситуация с прописными и строчными буквами решается приведением всех букв к строчным.

```python
D5=input('Введите слово "корова": ') 
if D5=='корова' or D5=='КОРОВА' or D5=="Корова":
    print('У вас все получилось! Поздравляем.')
else:
    print('Вы ошиблись в написании')
```

> Важно! Вложенные блоки в Python выделяются четырьмя пробелами. И строка, которая открывает блок заканчивается двоеточием.

Вернемся к вечному циклу.

```python
i=1 #переменная будет у нас выполнять подсчет выполненных циклов
while True: #исполнять пока истина, фактически это вечный цикл
    print('Выполняю повторение: ', i)
    if i==10:
        break
    else:
        i+=1 #подсчитываем количество выполненных циклов. Увеличиваем i на единицу. Эквивалентно i=i+1
```

Есть еще одна конструкция для организации циклов, она часто удобнее и работает быстрее. Этот цикл перебирает значения некоторой  последовательности.

```python
for i in range(10): #range(10) - генерирует последовательность от 0 до 9
    print(i)
    
for i in range(1,11): #генерирует последовательность от 1 до 10
    print(i)
```

Цикл будет продолжаться, пока пользователь не введет цифру.

```python
while True:
    S4=input('Введите число: ')
    try:
        #вложенный блок, интерпретатор не выдаст ошибку если возникнет, а выполнить блок except
        D3=float(S4)
        break #если возникает ошибка преобразования, то break уже не исполняется
    except:
        #второй вложенный блок, выполняется если возникла ошибка
        D3=None
        print('Вы ввели не число.')
print(D3)
```

Если между в коде между try и except возникает ошибка (более правильно говорить исключение), то код не прекратит выполнение. Но будет выполнен код блока except. Те у нас есть возможность обработать исключение. Например, сообщить пользователю, что он ввел не верное значение.

Циклы также используются для работы со словарями или списками.

```python
for value in L8:
    print(value)
```

Подробнее:
- [while](https://pythonru.com/uroki/cikl-while-uroki-po-python-dlja-nachinajushhih)
- [for](https://pythonru.com/uroki/cikl-for-uroki-po-python-dlja-nachinajushhih)
- [if](https://pythonru.com/uroki/uslovnye-vyrazhenija-i-konstrukcija-if-uroki-po-python-dlja-nachinajushhih)

### Задание

Напишите код, который будет выполнять следующие действия:
1. Запрашивать у пользователя некоторое число
2. Проверять не превышает ли это число значение 5
3. Если не превышает, вывести указанное количество раз на экран слово "РЖД" использую сначала цикл `while`, а затем
  `for`
4. Если превышает, то вывести сообщение пользователю

## Функции <a class="anchor" id="1-8"></a>
 
Неудобно каждый раз переписывать повторяющийся код. Его можно превратить в функцию.

```python
# функция возведения в квадрат
def quadro(d): #передаем переменную
    res=d**4 #возводим в квадрат
    return res #возвращаем результат и выходим их  функции, может быть более одной точки выхода из функции

quadro(2) #вызываем функцию
```

Внутри функции используются свои значения переменных.

```python
m=3 
print('Значение переменной в рамках основного кода: ', m)

def f1(m): #объявляем функцию
    print('Внутри функции: ', m) #выведем значение переменной m внутри функции
    return m+m

print('Результат выполнения функции: ', f1(1))
print('Значение переменной m в рамках основного кода после вызова функции: ', m)
```


Передавать можно больше чем один параметр.

```python
#передавать можно больше чем один параметр
def mySum(a,b):
    return a+b

mySum(5,10)
```

### Задание 

Код из предыдущего задания оформите в виде функции. Первая функция запрашивает значение у пользователя и приводит его к типу `Int`. Вторая функция проверяет число на соответствие уровню и печатает заданное слово.

## Импорт модулей <a class="anchor" id="1-9"></a>

Часто нам не хватает встроенных функций. В этом случае на помощь приходят внешние модули. Их надо импортировать. Есть пара способов.

```python
#импортируем всю библиотеку и обращаемся к функции через ее название и точку
import random
random.randint(1,10) #функция генерирует целое число в диапазоне

#можем импортировать только одну функцию и тогда обращаемся к ней просто по имени
from random import randint, gauss
randint(1,10)

#импортировать под своим именем (псевдонимом)
import random as ra
ra.randint(1,10)
```

По сути это эквивалентные примеры:

```python
import re
re.split(' ', 'Мама мыла раму')

from re import split, sub, match
split(' ', 'Мама мыла раму')

import re as r2d2
r2d2.split(" ", "Мама мыла раму")
```

# Объектно-ориентированное программирование <a class="anchor" id="2"></a>

Цель пояснить суть объектов и методов.

Объектно-ориентированное программирование (ООП) — парадигма программирования, в которой основными концепциями являются понятия объектов и классов.

Класс — тип, описывающий устройство объектов. Объект — это экземпляр класса. Класс можно сравнить с чертежом, по которому создаются объекты.

Python соответствует принципам объектно-ориентированного программирования. В python всё является объектами - и строки, и списки, и словари, и всё остальное.

Но возможности ООП в python этим не ограничены. Программист может написать свой тип данных (класс), определить в нём свои методы.

Это не является обязательным - мы можем пользоваться только встроенными объектами. Однако ООП полезно при долгосрочной разработке программы несколькими людьми, так как упрощает понимание кода.

```python

#объявление класса и его методов
class A:
    arg='Python'
    
    #метод класса, выводит значение аргумента класса
    def g(self): # self - обязательный аргумент, содержащий в себе экземпляр
                 # класса, передающийся при вызове метода,
                 # поэтому этот аргумент должен присутствовать
                 # во всех методах класса.
        print(self.arg)
        return 1
        
    #метод класса, проверяет оригинальность аргумента класса
    def control(self):
        if self.arg=='Python':
            print('Оригинальная переменная')
        else:
            print('Переменная была изменена')
            
a=A() #смоздаем экземпляр класса

a.g() # >Python

a.control() # >Оригинальная переменная

a.arg='Markdown' #изменим аргумент экземпляра класса 
a.control() #Переменная была изменена

```

### Задание 

Измените код класса. Создайте метод, который использую метод строки `str.lower()` будет выводить значение аргумента объекта (элемента класса) строчными буквами.

# Загрузка/выгрузка данных из файлов и особенность форматов xlsx, csv, json, XML <a class="anchor" id="3"></a>


Существует несколько популярных форматов внешних данных. 

**CSV** (от англ. Comma-Separated Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Строка таблицы соответствует строке текста, которая содержит одно или несколько полей, разделенных запятыми.

Формат CSV стандартизирован не полностью. Идея использовать запятые для разделения полей очевидна, но при таком подходе возникают проблемы, если исходные табличные данные содержат запятые или переводы строк. Возможным решением проблемы запятых и переносов строк является заключение данных в кавычки, однако исходные данные могут содержать кавычки. Помимо этого, термином «CSV» могут обозначаться похожие форматы, в которых разделителем является символ табуляции (TSV) или точка с запятой. Многие приложения, которые работают с форматом CSV, позволяют выбирать символ разделителя и символ кавычек.

**JSON** (JavaScript Object Notation) – это текстовый формат представления данных в нотации объекта JavaScript. Предназначен JSON, так же как и некоторые другие форматы, такие как XML и YAML, для обмена данными. Несмотря на своё название, JSON можно использовать не только в JavaScript, но и в любом другом языке программирования.
JSON, по сравнению с другими форматами, также обладает достаточно весомым преимуществом. Он, в отличие от них, является более компактным, а это очень важно при обмене данными в сети Интернет. Кроме этого, JSON более прост в использовании, его намного проще читать и писать. Фактически, ничем не отличается от словаря в Python.

**XML** (англ. eXtensible Markup Language) — расширяемый язык разметки. Рекомендован Консорциумом Всемирной паутины (W3C). Спецификация XML описывает XML-документы и частично описывает поведение XML-процессоров (программ, читающих XML-документы и обеспечивающих доступ к их содержимому). XML разрабатывался как язык с простым формальным синтаксисом, удобный для создания и обработки документов программами и одновременно удобный для чтения и создания документов человеком, с подчёркиванием нацеленности на использование в Интернете. Язык называется расширяемым, поскольку он не фиксирует разметку, используемую в документах: разработчик волен создать разметку в соответствии с потребностями к конкретной области, будучи ограниченным лишь синтаксическими правилами языка. Расширение XML — это конкретная грамматика, созданная на базе XML и представленная словарём тегов и их атрибутов, а также набором правил, определяющих, какие атрибуты и элементы могут входить в состав других элементов. Сочетание простого формального синтаксиса, удобства для человека, расширяемости, а также базирование на кодировках Юникод для представления содержания документов привело к широкому использованию как собственно XML, так и множества производных специализированных языков на базе XML в самых разнообразных программных средствах.

По факту, XML проще всего приводить к словарю. 

**Pandas** – это высокоуровневая Python библиотека для анализа данных. Почему я её называю высокоуровневой, потому что построена она поверх более низкоуровневой библиотеки NumPy (написана на Си), что является большим плюсом в производительности. В экосистеме Python Pandas является наиболее продвинутой и быстроразвивающейся библиотекой для обработки и анализа данных. В своей работе мне приходится пользоваться ею практически каждый день, поэтому я пишу эту краткую заметку для того, чтобы в будущем ссылаться к ней, если вдруг что-то забуду. Также надеюсь, что читателям блога заметка поможет в решении их собственных задач с помощью Pandas и послужит небольшим введением в возможности этой библиотеки.

Чтобы эффективно работать с Pandas, необходимо освоить самые главные структуры данных библиотеки: DataFrame и Series. Более подробно на них мы остановимся позже. Пока изучим вопросы чтения и записи данных.

Импортируем библиотеку:

```python
import pandas as pd
```
## CSV <a class="anchor" id="3-1"></a>

Для операций чтения используются примерно одинаковые по синтаксису методы.
`pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None)`

Здесь приведена только часть возможных параметров:
- filepath_or_buffer – путь к файлу, можно указывать как URL.
- Sep – каким символом разделены значения.
- Header – сколько строк надо пропустить, так как это заголовок.
- Names – списком можно передать названия столбцов.

Подробнее в [документации](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html)

Ниже пример.

```python
import pandas as pd 

#набор перечень ЖД станций СНГ
df=pd.read_csv('http://www.rlw.gov.ru/opendata/7708525167-railwaystationssng/data-20200928-structure-20180312.csv', 
               sep=',', header=None, names=["Наименование","Производимые коммерческие операции",
                                              "Наименование железной дороги","Код станции",
                                            "Транзитные пункты", "Комментарий"])
df.head() #выведет первые пять строчек таблицы
```

## Excel <a class="anchor" id="3-2"></a>

Таким же образом можно прочитать, например, файл MS Excel. Для этого используем метод:

`pandas.read_excel(io, sheet_name='SheetName', names=None)`

где:
- io - путь или ссылка на файл
- sheet_name - имя листа
- Names – списком можно передать названия столбцов.

Подробнее в [документации](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html)

## JSON <a class="anchor" id="3-3"></a>

Аналогичный метод есть в pandas и для чтения json.

`pandas.read_json(path_or_buf, orient=str)`

где:
- path_or_buf ссылка или пусть к файлу json
- orient указывает каким образом преобразовать словарь в таблицу. 

Возможные значения параметра orient:
- `split` : указыввает преобразовать как {index -> [index], columns -> [columns], data -> [values]}
- `records` : указыввает преобразовать как [{column -> value}, ... , {column -> value}]
- `index` : указыввает преобразовать как {index -> {column -> value}}
- `columns` : указыввает преобразовать как {column -> {index -> value}}
- `values` : просто массив значений

Подробнее в [документации](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_json.html).

Но не всегда json однозначно можно преобразовать в табличную форму. В этом случае лучше использовать библиотеку `json`, если читаем файл или библиотеку `requests`, если читаем по ссылке. А дальше разбирать данные из структуры "вручную".

```python
import requests
#прочитаем данные по ссылке
r = requests.get('https://support.oneskyapp.com/hc/en-us/article_attachments/202761727/example_2.json')
j=r.json()

#получим список ключей первого уровня
print(j.keys()) # >dict_keys(['quiz'])
```

Получим список ключей второго уровня.

```python
print(j['quiz'].keys()) # >print(j['quiz'].keys())

#получитм данные по ключу
print(j['quiz']['sport']) # на выходе сложная структура

#получим значения по ключу
print(j['quiz']['sport']['q1']['question']) # >'Which one is correct team name in NBA?'
print(j['quiz']['sport']['q1']['options']) # >['New York Bulls',  'Los Angeles Kings',  
                                           # 'Golden State Warriros',  'Huston Rocket']
```

## XML <a class="anchor" id="3-4"></a>

C XML форматом все несколько сложнее. По факту, после прочтения, мы его также преобразовываем в словарь и разбираем "в ручную". Здесь нам понадобятся новые библиотеки. Часть из них, возможно, нужно будет до установить на рабочие серверы. 

```python
import requests
import xml.etree.ElementTree as ET
r=requests.get('https://httpbin.org/xml') # получаем по ссылке
tree = ET.fromstring(r.content) #преобразуем в объект

print(tree) # > <Element 'slideshow' at 0x7f1d002601d8> (примерно такой текст)

for child in tree.iter('*'):
    print(child.tag) #выведет список ключей

print(ET.dump(tree)) #покажет структуру нашего XML
```

С таким объектом работать не совсем удобно. Лучше все преобразовывать к знакомым структурам. В частности, словарям. Учитываете, что это продолжение примера, без запуска кода на шаг выше, этот пример работать не будет.

```python
import xmltodict
d=xmltodict.parse(r.content)

print(d.keys()) # >odict_keys(['slideshow'])

print(d['slideshow']['@title']) # >Sample Slide Show
```

## from_dict <a class="anchor" id="3-5"></a>

Структуру DataFrame удобно получить из словаря. Для этого воспользуемся методом pandas.DataFrame `from_dict`.

`pd.DataFrame.from_dict(data, orient='columns')`

где:
- data, словарь, который преобразуем в DataFrame
- orient {‘columns’, ‘index’}, по умолчанию ‘columns’. Указывает на ориентацию данных. Если ключи переданного словаря должны быть столбцами результирующего DataFrame, передайте «columns» (по умолчанию). В противном случае, если ключи должны быть строками, передайте «index».

Небольшой пример.
```python
import pandas as pd
from pprint import pprint
d={'a':[1,2,3], 'b':[3,4,5], 'c':[6,7,8]} #создадим для наглядности простой словарь

df=pd.DataFrame.from_dict(d) #по умолчанию ключи словаря - это название колонок
pprint(df)
```

Можно изменить ориентацию словаря при создании DataFrame.

```python
df=pd.DataFrame.from_dict(d, orient='index') # ключи словаря - это индексы строк
print('Строки:')
pprint(df)
```

## Задание 

1. С сайта http://www.rlw.gov.ru/opendata получите любой набор открытых данных на Ваш выбор.
2. Преобразуйте его в DataFrame.
3. Сохраните результат на своем компьютере.
4. Получите по ссылке XML 'http://www-db.deis.unibo.it/courses/TW/DOCS/w3schools/xml/simple.xml'
5. Преобразуйте сначала в словарь.
6. Выведите описание только первого по порядку блюда.
7. Преобразуйте список блюд в DataFrame.
8. Сохраните на своем компьютере.


# Получение данных с использованием REST/JSON API <a class="anchor" id="4"></a>


Рой Филдинг в 2000 году защитил диссертацию «Архитектурные стили и дизайн сетевых программных архитектур» и тем самым ввел термин REST. Более того, он придумал HTTP и, по сути, является одним из основателей Интернета. 

REST — это набор архитектурных принципов, которые говорят, как нужно проектировать REST протоколы, REST API, RESTful сервисы. Это достаточно абстрактные и сложные архитектурные принципы. ([подробнее](https://habr.com/ru/post/483202/)) Уверен, что никто из вас ни разу не видел API, сделанного полностью по всем RESTful принципам. Мы же будем с более неформальной версией JSON API. Сервер в ответ на ваш запрос возвращает структуру данных типа json. Запросы можно разделить на два типа:

- GET – когда параметры запроса передаются прямо в строке после знака вопроса. Пример: https://www.metaweather.com/api/location/search/?lattlong=36.96,-122.02

    ```python
    r1=requests.get('https://www.metaweather.com/api/location/search/?lattlong=36.96,-122.02')
    ```
- POST – параметры передаются в теле запроса. Также можно передавать файлы в и любые другие вложения. Пример реализации ниже:

    ```python
    payload_tuples = [('key1', 'value1'), ('key1', 'value2')]
    r2 = requests.post('https://httpbin.org/post', data=payload_tuples)
    ```

Результатом запроса к JSON API является структура json, c которой мы уже знакомы.

## Задание

1. Используйте метод https://www.metaweather.com/api/location/search/?query=london (вместо Лондона подставьте город, в котором хотите узнать погоду). 
2. Из полученного ответа извлеките уникальный номер города (параметр `woeid`).
3. Методом https://www.metaweather.com/api/location/44418/ запросите прогноз погоды. Вместо последних цифр подставьте номер своего города. Выведите на экран параметры текущей погоды. 

Используйте GET запросы к ресурсы. Описание API [здесь](https://www.metaweather.com/api/) (англ.)