# **Практика 3. Новые признаки.**

[SmartLMS](https://edu.hse.ru/mod/quiz/view.php?id=1918937)

Набор данных содержит дела, рассмотренных Верховным судом Соединенных Штатов. Каждое дело содержит идентификационные данные, а также факты по делу и результат решения с 1970 по 2020 год.

- `ID`: Уникальный идентификатор дела в базе данных.
- `docket`: Номер дела в судебном реестре, официальный номер, присваиваемый делу при поступлении в суд.
- `term`: Год начала сессии Верховного суда, в течение которого было рассмотрено дело.
- `first_party`: Первая сторона в деле (обычно истец или податель апелляции).
- `second_party`: Вторая сторона в деле (обычно ответчик или сторона, против которой подана апелляция).
- `facts`: Текстовое описание фактических обстоятельств дела.
- `majority_vote`: Количество судей, проголосовавших за большинство (за основное решение).
- `minority_vote`: Количество судей, проголосовавших за мнение меньшинства (против основного решения).
- `first_party_winner`: выиграла ли первая сторона (`first_party`) дело True, иначе False
- `decision_type`: Тип судебного решения
- `disposition`: Итоговое распоряжение по делу (например, "утверждено", "отменено", "возвращено на пересмотр").
- `issue_area`: Тематическая область права, к которой относится дело (например, уголовное право, свобода слова, федерализм).

In [2]:
import pandas as pd
df = pd.read_csv('data/supreme_court.csv')
df.head(2)

Unnamed: 0,ID,docket,term,first_party,second_party,facts,majority_vote,minority_vote,first_party_winner,decision_type,disposition,issue_area
0,50606,70-18,1971,Jane Roe,Henry Wade,"In 1970, Jane Roe (a fictional name used in co...",7,2,True,majority opinion,reversed,
1,50613,70-5014,1971,"Peter Stanley, Sr.",Illinois,Joan Stanley had three children with Peter Sta...,5,2,True,majority opinion,reversed/remanded,Civil Rights


## **Задание 1**

Создайте новый признак `votes_sum`, который будет содержать информацию о количество судей, которые участововали в судебном процессе, на основе признаков `majority_vote` и `minority_vote`.

| `majority_vote`	 |  `minority_vote`	|  `votes_sum` |
| ----- | ------ | ------ |
| 6	  | 1	|   7 |
| 5	 |  4	|   9 |
| 8 |	  0	|   8 |

Укажите выиграл ли истец (`first_party_winner`) в процессе по защите гражданских прав (**Civil Rights**; `issue_area`) c наименьшим количеством судей (`votes_sum`).

Выберите один верный вариант ответа:
- Выиграл (**True**)
- Проиграл (**False**)

---

## **Задание 2**

Укажите шкалу измерения признака `votes_sum`. Выберите один верный вариант ответа:
- количественный непрерывный
- количественный дискретный
- категориальный номинальный
- категориальный номинальный бинарный
- категориальный порядковый

---

## **Задание 3**

Создайте новый признак `term_decade`, в котором будет определено десятилетие, в которое рассматривалось дело, на основе признака `term`

| `term`	 |  `term_decade` | 
| ----- | ------ |
| 1971	 |   70 | 
| 1982	 |   80 | 
| 2000	 |   00 | 
| 2020	 |   20 | 

Укажите процент дел 90-х годов (**90**; `term_decade`), решение по которым вынесено единогласно (**0**; `minority_vote`). Ответ округлите до двух знаков.

---

## **Задание 4**

Укажите шкалу измерения признака `term_decade`. Выберите один верный вариант ответа:
- количественный непрерывный
- количественный дискретный
- категориальный номинальный
- категориальный номинальный бинарный
- категориальный порядковый



---

## **Задание 5**

Создайте новый признак `len_facts`, который будет подсчитывать количество символов (в том числе пробелов и других синтаксических знаков) в признаке `facts`. В ответ укажите номер дела в судебном реестре (`docket`) с наибольшим количеством символов (`len_facts`) по которому было равное количество голосов судей (**equally divided**; `decision_type`).



---

## **Задание 6**

Создайте новый признак `count_words_facts`, который будет подсчитывать количество слов, разделенных пробелом, в признаке `facts`.

| facts	|  count_words_facts |
| ----- | ----- |
 | court-martial	 |   1 | 
 | In 2014,	 |   2 | 
 | In 2014, a general court-martial	  |  5 | 

Среди дел, в которых истец проиграл (**False**; `first_party_winner`), найдите дело с наименьшим значением `len_facts`. В ответ укажите значение `count_words_facts` этого дела.

---

## **Задание 7**

Укажите шкалу измерения признаков `len_facts` и `count_words_facts`. Выберите один верный вариант ответа:
- количественный непрерывный
- количественный дискретный
- категориальный номинальный
- категориальный номинальный бинарный
- категориальный порядковый

---

## **Задание 8**

Вы наверняка знаете, что в США действует прецедентное право. В зависимости от того как было вынесено решение (`decision_type`), оно может стать прецедентом или нет. Обычно, действует такая логика:
- **majority opinion**, **opinion of the court** → создают прецедент
- **per curiam**, **plurality opinion** → могут создать прецедент, но с ограничениями
все остальные решения прецедент не создают.

Создайте новый признак `precedent_rang` на основе признака `decision_type`:
- Если `decision_type` соответствует **majority opinion** или **opinion of the court** вернуть **1**
- Если `decision_type` соответствует **per curiam** или **plurality opinion** вернуть **2**
- Во всех остальных случаях вернуть **3**

Найдите последнее дело (`term`), которое не стало прецедентом (**3**; `precedent_rang`). Укажите область права, к которому относится это дело (`issue_area`).

---

## **Задание 9**

Укажите шкалу измерения признаков `precedent_rang`. Выберите один верный вариант ответа:
- количественный непрерывный
- количественный дискретный
- категориальный номинальный
- категориальный номинальный бинарный
- категориальный порядковый

---

## **Задание 10**

Создайте новый признак `is_vacated` на основе признака `disposition`. Если дело было аннулировано (`disposition` содержит **vacated**) вернуть - **1**, иначе **0**. В ответ укажите долю дел, которые были аннулированы (**1**; `is_vacated`). Ответ округлите до двух знаков.



---

## **Задание 11**

Укажите шкалу измерения признака `is_vacated`. Выберите один верный вариант ответа:
- количественный непрерывный
- количественный дискретный
- категориальный номинальный
- категориальный номинальный бинарный
- категориальный порядковый

---

## **Задание 12**

В признаке `docket` номер дела зашифрон следующим образом: **XX-YYY**, где **XX** - год когда дело было передано в Верховный суд (всегда два символа), YYY - номер дела в этом году. Например: docket 18-956. Дело передано в суд в 2018 году, оно было зарегестировано 965м.

На основе признака `docket` создайте два новых признака : `docket_year` и `docket_num`.

Признак `docket_year`:
- если **XX** от 00 до 20, вернуть **20XX**
- если **XX** от 69 до 99, вернуть **19XX**

Признак `docket_num`, должен содержать номер дела в году (**YYY**).
| `docket`	|  `docket_year`	|  `docket_num` |
| ------- | ------- | ------- |
| 70-18	 |   1970	 |   18 | 
| 99-1234	 |   1999	 |   1234 | 
| 18-956	 |   2018 |   956 | 
| 00-1	 |   2000	 |   1 | 

Среди дел, которые переданы в суд в 2019 году (`docket_year`) найдите дело, которое было зарегестировано последним (`docket_num`). В ответ укажите, кто был истцом по этому делу (`first_party`).

---