## Colab features you might need

### How to save notebooks

Use menu "File" to initiate saving

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/save_menu.png)

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/lp.png)

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/login_if_needed.png)

1. Check the repository name "kauMLstudent/ml_problems"
2. Check the branch name "master"
3. Choose some filename. Watch filenames not to overlap! Since there is one account for all,please be careful not to destroy someone else's results.
4. Give a meaningful name to commit, this may help to find it in future.

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/commit.png)

### How to download and upload

Use the side panel to upload data to colab if needed

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/upload.png)

Use the side panel and right-click menu to download data from colab if needed

![](https://raw.githubusercontent.com/kauMLstudent/ml_problems/master/img/download.png)

### How to archive files

Textual data may be overwhelming in size.
Consider using archives for download-upload.

1. Use 
```python
!7z e filename.7z
```
to extract files.
2. Use 
```python
!7z a archive_name.7z file_name
```
to add files to archive

## Datasets I have slightly processed

### Load data, year 2016

All data was taken from [Регіональні дані ЗНО-2016](https://zno.testportal.com.ua/stat/2016).
See links to 7z archive there if you want to donload data from the original source.

In [0]:
!curl -O https://raw.githubusercontent.com/fbeilstein/machine_learning/master/datasets/zno_2016.7z
!7z e zno_2016.7z

Column name| Explanation (from zno site)
---|---
OutID|  	ID
Birth|	Рік народження
SexTypeName| 	Стать
Regname| 	Регіон реєстрації/проживання учасника
AreaName| 	Район\Місто реєстрації/проживання учасника
TerName| 	Населений пункт реєстрації/проживання учасника
RegTypeName|	Статус учасника
EOName| 	Навчальний заклад учасника
EOTypeName| 	Тип навчального закладу
EORegName| 	Регіон, де розташований навчальний заклад
EOAreaName| 	Район\Місто, де розташований навчальний заклад
EOTerName|	Населений пункт, де розташований навчальний заклад
EOParent|	Орган, якому підпорядкувується навчальний заклад

**Names of columns corresponding to subjects are generated as PREFIX+column name.**

Use tables below for reference.

Prefixed column name | Explanation
---|---
**PREFIX**Test|	Назва навчального предмета
**PREFIX**Lang|	Мова складання тесту
**PREFIX**TestStatus|	Результат складання тесту
**PREFIX**Ball100|	Оцінка за шкалою 100-200
**PREFIX**Ball12|	Оцінка за ДПА
**PREFIX**PTName|	Пункт проведення ЗНО
**PREFIX**PTRegName|	Регіон, де розташований пункт проведення ЗНО
**PREFIX**PTAreaName|	Район\Місто, де розташований пункт проведення ЗНО
**PREFIX**PTTerName|	Населений пункт, де розташований пункт проведення ЗНО

PREFIX | Subject
---|---
Ukr|	Українська мова і література
Hist|	Історія України
Math|	Математика
Phys|	Фізика
Chem|	Хімія
Bio|	Біологія
Geo|	Географія
Eng|	Англійська мова
Fr|	Французька мова
Deu|	Німецька мова
Sp|	Іспанська мова
Rus|	Російська мова

### Load data, year 2017

All data was taken from [Регіональні дані ЗНО-2017](https://zno.testportal.com.ua/stat/2017).
See links to 7z archive there if you want to donload data from the original source.

In [0]:
!curl -O https://raw.githubusercontent.com/fbeilstein/machine_learning/master/datasets/zno_2017.7z
!7z e zno_2017.7z

Column name| Explanation (from zno site)
---|---
OUTID|  	ID
BIRTH|	Рік народження
SEXTYPENAME| 	Стать
REGNAME| 	Регіон реєстрації/проживання учасника
AREANAME| 	Район\Місто реєстрації/проживання учасника
TERNAME| 	Населений пункт реєстрації/проживання учасника
REGTYPENAME|	Статус учасника
TERTYPENAME|	Тип території
CLASSPROFILENAME|	Профіль навчання учасника
CLASSREGNAME|	Мова навчання  учасника
EONAME| 	Навчальний заклад учасника
EOTYPENAME| 	Тип навчального закладу
EOREGNAME| 	Регіон, де розташований навчальний заклад
EOAREANAME| 	Район\Місто, де розташований навчальний заклад
EOTERNAME|	Населений пункт, де розташований навчальний заклад
EOPARENT|	Орган, якому підпорядкувується навчальний заклад

**Names of columns corresponding to subjects are generated as PREFIX+column name.**

Use tables below for reference.
Note: not all subjects may have LANG.

Prefixed column name | Explanation
---|---
**PREFIX**TEST|	Назва навчального предмета
**PREFIX**LANG|	Мова складання тесту
**PREFIX**TESTSTATUS|	Результат складання тесту
**PREFIX**BALL100|	Оцінка за шкалою 100-200
**PREFIX**BALL12|	Оцінка за ДПА
**PREFIX**PTNAME|	Пункт проведення ЗНО
**PREFIX**PTREGNAME|	Регіон, де розташований пункт проведення ЗНО
**PREFIX**PTAREANAME|	Район\Місто, де розташований пункт проведення ЗНО
**PREFIX**PTTERNAME|	Населений пункт, де розташований пункт проведення ЗНО

PREFIX | Subject
---|---
UKR|	Українська мова і література
HIST|	Історія України
MATH|	Математика
PHYS|	Фізика
CHEM|	Хімія
BIO|	Біологія
GEO|	Географія
ENG|	Англійська мова
FR|	Французька мова
DEU|	Німецька мова
SP|	Іспанська мова
RUS|	Російська МОВА

### Load data, year 2018

All data was taken from [Регіональні дані ЗНО-2018](https://zno.testportal.com.ua/stat/2018).
See links to 7z archive there if you want to donload data from the original source.

In [0]:
!curl -O https://raw.githubusercontent.com/fbeilstein/machine_learning/master/datasets/zno_2018.7z
!7z e zno_2018.7z

Column name| Explanation (from zno site)
---|---
OutID|  	ID
Birth|	Рік народження
SexTypeName| 	Стать
Regname| 	Регіон реєстрації/проживання учасника
AreaName| 	Район/Місто реєстрації/проживання учасника
TerName| 	Населений пункт реєстрації/проживання учасника
RegTypeName|	Статус учасника
TerTypeName|	Тип території
ClassProfileName|	Профіль навчання учасника
ClassRegName|	Мова навчання  учасника
EOName| 	Заклад освіти учасника
EOTypeName| 	Тип закладу освіти 
EORegName| 	Регіон, де розташований заклад освіти 
EOAreaName| 	Район/Місто, де розташований заклад освіти 
EOTerName|	Населений пункт, де розташований заклад освіти 
EOParent|	Орган, якому підпорядковується Заклад освіти 

**Names of columns corresponding to subjects are generated as PREFIX+column name.**

Use tables below for reference.
Note: not all subjects may have DPALevel.

Prefixed column name | Explanation
---|---
**PREFIX**Test|	Назва навчального предмета
**PREFIX**Lang|	Мова складання тесту
**PREFIX**TestStatus|	Результат складання тесту
**PREFIX**DPALevel|	Рівень складності завдань ДПА
**PREFIX**Ball100|	Оцінка за шкалою 100-200
**PREFIX**Ball12|	Оцінка за ДПА
**PREFIX**Ball|	Тестовий бал
**PREFIX**PTName|	Пункт проведення ЗНО
**PREFIX**PTRegName|	Регіон, де розташований пункт проведення ЗНО
**PREFIX**PTAreaName|	Район\Місто, де розташований пункт проведення ЗНО
**PREFIX**PTTerName|	Населений пункт, де розташований пункт проведення ЗНО

PREFIX | Subject
---|---
Ukr|	Українська мова і література
Hist|	Історія України
Math|	Математика
Phys|	Фізика
Chem|	Хімія
Bio|	Біологія
Geo|	Географія
Eng|	Англійська мова
Fr|	Французька мова
Deu|	Німецька мова
Sp|	Іспанська мова

### Load data, year 2019

All data was taken from [Регіональні дані ЗНО-2019](https://zno.testportal.com.ua/stat/2019).
See links to 7z archive there if you want to donload data from the original source.

In [0]:
!curl -O https://raw.githubusercontent.com/fbeilstein/machine_learning/master/datasets/zno_2019.7z
!7z e zno_2019.7z

Column name| Explanation (from zno site)
---|---
OutID|  	ID
Birth|	Рік народження
SexTypeName| 	Стать
Regname| 	Регіон реєстрації/проживання учасника
AreaName| 	Район/Місто реєстрації/проживання учасника
TerName| 	Населений пункт реєстрації/проживання учасника
RegTypeName|	Статус учасника
TerTypeName|	Тип території
ClassProfileName|	Профіль навчання учасника/ОКР, який учасник здобуває
ClassLangName|	Мова навчання  учасника
EOName| 	Заклад освіти учасника
EOTypeName| 	Тип закладу освіти 
EORegName| 	Регіон, де розташований заклад освіти 
EOAreaName| 	Район/Місто, де розташований заклад освіти 
EOTerName|	Населений пункт, де розташований заклад освіти 
EOParent|	Орган, якому підпорядковується заклад освіти

**Column "UkrAdaptScale" contains information whether adaptation is needed.**

UkrAdaptScale|	Установлення адаптивного порога
---|---
0|	не потребує
3|	потребує (угорська мова навчання)
4|	потребує (молдовська мова навчання)
7|	потребує (румунська мова навчання)

**Names of columns corresponding to subjects are generated as PREFIX+column name.**

Use tables below for reference.
Note: not all subjects may have DPALevel.

Prefixed column name | Explanation
---|---
**PREFIX**Test|	Назва навчального предмета
**PREFIX**Lang|	Мова складання тесту
**PREFIX**TestStatus|	Результат складання тесту
**PREFIX**DPALevel|	Рівень складності завдань ДПА
**PREFIX**Ball100|	Оцінка за шкалою 100-200
**PREFIX**Ball12|	Оцінка за ДПА
**PREFIX**Ball|	Тестовий бал
**PREFIX**PTName|	Пункт проведення ЗНО
**PREFIX**PTRegName|	Регіон, де розташований пункт проведення ЗНО
**PREFIX**PTAreaName|	Район\Місто, де розташований пункт проведення ЗНО
**PREFIX**PTTerName|	Населений пункт, де розташований пункт проведення ЗНО

**PREFIX** | Subject
---|---
Ukr|	Українська мова і література
Hist|	Історія України
Math|	Математика
Phys|	Фізика
Chem|	Хімія
Bio|	Біологія
Geo|	Географія
Eng|	Англійська мова
Fr|	Французька мова
Deu|	Німецька мова
Sp|	Іспанська мова