# Отчет

Василиадис Янис ИПОВС-12

**Цель работы**

Найти оптимальное расположение скважин для максимизации добычи нефти

**Описание задачи**

Для добычи нефти требуется проводить бурение эксплуатационных скважин.
Целью задачи построения оптимальной системы разработки является
определение положения скважин для максимизации NPV.
При дальнейшем моделировании издержки на бурение и ввод в эксплуатацию
скважин, текущие и налоговые издержки не учитываем.
В результате, главным является максимизировать итоговую добычу.


**Используемые технологии**

* Kotlin
* TornadoFX
* Лень
* Мозг

**Железо**
* i3-3120M 2.50GHz x 2(4)
* DDR3-1600 12GB
* SSD Samsung 850 EVO

**План**

* Теоретическая часть

* Описание реализации оптимизационных алгоритмов

* Тестирование отдельных элементов кода

* Тестирование на реальных данных

## Теоретическая часть + Описание реализации оптимизационных алгоритмов

Решение задачи было разделено на следующие составляющие:

1. Модуль для работы с файлами
2. Подсчет площади 
3. Оптимизация 
4. Интерфейс
5. График

### Модуль работы с файлами

Считывание больших файлов и преобразование их в необходимый формат(объект) является важной задачей, так как размеры файлов могут доходить до ~1G для поля 10 000 000 X 10 000 000, к примеру. Основной проблемой стала скорость считывания. Если использовать такую функцию преоьзраваония строки в массив по пробелу, то считывание файла в ~500MB происходит около 2-3 минут. Воспользовавших информацией о размерности входных данных (см. формат файла), было принято решение читать "окном" по целым строкам с распаралеливанием парсинга этих строк. В этом случае считывание происходит за ~8-10 сек. 

Код который производит считывание даных ячеек и преобразовывает их в массив обьектов `IndexFloat`. Последний представляет собой число `Float` и ссылку на список:

`
class IndexFloat(var value: Float) {
    var subMap: BooleanArray = booleanArrayOf()
}
`

`
val arrayData = data[3]
        .split(" ")
        .map { IndexFloat(it.toDouble()) }
        .windowed(sizeX, sizeY)
        .toCollection(ArrayList(sizeX * sizeY))
`


Так же для удобства считанные файлы сериализовались (объект языка сохраняется в последовательность байтов), для того, что бы при следующем запуске программы, если карта не изменилась, можно было бы без парсинга сразу считать объект карты. В среднем считывание обьекта происходит за ~1 сек.




## Подсчет площади

Задача подсчета площади усложняется тем, что необходимо было учитывать пересечения областей (окружностей) вышек, а так как таких пересечений может быть N, это исключает аналитический способ подсчета. Из рассмотренных алгоритмов: Quadtree Approximation, Monte Carlo Estimation, An Exact Solution [(подробнее)](https://www.benfrederickson.com/calculating-the-intersection-of-3-or-more-circles/). Первые два способа крайне точны, но очень затратны, последний сложен в написании. Так как сроки были сжаты и высокая точность не была нужна, было принято решение использовать следующий лагоритм (самописное кривое нечто):

Имеющияся данные:

* Список окружностей
* Карта (сетка с коэфицентами в каждой ячейке)

Класс окружности содержит в себе координаты и поле для хранения площади.


`
class MyCircleData {
    var x: Float = 0f
    var y: Float = 0f
    var r: Float = 0f
    var calculatedArea: Double = 0.0
}
`

1. берем первую окружность
2. вычисляем границы окружности (описывающий квадрат)
3. ходим по полученному квадрату и выполняем следующие действия
    1. вычисляем расстояние от всех вершин квадрата до центра окружности и сравниваем с радиусом, если окружность пересекает ячейку, то продолжаем работу дальше, если нет, то берем следующую ячейку.
    2. выполняем проверку на то, что текущая ячейка вся пренадлежит одной окружности, если так, то вычисляем ее площадь и идем дальше, если нет то выполняем следующие шаги:
        1. разбиваем текущую ячейку на более мелкую сетку, размером 1х1
        2. итерируемся по этому разбиению и вычисляем расстояние от левого верхнего угла квадратика до центра всех окружностей, если квадратик пренадлежит окружности, то вычисляется количество окружностей, коэфицент ячейки делится на это число и прибавляется всем пересикающим окружностям в `calculatedArea`.

Так же для ускорения подсчета, было выполнено распаралеливание подсчетов. Оно получилось тривиальное, так как всего на 4 потока (которые соотв. 4-м ядрам процессора на моей машине). Распаралеливание было выполнено по карте, каждое ядро считало свою четверть карты. Вычисляются те окружности которые находятся в каждой четверти. Если какая-та окружность пересекает границы четвертей, то поток четверти будет считать площадь лишь до своей границы. Также для избежания пересчитывания некоторых клеток по несколько раз, в ячейке есть флаг `used`.




## Оптимизация

С оптимизацией не все так гладко. В ней нужно было учитывать пересечения окружностей, значения карты и многое другое. Из-за кротких сроков и лени был выбран следующий `странный` алгоритм собственного производства. 

1. вычисляем средний радиус окружности в последней стадии (после увеличения на PORO M раз)
2. масштабируем(сглаживаем) сетку по этому радиусу, выбирая среднее значение коэфицента
3. сортируем клетки по убыванию коэфицента
4. сортируем окружности по радиусу
5. самые большие окружности ставим в лучшие места (в среднем радиус окружности имел небольшую дисперсию)

Исключения и важные моменты:

1. если окружностей больше чем размерность новой сетки, то делается сдвиг на пол сетки и окружности ставятся в свободные места между другими окружностями
2. размерность новой ячейки сетки, выбирается следующим образом:
    1. вычисляется средний радиус
    2. вычисляются делители текущей сетки
    3. берется ближайший делитель к среднему радиусу снизу
    
К примеру, размерность сетки 100x100, средний радиус ~6m, значит сетка будет со стороной ячейки в 5m. 

У разработанной стратегии оптимизации полно минусов, единственный ее плюс, это скорость. Так же на выбор стратегии повлиял вид карт в тестовых наборах. Карты были довольно зашумлены и хорошо распределены. В среднем при сглаживании получилась бы очень гладкая плоскость.

## Интерфейс

Интерфейс был написан на JavaFX c использованием TornadoFX так как основной язык программы - Kotlin.

Скрин:

![image.png](attachment:image.png)

Комментарии, думаю, излишни, интерфейс очень простой.

## График (карта)

Над графиком карты особо не замарачивался, так как не было времени.

![image.png](attachment:image.png)

## Тестирование отдельных частей кода

В основном тестирование производилось над подсчетом площади и в меньшей степени над оптимизацией. Подсчет площади тестировался с помощью единичной карты и аналитического вычисления пересечений.

Были проведены следующие тесты, для модуля подсчета площадей окружностей:

* подсчет одной окружности без пересечений
* подсчет N окружностей друг на друге (окружности с одинаковыми параметрами)
* пересечение 2-х окружностей (проверка аналитически)
* пересечение 3-х окружностей (проверка аналитически)
* нагрузочное тестирование, порядка 10 000 окружностей
* тестирование на переполнение памяти и переменных для подсчета

Для тестирования модуля оптимизации были выполнены следующие тесты:

* использование карт с точечными значениями >0 для проверки на исключительные ситуации
* тест на большое количество окружностей
* тест на большой разброс радиусов
* тест на разряженную карту
* тест на гладкую карту

и многое другое.

Не все тесты, особенно в оптимизации, были пройдены хорошо, по некоторым критериям, но вполне удовлетворительно.

## Тестирование на реальных данных

Для примера будет взята карта предоставленная для тестирования на 3-м этапе.
Параметры карты:

300 300

100 100


Запуск с 20-ю окружностями размером в 1500m и 10 раундов.

Параметр PORO был взят из примера ~1.45m.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

Результат: 4.833125901991821E9

Использовано памяти: ~250MB

Время: 102 sec