Refactored core #70

MangaBoba · 2023-11-13T12:54:19Z

New features:

Experiments configuration with single file.
Configuration classes are pydantic models with native serialization, deserialization and validation.
Geometry type can be set to convex and non convex.
Convex-safe and self-intersection-safe mutations. (Significantly reduced postprocessing corrections).
Polygon-level crossover.
Joblib backend for parallel operations execution.
Fast and accurate default polygons generation taking into account the geometry type. Based on polygenerator.
GOLEM optimization features support
- Surrogate and GPComp optimizers
- Adaptive mutations, genetic schemes, etc.
- Tuners
Modular framework structure simplifies code base extension.
Code auto formatting and linting configuration (locally and git action).
SPEA2 and MOEAD can be set as selectors for multi objective tasks. Tournament and roulette selectors can be set for SPEA2 and MOEAD fitnesses.
Sensitivity analysis (SA old core #71)

Minor changes:

Objective evaluates only if structure changed.
Simple mp4 visualization of population.
Migrated to the new core cases:
- single and multi objective synthetic circle,
- COMSOL microfluidic,
- sound waves pressure,
- SWAN breakwaters.
Population can be easily serialized and deserialized from json.
Upd docs API Reference, quickstart guide, tutorials.

serialization, mp4 visualization, GA & SEPA2 on new core. Now fitness evaluates only for changed structures.

…eGA. Update requirements (polygenerator)

* add ci flake config

zsurrogate.py

nicl-nno · 2023-11-13T13:28:44Z

cases/breakwaters/main_arctic.py

+border = shape(border_dict['features'][0]['geometry'])
+water = [i for i in res_list['features'] if i['properties']['type'] =='water']
+water_coord =[p['geometry']['coordinates'] for p in water]
+cargo_piers = [i for i in res_list['features'] if i['properties']['type'] =='cargo_pier']
+passenger_pier = [i for i in res_list['features'] if i['properties']['type'] =='passenger_pier']
+piers = [i for i in res_list['features'] if (i['properties']['type']=='passenger_pier') or (i['properties']['type'] =='cargo_pier')]
+piers_coords = [x[0] for x in [i['geometry']['coordinates'] for i in piers]]
+piers_line = [max(p,key=lambda i: i[1]) for p in piers_coords]
+unique_types = np.unique([i['properties']['type'] for i in res_list['features']])
+allow_water = [i for i in water_coord[0][0] if (i[0]>74.8) and (i[1]<67.942) and (i[1]>67.915)]
+###########
+allow_area = [[74.80,67.92],[74.80,67.94]]+allow_water +[[74.80,67.92]]
+grid_resolution_x = 17  # Number of points on x-axis
+grid_resolution_y = 31  # Number of points on y-axis
+coord_Y = np.linspace(min([p[1] for p in allow_area])*500, max([p[1] for p in allow_area])*500, grid_resolution_y + 1)  # X coordinate for spatial grid
+coord_X = np.linspace(min([p[0] for p in allow_area])*500, max([p[0] for p in allow_area])*500, grid_resolution_x + 1)
+grid = [grid_resolution_x, grid_resolution_y]  # points grid
+fixed_area = None
+targets = [[14,10],[16,10],[18,10]]


Тут напрашивается заварачивание в какую-то функцию, парсящую geojson

Тут напрашивается заварачивание в какую-то функцию, парсящую geojson

Завернул в функцию. Теперь этот main находится в cases/breakwaters/arctic_config/acrtic_config.py.
А функция находится cases/breakwaters/utils.

cases/breakwaters/main_arctic.py

nicl-nno · 2023-11-13T13:32:00Z

gefest/core/utils/parallel_manager.py

+from loguru import logger
+
+
+class BaseParallelDispatcher:


А это из GOLEM-а не взять?

В GOLEM есть класс для параллельных вычислений, но он предназначен только для objective. Тогда как прочие операции вычисляются не параллельно, мутации например.

BaseParallelDispatcher же является утилитой "общего назначения", то есть ее можно применить почти к любой функции. Что собственно и реализовано в CrossoverStrategy и MutationStrategy. Отсюда следует очевидное преимущество в скорости вычислений. На примере multi objective синтетик кейса с кружками: вычисления занимают для GOLEM ≈54 секунды, для GEFEST ≈12 секунд.

Следующий момент - параллельное вычисление objective с физ. симулятором. В большинстве случаев на уровне кода библиотеки это оказывается бессмысленно или даже деструктивно. В частности, COMSOL и SWAN умеют использовать параллельные вычисления и сами, таким образом если сделать это еще и в коде, то не будет никакого прироста производительности. Клеточный симулятор звуковых волн же плохо поддается распараллеливанию в принципе, поскольку он хранит состояние и вычисляется итеративно. Таким образом как есть он не заработает параллельно, а если его подать в GOLEM оптимизатор и задать более 1 ядра, то вычисления и вовсе упадут.

Тогда как прочие операции вычисляются не параллельно, мутации [например]
(https://github.com/aimclub/GOLEM/blob/main/golem/core/optimisers/genetic/operators/mutation.py#L84C69-L84C113).

А вот этот - не то что нужно aimclub/GOLEM#199? Пока ещё не в мастере.

Эта штука явно сделает вычисления GOELM быстрее, но ей будет сложно и менее эффективно заменить BaseParallelDispatcher.
Для начала предлагаемый в aimclub/GOLEM#199 ReproduceWorker это параллелизм на уровне всего пайплайна репродукции, что на мой взгляд ограничивает гибкость и возможность расширения, и возможно будет работать медленнее чем параллелизм на уровне операций/функций.
Далее, одна из основных проблем совместимости GEFEST и GOLEM кроется в постпроцессинге, для которого в пайплайне оптимизации GOLEM нет отдельного шага, поэтому приходится прицеплять его к операциям мутации, кроссовера, и т.д. Теряется опция, например, не запускать постпроцессинг, если полученный индивид уже валиден, или удалось его исправить за меньшее число попыток, чем максимальное. В каждом случае параллельный запуск будет ждать самого долгого воркера. Замечу, что это пожалуй в значительной степени компенсируется за счет того, что сейчас в принципе редко порождаются невалидные индивиды, однако не факт что не появится такой кейс в будущем.
Ну и что касается интеграции ReproduceWorker в GEFEST, то речь пойдет именно об интеграции целиком шага репродукции, что имеет мало смысла, поскольку это тащит за собой все описанные выше недостатки, а так же требует по сути дублировать логику, реализованную в том же EvoGraphOptimizer.

Если рассмотреть проблему интеграции с GOLEM с точки зрения реализации новых алгоритмов, то если я правильно понимаю, их ключевую логику можно вынести в оператор селекции (речь про moead, nsga2, nsga3 и пр.), как это сделано в GOLEM для spea2. Тогда имеет смысл создать feature request на возможность добавлять пользовательские селекторы и просто реализовать нужные операции в GEFEST. Ну или даже контрибутить их сразу в GOLEM.

Таким образом полностью переехать на GOLEM в качестве бекенда эволюционной оптимизации мешает:

Скорость вычислений

Отсутствие постпроцессинга в пайплайне (сейчас решено последовательными вызовами)

Невозможность добавить пользовательские функции селекции
Возможно что-то забыл, но это ключевые пункты.

Ок.

Пока тогда пусть остается так, но создай в GOLEM-е issue по тому, чего не хватает.

Сейчас в aimclub/GOLEM#199 реализован параллелизм на уровне операций.
Также планируется в этот же PR добавить функционал, который позволит составить свою схему подготовки поколения из любых операций, которые будут применяться параллельно в любом порядке и любое количество раз.
Плюсом к тому, решены некоторые важные для голема проблемы с распараллеливанием операций.

Сейчас в aimclub/GOLEM#199 реализован параллелизм на уровне операций.

Не нашел в aimclub/GOLEM@main...parallel-population-processing параллельных вызовов кроме как в кроссовере и в репродукции, для ReproduceWorker, который объединяет собственно все шаги репродукции. Поправьте, если я что-то пропустил.

Также планируется в этот же PR добавить функционал, который позволит составить свою схему подготовки поколения из любых операций, которые будут применяться параллельно в любом порядке и любое количество раз.

Звучит круто. Интерфейсы этой утилиты будут привязаны к интерфейсам GOLEM? Можно будет применить ее для параллельного выполнения кастомных операций на кастомных типах данных?

Небольшое пожелание по конфигурированию: очень хотелось бы иметь возможность раздельно выбрать число потоков, хотя бы для вычисления обжективов и всего остального.

Не нашел в aimclub/GOLEM@main...parallel-population-processing параллельных вызовов

Сделано за один вызов.

Интерфейсы этой утилиты будут привязаны к интерфейсам GOLEM?

Да.

Можно будет применить ее для параллельного выполнения кастомных операций на кастомных типах данных?

Да.

возможность раздельно выбрать число потоков, хотя бы для вычисления обжективов и всего остального.

Если нужно последовательно выполнить несколько операций в многопоток, а потом одну в однопоток - это можно.

gefest/core/viz/struct_vizualizer.py

gefest/tools/estimators/estimator.py

…inor fixes

…refactoring

…ixes

… from existing polygon. Add example for noise_sampler.py and example lightning shaped figure.

.github/workflows/unit-build.yml

MangaBoba · 2023-12-25T13:07:40Z

#71

MangaBoba and others added 30 commits September 8, 2023 00:02

refactoring

7c90cfb

refactored postprocessing

dc45428

add polygon level crossover

6032236

fix parallel execution, fix modules compatibility

c2f9cb0

add: joblib backend, postprocessing-safe mutations, basic logger,

ef74200

serialization, mp4 visualization, GA & SEPA2 on new core. Now fitness evaluates only for changed structures.

add config models, golem tuners interface

eb85f98

add sound_wave + tuner case, minor fixes, requirements fix new core

31f50a5

fix compatibility, add extra in config

df48091

fix np.log10 zero division warning

6e739e2

fix docstring

2ff48ac

fix tuning: search variance, invalid sturcts after tuning

1957f36

add better pop logging

8f15b58

add configurable logs paths

29d6c1f

patch iOpt infinite loop with np.inf fitness

091c12d

fix serialization, add parser

72eb949

patch golem verbose arg

86ac5f6

fix parsing

3c735d6

add normal distrib search space

da4d7bc

minor fix sound simulator

b70f785

fix tuner timeout

34c60e7

simple surrogate case

cd749d3

add surrogate optimizer, fix operations for GOLEM compatibility

9d5868a

Changed SoundFieldFitness in main. Shafle options in optimizer in Bas…

348aa58

…eGA. Update requirements (polygenerator)

add poly_from_point.py and bottom_square.txt

64e08b2

add swan_interface.py and microphone_points.py

56e5c97

fix standard sampler

6e384f0

fix standard sampler

fc38f66

sync

b63a870

sync

3d7aa0a

Refactoring ci (#67)

3eae7c9

* add ci flake config

MangaBoba requested a review from nicl-nno November 13, 2023 13:25

nicl-nno reviewed Nov 13, 2023

View reviewed changes

zsurrogate.py Outdated Show resolved Hide resolved

nicl-nno reviewed Nov 13, 2023

View reviewed changes

cases/breakwaters/main_arctic.py Outdated Show resolved Hide resolved

nicl-nno reviewed Nov 13, 2023

View reviewed changes

gefest/core/viz/struct_vizualizer.py Outdated Show resolved Hide resolved

rm debug samples

2a737eb

SoloWayG reviewed Nov 13, 2023

View reviewed changes

gefest/tools/estimators/estimator.py Show resolved Hide resolved

nicl-nno mentioned this pull request Nov 14, 2023

Parallel population processing aimclub/GOLEM#199

Closed

SoloWayG and others added 15 commits November 14, 2023 18:45

Add Arctice config and ob2_upd with SWAN.exe to breakwaters case

0db6252

Merge remote-tracking branch 'origin/refactoring' into refactoring

bfdc506

Fix flake8 errors

3d34220

add multiobj selectors spea2 & moead, init pop can be set manually, m…

d9c367c

…inor fixes

Merge branch 'refactoring' of https://github.com/aimclub/GEFEST into …

a0ec2d9

…refactoring

fix convex-save-area and polygon crossover bugs

23f364a

upd tutorials

83bf964

fix gefest_ga pipeline bugs, add parallel estimation feature, minor f…

dd78c48

…ixes

add some tests, draft sound parallel cfg, minor bugfixes

cfdc7b0

fix example import

8f9d73b

Add Sampler - noise_sampler.py to reverse generate synthetic geometry…

24d53fa

… from existing polygon. Add example for noise_sampler.py and example lightning shaped figure.

tuner fix, parallel sound, minor fixes

7bf80fc

add ensure seq, jit sound estimator optimisation, minor fixes

17fc0a1

fix test filepath

0af93fd

Create a geojson parser definition from arctic_config.py file.

0f759e9

nicl-nno reviewed Nov 24, 2023

View reviewed changes

.github/workflows/unit-build.yml Outdated Show resolved Hide resolved

nicl-nno approved these changes Nov 24, 2023

View reviewed changes

SoloWayG approved these changes Nov 24, 2023

View reviewed changes

upd docs build py version, fix build action

6f1dcba

MangaBoba merged commit c36d5af into main Nov 24, 2023
5 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Refactored core #70

Refactored core #70

MangaBoba commented Nov 13, 2023 •

edited

Loading

nicl-nno Nov 13, 2023

SoloWayG Nov 24, 2023

nicl-nno Nov 13, 2023

MangaBoba Nov 13, 2023 •

edited

Loading

nicl-nno Nov 13, 2023

MangaBoba Nov 14, 2023

nicl-nno Nov 14, 2023

kasyanovse Nov 14, 2023

MangaBoba Nov 14, 2023

kasyanovse Nov 15, 2023

MangaBoba commented Dec 25, 2023

Refactored core #70

Refactored core #70

Conversation

MangaBoba commented Nov 13, 2023 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

MangaBoba Nov 13, 2023 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

MangaBoba commented Dec 25, 2023

MangaBoba commented Nov 13, 2023 •

edited

Loading

MangaBoba Nov 13, 2023 •

edited

Loading