Add topofeatures #1241

valer1435 · 2023-12-28T11:27:44Z

TopologicalFeaturesImplementation was added

pep8speaks · 2023-12-28T11:27:58Z

Hello @valer1435! Thanks for updating this PR. We checked the lines you've touched for PEP 8 issues, and found:

In the file fedot/api/api_utils/assumptions/task_assumptions.py:

Line 58:21: E131 continuation line unaligned for hanging indent

Comment last updated at 2023-12-28 11:36:56 UTC

codecov · 2023-12-28T12:06:27Z

Codecov Report

Attention: 62 lines in your changes are missing coverage. Please review.

Comparison is base (dcc7ff5) 79.97% compared to head (96c4f95) 80.05%.

Files	Patch %	Lines
...tations/data_operations/topological/point_cloud.py	46.29%	29 Missing ⚠️
...tions/data_operations/topological/hankel_matrix.py	63.88%	26 Missing ⚠️
...tations/data_operations/topological/topological.py	97.60%	4 Missing ⚠️
fedot/api/fedot_cli.py	0.00%	1 Missing ⚠️
fedot/core/data/data.py	0.00%	1 Missing ⚠️
...ion_intervals/solvers/mutation_of_best_pipeline.py	0.00%	1 Missing ⚠️

Additional details and impacted files

@@            Coverage Diff             @@
##           master    #1241      +/-   ##
==========================================
+ Coverage   79.97%   80.05%   +0.07%     
==========================================
  Files         145      149       +4     
  Lines        9945    10278     +333     
==========================================
+ Hits         7954     8228     +274     
- Misses       1991     2050      +59

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

kasyanovse

До конца не досмотрел. Давай сначала найденные моменты уточним.
Вообще, кажется, что местами итерирование по спискам можно заменить на работу с np.ndarray, что значительно ускорит топологические признаки.
И смущает полное отсутствие тестов для всех новых объектов. Мне кажется, что нужно покрыть все объекты и основные методы.

kasyanovse · 2023-12-28T12:22:13Z

fedot/core/operations/evaluation/common_preprocessing.py

@@ -44,7 +46,8 @@ class FedotPreprocessingStrategy(EvaluationStrategy):
        'poly_features': PolyFeaturesImplementation,
        'one_hot_encoding': OneHotEncodingImplementation,
        'label_encoding': LabelEncodingImplementation,
-        'fast_ica': FastICAImplementation
+        'fast_ica': FastICAImplementation,
+        'topological_features': TopologicalFeaturesImplementation


Почему в препроцессинге? Что на выходе модели?

Вход табличка (лаг таблица), на выходе таблица (в теории можно запустить и для табличных данных, но думаю пока нецелесообразно)

kasyanovse · 2023-12-28T12:23:04Z

...operations/evaluation/operation_implementations/data_operations/topological/hankel_matrix.py

+from scipy.linalg import hankel
+
+
+class HankelMatrix:


А в чем глобальная разница между этим классом и LaggedImplementation?

На самом деле ни в чем) Не было времени реализовать с момощью нашего лаг преобразования

kasyanovse · 2023-12-28T12:24:51Z

...e/operations/evaluation/operation_implementations/data_operations/topological/point_cloud.py

+
+    @staticmethod
+    def __create_epsilon_range(epsilon):
+        return np.array([y * float(1 / epsilon) for y in range(epsilon)])


Зачем float? Почему не np.arange(epsilon) / epsilon?

kasyanovse · 2023-12-28T12:26:53Z

...e/operations/evaluation/operation_implementations/data_operations/topological/point_cloud.py

+        if self.__window_length is None:
+            self.__window_length = dimension_embed


Свойства с двумя подчеркиваниями нельзя посмотреть извне класса, что при отладке бывает очень неудобно.

kasyanovse · 2023-12-28T12:36:42Z

...e/operations/evaluation/operation_implementations/data_operations/topological/point_cloud.py

+        diagrams = [np.array([dg for dg in diag if np.isfinite(dg).all()]) for diag in diagrams]
+        diagrams = diagrams / max(
+            [np.array([dg for dg in diag if np.isfinite(dg).all()]).max() for diag in diagrams if diag.shape[0] > 0])


Можно переписать быстрее, без повторных вычислений одного и того же.

Это скорее всего что-то старое и неиспользуемое) Удалил

kasyanovse · 2023-12-28T12:56:04Z