# Graph matrix subspace checking

In [3]:
import cvxpy as cp
import multiprocessing as mp
from tqdm import tqdm 
from tqdm.contrib.itertools import product
import numpy as np
import os
import datetime

from graph_utils import *

In [155]:
def get_rank_and_nullspace(A):
    
    _, v, d = np.linalg.svd(A)
    # такой выбор толеранса используется в матлабе и в нампае
    # https://numpy.org/doc/stable/reference/generated/numpy.linalg.matrix_rank.html
    tol = v.max() * max(A.shape) * np.finfo(A.dtype).eps
    nnz = (v >= tol).sum()
    
    return nnz, d[nnz:].T

In [169]:
def a_is_subspace_of_b(basis_a, basis_b):
    
    orig_rank, _ = get_rank_and_nullspace(basis_b)
    combined_rank, _ = get_rank_and_nullspace(np.hstack([basis_a, basis_b]))
    
    return orig_rank == combined_rank

In [174]:
def find_chain_starts(basis_set):
    
    # Sort by the dimensionality of subspaces
    basis_set = sorted(basis_set, key=lambda x: x[1])
    chain_starts = [basis_set[0]]
    
    # Go over basis sets and check whether their spaces are subspaces of some of chain_starts spaces
    for i in range(1, len(basis_set)):
        
        not_a_subspace = True
        
        for start in chain_starts:
            if a_is_subspace_of_b(basis_set[i][2], start[2]):
                not_a_subspace = False
                break
        
        if not_a_subspace:
            chain_starts.append(basis_set[i])
    
    return chain_starts

In [187]:
ALL_GRAPHS = get_graphs()

In [182]:
g = ALL_GRAPHS['cell']
I = find_stable_sets(g)
A, var_matr, num_params = build_triple_equalities(I, g.shape[0])

In [189]:
res[1][2]

array([[ 3.43424822e-17],
       [ 2.04124145e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-4.64570195e-16],
       [ 3.65067330e-16],
       [ 2.04124145e-01],
       [ 2.04124145e-01],
       [-3.35257313e-16],
       [ 2.84498524e-16],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [ 2.04124145e-01],
       [ 2.04124145e-01],
       [ 2.04124145e-01],
       [ 2.61567367e-17],
       [-2.11771614e-18],
       [ 3.06186218e-01],
       [-1.02062073e-01],
       [-4.08248290e-01],
       [ 2.04124145e-01],
       [-4.80745420e-17],
       [-7.56333994e-19],
       [ 2.04124145e-01],
       [ 1.40235006e-16],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-3.06186218e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.02062073e-01],
       [-1.66533454e-16],
       [ 1.38777878e-16],
       [ 2.04124145e-01],
       [ 2.0

In [183]:
for name, g in ALL_GRAPHS.items():

    I = find_stable_sets(g)
    A, var_matr, num_params = build_triple_equalities(I, g.shape[0])
    
    basis_set = []
    for i, addA in enumerate(build_variance_equalities_iterator(I, var_matr, num_params, only_nonequivalent=True)):
        res.append([i, *get_rank_and_nullspace(np.array(A + addA[0], dtype=np.float64))])
    
    chain_starts = find_chain_starts(basis_set)
    print(name, len(chain_starts), "dimensions:", ",".join([len(x[2])for x in chain_starts]))

KeyboardInterrupt: 

In [181]:
len(find_chain_starts(res))

1

In [None]:
if not os.path.isdir("graphData"):
    os.mkdir("graphData")

for name, g in ALL_GRAPHS.items():

  I = find_stable_sets(g)
  A, var_matr, num_params = build_triple_equalities(I, g.shape[0])

  B, c = build_inequalities(num_params)

  x = cp.Variable(num_params)
  func = cp.sum(cp.log( c - B@x ))
  
  if not os.path.isdir("graphData/{}".format(name)):
    os.mkdir("graphData/{}".format(name))
    
  # если взять SCS solver, то всё feasable!
  # chunksize кажется особо не влияет на скорость, но влияет на занимаемую память
  # 3 граф обрабатывается быстрее всех
  # !!!! нужно оценить, какой прирост может дать переход на улучшенный алгоритм
  # !!!! запустить у себя на компе не оптимизированную версию - пускай считается, пока оптимизируем

  # два графа опять пустые, зато big_triag пофиксился - оказалось, что он был задан неверно. но эти вроде норм заданы...
  
  # я не задаю нулевую точку - это тоже может влиять на сходимость: в этих солверах нельзя их задать
  
  # SCS всегда выдаёт feasible. Если поставить константную функцию, то ECOS тоже всё считает feasible - 
  # это странно, т.к. по идеи от неё эта штука не должа зависеть. 

  with mp.Pool(processes=os.cpu_count()) as pool:

    for res in tqdm(pool.imap(process, build_variance_equalities_iterator(I, var_matr, num_params, only_nonequivalent=True
                                                                         ), chunksize=1000)):
      if len(res) != 0:
        res[0] = num_params - res[0]
        print("hello there")
        with open("graphData/{}/{}".format(name, str(datetime.datetime.now())), "w+") as outfile:
          outfile.write("\n".join(map(str, res)))