In [7]:
import tensorflow as tf
import numpy as np

In [61]:
class SearchAreaEnvironment:
    
    def __init__(self, k_values_map, agents_start_positions):
        
        unit_vector_count = 50
        self.KVM = k_values_map #load all the k-values
        self.width = k_values_map.shape[1] #Width of the map
        self.height = k_values_map.shape[0] #height of the map
        self.dKVM = np.zeros((self.height, self.width)) #initialize discovered KVM. 
        self.agents_start_pos = agents_start_positions #save starting positions
        self.agents_pos = agents_start_positions #vector of 1x2 containing information of the position of the agents
        self.agents_count = agents_start_positions.shape[0] #amount of agents
        self.path_matrices = np.array([[[0,0] for _ in range(unit_vector_count)] for _ in range(self.agents_count)]) #path matrices for each agent
        
    def reset(self):
        
        self.dKVM = np.zeros((self.height, self.width)) #the whole map is undiscovered
        self.agents_pos = self.agents_start_pos #set current positions to start positions
        
    def get_pos(self, label_agent):
        
        self.x, self.y = self.agents_pos[label_agent-1] #get current state of any drone
        
        return [self.x, self.y]
    
    def get_k_value(self, label_agent):
        
        p = self.get_pos(label_agent)
        regional_k_value = self.KVM[p[1], p[0]]
        
        return regional_k_value
        
    def get_dKVM(self): #update dKVM
        
        for i in range(self.agents_count):
            
            p = self.agents_pos[i]
            self.dKVM[p[1]][p[0]] = self.KVM[p[1]][p[0]]  #Update dKVM base on the location of every agents
        
    def action_phase(self, new_path_matrices): #get path plan, move agents
        
        self.path_matrices = new_path_matrices
        
        for i in range(self.agents_count): #update position of every agents
            
            pos_update = self.path_matrices[i][0]  #next step move
            current_pos = self.get_pos(i+1) #current position
            new_pos = np.array([pos_update[0] + current_pos[0], pos_update[1] + current_pos[1]]) #sum
            
            self.agents_pos[i] = new_pos #update position
            
    def process_old_path_matrices(self): #for old paths, remove the complete vector, add a new empty vector
        
        processed_path_matrices = []
        
        for agents in self.path_matrices:
            processed_path = list(agents[1:])  # Remove the first element of the second dimension
            processed_path.append([0, 0])  # Add [0, 0] at the end
            processed_path_matrices.append(processed_path)
            
        return np.array(processed_path_matrices)

            
            
            
            
        
        

In [62]:
#test

k_values_map = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])

agents_start_positions = np.array([
    [0, 0],  # Agent 1 starts at position (0, 0)
    [2, 2]   # Agent 2 starts at position (2, 2)
])

new_path_matrices = np.array(
    [[[1, 0], [-1, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]], [[-1, 0], [1, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]]]
)

env = SearchAreaEnvironment(k_values_map, agents_start_positions)
env.reset()
print(env.dKVM)

print()

print(env.agents_pos)

print()

print(env.agents_count)

print()

print(env.path_matrices)

print()

print(env.get_pos(1))
print(env.get_pos(2))
print()

env.get_dKVM()
print(env.dKVM)

env.action_phase(new_path_matrices)

print()

print(env.agents_pos)

print()

env.get_dKVM()
print(env.dKVM)

new_path_matrices = np.array(
    [[[-1, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]], [[1, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]]]
)

env.action_phase(new_path_matrices)

print()

print(env.agents_pos)

print()

env.get_dKVM()
print(env.dKVM)

new_path_matrices = np.array(
    [[[2, 0], [-2, 0], [0, 1], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]], [[-2, 0], [2, 0], [0, -1], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0], [0, 0]]]
)

env.action_phase(new_path_matrices)

print()

print(env.agents_pos)

print()

env.get_dKVM()
print(env.dKVM)

print()

new_path_matrices = env.process_old_path_matrices()
print(new_path_matrices)

env.action_phase(new_path_matrices)

print()

print(env.agents_pos)

print()

env.get_dKVM()
print(env.dKVM)

print()

env.action_phase(env.process_old_path_matrices())

print()

print(env.agents_pos)

print()

env.get_dKVM()
print(env.dKVM)

print()

print(env.get_k_value(2))


[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]

[[0 0]
 [2 2]]

2

[[[0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]]

 [[0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]
  [0 0]]]

[0, 0]
[2, 2]

[[1. 0. 0.]
 [0. 0. 0.]
 [0. 0. 9.]]

[[1 0]
 [1 2]]

[[1. 2. 0.]
 [0. 0. 0.]
 [0. 8. 9.]]

[[0 0]
 [2 2]]

[[1. 2. 0.]
 [0