# RPN分类回归目标

RPN前景、背景正负样本的采样与训练数据的generator


In [1]:
import numpy as np
import tensorflow as tf
sess = tf.Session()

  from ._conv import register_converters as _register_converters


In [2]:
# 之前写的2维tensor的去除padding的操作
def padding_remove_tf(padding_tf):
    pad_tag = padding_tf[..., -1]
    start_pad = tf.where(tf.equal(pad_tag,0))[0][0]
    end_pad = tf.where(tf.equal(pad_tag,0))[-1][0]
    return padding_tf[start_pad:end_pad+1,:-1]

In [3]:
# 之前写的IOU的计算过程
def iou_tf(boxes_a, boxes_b):
    # numpy转tensor
#     boxes_a = tf.constant(boxes_a, dtype=tf.float32)
#     boxes_b = tf.constant(boxes_b, dtype=tf.float32)
    # 扩围
    boxes_a = tf.expand_dims(boxes_a, axis=1)
    boxes_b = tf.expand_dims(boxes_b, axis=0)
    # 两两计算overlap的长与宽，若不相交（负值）则取0
    overlap_h = tf.maximum(0.0, tf.minimum(boxes_a[...,2],boxes_b[...,2])-tf.maximum(boxes_a[...,0],boxes_b[...,0]))
    overlap_w = tf.maximum(0.0, tf.minimum(boxes_a[...,3],boxes_b[...,3])-tf.maximum(boxes_a[...,1],boxes_b[...,1]))
    # 计算交集
    overlap = overlap_h * overlap_w
    # 计算并集
    union = (boxes_a[...,2]-boxes_a[...,0]) * (boxes_a[...,3]-boxes_a[...,1]) + (boxes_b[...,2]-boxes_b[...,0]) * (boxes_b[...,3]-boxes_b[...,1]) - overlap
    # 求交并比
    iou = tf.divide(overlap, union, name='regress_target_iou')
    return iou

In [4]:
# 之前写的回归目标的计算过程
def regress_target_tf(anchors, gt_boxes):
    """
    计算回归目标
    :param anchors: [N,(y1,x1,y2,x2)]
    :param gt_boxes: [N,(y1,x1,y2,x2)]
    :return: [N,(dy, dx, dh, dw)]
    """
    # 高度和宽度
    h = anchors[:, 2] - anchors[:, 0]
    w = anchors[:, 3] - anchors[:, 1]
 
    gt_h = gt_boxes[:, 2] - gt_boxes[:, 0]
    gt_w = gt_boxes[:, 3] - gt_boxes[:, 1]
    # 中心点
    center_y = (anchors[:, 2] + anchors[:, 0]) * 0.5
    center_x = (anchors[:, 3] + anchors[:, 1]) * 0.5
    gt_center_y = (gt_boxes[:, 2] + gt_boxes[:, 0]) * 0.5
    gt_center_x = (gt_boxes[:, 3] + gt_boxes[:, 1]) * 0.5
 
    # 回归目标
    dy = (gt_center_y - center_y) / h
    dx = (gt_center_x - center_x) / w
    dh = tf.log(gt_h / h)
    dw = tf.log(gt_w / w)
 
    target = tf.stack([dy, dx, dh, dw], axis=1)
    target /= tf.constant([0.1, 0.1, 0.2, 0.2])
    # target = tf.where(tf.greater(target, 100.0), 100.0, target)
    return target

In [5]:
# 现在写的random_shuffle()函数，用来随机采样
def shuffle_sample(tensor_list, tensor_size, sample_size):
    sample_indices = tf.random_shuffle(tf.range(tensor_size))[:sample_size]
    return [tf.gather(tensor, sample_indices) for tensor in tensor_list]

In [6]:
def rpn_targets_graph(gt_boxes, gt_cls, anchors, rpn_train_anchors=None):
    """
    处理单个图像的rpn分类和回归目标
    a)正样本为 IoU>0.7的anchor;负样本为IoU<0.3的anchor; 居中的为中性样本，丢弃
    b)需要保证所有的GT都有anchor对应，即使IoU<0.3；
    c)正负样本比例保持1:1
    :param gt_boxes: GT 边框坐标 [MAX_GT_BOXs, (y1,x1,y2,x2,tag)] ,tag=0 为padding
    :param gt_cls: GT 类别 [MAX_GT_BOXs, 1+1] ;最后一位为tag, tag=0 为padding
    :param anchors: [anchor_num, (y1,x1,y2,x2)]
    :param rpn_train_anchors: 训练样本数(256)
    :return:
    deltas:[rpn_train_anchors,(dy,dx,dh,dw,tag)]：anchors边框回归目标,tag=1 为正样本，tag=0为padding，tag=-1为负样本
    class_ids:[rpn_train_anchors,1+1]: anchors边框分类目标,tag=1 为正样本，tag=0为padding，tag=-1为负样本
    indices:[rpn_train_anchors,(indices,tag)]: anchors的下标索引，tag=1 为正样本，tag=0为padding，tag=-1为负样本
    """
    # 首先对gt做去除padding的处理
    gt_boxes = padding_remove_tf(gt_boxes) # 返回2维
    gt_cls = padding_remove_tf(gt_cls)[...,0] # 返回1维
    
    # 然后两两计算IOU
    iou = iou_tf(gt_boxes, anchors)
    
    # 开始找正样本anchors
    ## 第一类是找到每个gt对应iou值最大的anchor索引indice_1（不管iou的阈值情况）
    gt_iou_argmax = tf.argmax(iou, axis=1)
    positive_gt_indice_1 = tf.range(tf.shape(gt_boxes)[0]) # 所有gt
    positive_anchor_indice_1 = gt_iou_argmax # 与各个gt有最大iou值的anchors作为正样本之一
    
    ## 第二类是找到每个anchor与其对应gt的最大iou值，并比较0.7的阈值情况，得到索引indice_2
    anchor_iou_max = tf.reduce_max(iou, axis=0)
    positive_anchor_indice_2 = tf.where(anchor_iou_max > 0.7, name='A')
    anchor_iou_argmax = tf.argmax(iou, axis=0)
    positive_gt_indice_2 = tf.gather_nd(anchor_iou_argmax, positive_anchor_indice_2)
    
    # 正样本索引的合并
    positive_gt_indice = tf.concat([positive_gt_indice_1, tf.cast(positive_gt_indice_2, dtype=tf.int32)], axis=0, name='B')
    positive_anchor_indice = tf.concat([positive_anchor_indice_1, positive_anchor_indice_2[...,0]], axis=0, name='C')
    
    # 正样本根据rpn_train_anchors参数进行随机采样
    positive_num = tf.minimum(int(rpn_train_anchors * 0.5), int(tf.shape(positive_anchor_indice)[0]))
    ## 正样本索引的随机采样
    positive_gt_indice, positive_anchor_indice = shuffle_sample([positive_gt_indice, positive_anchor_indice],
                                                                tf.shape(positive_anchor_indice)[0], 
                                                                positive_num)
    
    # 开始找负样本anchors
    ## 负样本的确定，这里只需保证与正样本数1：1的关系
    negative_indices = tf.where(anchor_iou_max < 0.3, name='D')
    ## 负样本根据rpn_train_anchors参数进行随机采样
    negative_num = tf.minimum(int(rpn_train_anchors * 0.5), tf.shape(positive_anchor_indice)[0])
    ## 负样本索引的随机采样
    negative_anchor_indices = tf.random_shuffle(negative_indices)[:negative_num] # 直接在所有anchors的indices序列上做负样本indices的shuffle
    
    # 正样本gather
    positive_anchors = tf.gather(anchors, positive_anchor_indice)
    positive_gt_boxes = tf.gather(gt_boxes, positive_gt_indice)
    positive_gt_cls = tf.gather(gt_cls, positive_gt_indice)
    ## 正样本anchors与正样本gt_boxes之间，回归目标deltas的计算
    positive_deltas = regress_target_tf(positive_anchors, positive_gt_boxes)
    
    # 负样本gather
    negative_anchors = tf.gather(anchors, negative_anchor_indices)
    negative_gt_boxes = tf.zeros([negative_num, 4])
    negative_gt_cls = tf.zeros([negative_num])
    negative_deltas = tf.zeros([negative_num, 4])
    
    # 正负样本的最终合并
    deltas = tf.concat([positive_deltas, negative_deltas], axis=0, name='E')
    class_ids = tf.concat([positive_gt_cls, negative_gt_cls], axis=0, name='F')
    indices = tf.concat([positive_anchor_indice, negative_indices[...,0]], axis=0, name='G')
    
#     # indices第2维度增加tag标志位，并将负样本的tag标志改为-1
#     indices = tf_utils.pad_to_fixed_size_with_negative(tf.expand_dims(indices, 1), rpn_train_anchors,
#                                                        negative_num=negative_num)
    
    return deltas, class_ids, indices

上述RPN函数的样例测试：

In [7]:
#===============================参数设置==========================================
# 函数输出测试:1
anchors = tf.constant(np.array([[78,22,253,304],[269,19,360,296]]), dtype=tf.float32)
gt_boxes = tf.constant(np.array([[50,30,200,280,0],[280,10,370,320,0]]), dtype=tf.float32)
gt_cls = tf.constant(np.array([[1,0],[2,0]]), dtype=tf.float32)
rpn_train_anchors = 2
gt_boxes = padding_remove_tf(gt_boxes) # 返回2维
gt_cls = padding_remove_tf(gt_cls)[...,0] # 返回1维
print(gt_boxes.eval(session=sess))
print(gt_cls.eval(session=sess))

[[ 50.  30. 200. 280.]
 [280.  10. 370. 320.]]
[1. 2.]


In [8]:
# 函数输出测试：2
iou = iou_tf(gt_boxes, anchors)
print(iou.eval(session=sess))

[[0.54126    0.        ]
 [0.         0.71606296]]


In [9]:
# 函数输出测试：3
# 找正样本anchors(阈值0.7)
## 第一类是找到每个gt对应iou值最大的anchor索引indice_1（不管iou的阈值情况）
gt_iou_argmax = tf.argmax(iou, axis=1)
positive_gt_indice_1 = tf.range(tf.shape(gt_boxes)[0]) # 所有gt
positive_anchor_indice_1 = gt_iou_argmax # 与各个gt有最大iou值的anchors作为正样本之一

print("GT对应的anchors索引：{}".format(positive_anchor_indice_1.eval(session=sess)))

## 第二类是找到每个anchor与其对应gt的最大iou值，并比较0.7的阈值情况，得到索引indice_2
anchor_iou_max = tf.reduce_max(iou, axis=0)
positive_anchor_indice_2 = tf.where(anchor_iou_max > 0.7, name='A')
anchor_iou_argmax = tf.argmax(iou, axis=0)
positive_gt_indice_2 = tf.gather_nd(anchor_iou_argmax, positive_anchor_indice_2)

print("0.7的阈值条件对应的正anchors索引：{}".format(positive_anchor_indice_2[...,0].eval(session=sess)))

# 正样本索引的合并
positive_gt_indice = tf.concat([positive_gt_indice_1, tf.cast(positive_gt_indice_2, dtype=tf.int32)], axis=0, name='B')
positive_anchor_indice = tf.concat([positive_anchor_indice_1, positive_anchor_indice_2[...,0]], axis=0, name='C')

# 正样本根据rpn_train_anchors参数进行随机采样
positive_num = tf.minimum(int(rpn_train_anchors * 0.5), tf.shape(positive_anchor_indice)[0])
## 正样本索引的随机采样
positive_gt_indice, positive_anchor_indice = shuffle_sample([positive_gt_indice, positive_anchor_indice],
                                                            tf.shape(positive_anchor_indice)[0], 
                                                            positive_num)

GT对应的anchors索引：[0 1]
0.7的阈值条件对应的正anchors索引：[1]


In [10]:
# 函数输出测试：4
# 找负样本anchors(假设负样本阈值条件0.6)
## 负样本的确定，这里只需保证与正样本数1：1的关系
negative_indices = tf.where(anchor_iou_max < 0.6, name='D')
## 负样本根据rpn_train_anchors参数进行随机采样
negative_num = tf.minimum(int(rpn_train_anchors * 0.5), tf.shape(positive_anchor_indice)[0])
## 负样本索引的随机采样
negative_anchor_indices = tf.random_shuffle(negative_indices)[:negative_num] # 直接在所有anchors的indices序列上做负样本indices的shuffle
print("0.6的阈值条件对应的负anchors索引：{}".format(negative_anchor_indices[...,0].eval(session=sess)))

0.6的阈值条件对应的负anchors索引：[0]


In [18]:
# 函数输出测试：5
# 输出函数返回的所有rpn_train_anchors个anchors样本，以及其bbox回归目标、cls回归目标、indices
# 正样本gather
positive_anchors = tf.gather(anchors, positive_anchor_indice)
positive_gt_boxes = tf.gather(gt_boxes, positive_gt_indice)
positive_gt_cls = tf.gather(gt_cls, positive_gt_indice)
## 正样本anchors与正样本gt_boxes之间，回归目标deltas的计算
positive_deltas = regress_target_tf(positive_anchors, positive_gt_boxes)

# 负样本gather
negative_anchors = tf.gather(anchors, negative_anchor_indices)
negative_gt_boxes = tf.zeros([negative_num, 4])
negative_gt_cls = tf.zeros([negative_num])
negative_deltas = tf.zeros([negative_num, 4])

# 正负样本的最终合并
deltas = tf.concat([positive_deltas, negative_deltas], axis=0, name='E')
class_ids = tf.concat([positive_gt_cls, negative_gt_cls], axis=0, name='F')
indices = tf.concat([positive_anchor_indice, negative_indices[...,0]], axis=0, name='G')

print("1个正样本anchor，一个负样本anchor的bbox回归目标：\n{}".format(deltas.eval(session=sess)))
print("1个正样本anchor，一个负样本anchor的cls分类目标（注：负样本类别id为0）：\n{}".format(class_ids.eval(session=sess)))
print("1个正样本anchor，一个负样本anchor的indices顺序：\n{}".format(indices.eval(session=sess)))

1个正样本anchor，一个负样本anchor的bbox回归目标：
[[ 1.1538461   0.27075812 -0.05524918  0.562774  ]
 [ 0.          0.          0.          0.        ]]
1个正样本anchor，一个负样本anchor的cls分类目标（注：负样本类别id为0）：
[2. 0.]
1个正样本anchor，一个负样本anchor的indices顺序：
[1 0]


In [None]:
neg_ti

In [12]:
# 测试样例中一共只有2个anchors，2个GTs

In [None]:
# 问题：
# 1）某个GT的最高IOU值anchor，当该IOU低于负样本的0.3阈值情况的时候，首先被划分为正样本，然后又被分为负样本。等于在正样本、负样本里同时出现。