# Detectron

## Region Proposals
we expect the proposals for a dataset to be provided in a pkl file that contains a serialized proposals dictionary with the following entries:

proposals.keys() - ['cfg', 'ids', 'scores', 'boxes']

where

proposals['cfg'] - config used to compute the proposals

proposals['ids][i] - id for the i-th image

proposals['scores'][i] - ndarray (N_i,) containing scores for the proposals in the i-th image

proposals['boxes'][i]  - ndarray (N_i, 4) containing coordinates (x1, y1, x2, y2) for the proposals in the i-th image



# 1. Blobs，Workspace，Tensors

Caffe2 的 Data 是以 blobs 的形式组织的.

blob 即是内存中被命名的 data chunk(数据块).

blobs 一般包含一个 tensor(可以看做是多维数组)，在 Python 中的存在形式是 numpy arrays.

Workspace 存储所有的 blobs. 如下例，展示了将 blobs 送入 workspace (Feed) 以及从 workspace 读取 blobs [Fetch]的方法.

Workspaces 在开始使用时会自动初始化.

In [1]:
from caffe2.python import workspace, model_helper
import numpy as np
# Create random tensor of three dimensions
x = np.random.rand(4, 3, 2)
print(x)
print(x.shape)

workspace.FeedBlob("my_x", x)

x2 = workspace.FetchBlob("my_x")
print(x2)

[[[0.43033336 0.07997708]
  [0.23825377 0.54042483]
  [0.0034584  0.66832894]]

 [[0.80541561 0.53480687]
  [0.66886001 0.25899185]
  [0.34194229 0.22800033]]

 [[0.32670712 0.64598489]
  [0.1278269  0.39553063]
  [0.11457012 0.63205072]]

 [[0.98938501 0.5224455 ]
  [0.34141606 0.41883644]
  [0.45854937 0.15138438]]]
(4, 3, 2)
[[[0.43033336 0.07997708]
  [0.23825377 0.54042483]
  [0.0034584  0.66832894]]

 [[0.80541561 0.53480687]
  [0.66886001 0.25899185]
  [0.34194229 0.22800033]]

 [[0.32670712 0.64598489]
  [0.1278269  0.39553063]
  [0.11457012 0.63205072]]

 [[0.98938501 0.5224455 ]
  [0.34141606 0.41883644]
  [0.45854937 0.15138438]]]


# 2 Nets，Operators

Caffe2 基础的模型抽象是 net.

net 是由 operators 组成的 graph，每一个 operator 根据输入 input blobs 集，而输出一个或多个 output blobs.

以构建简单网络模型为例，其包括以下几种组成：

>    1 个全连接层(FC)；

>    1 个采用 softmax 的 Sigmoid 激活层；

>    1 个 CrossEntropy 层

这里不直接构建 nets，而是借助 model_helpers 来进行 nets 构建； model_helpers 是创建 nets 的 Python 类.

将待创建的网络记为 “my first net”，ModelHelper 会另外创建两个相互关联的 nets：

+ 一个是，参数初始化网络(记 init_net)
+ 一个是，真实训练网络(记 exec_net)

首先，随机生成 data 和label，并作为 blobs 输入到 workspace：


In [3]:
# Create the input data
data = np.random.rand(16, 100).astype(np.float32)

# Create labels for the data as integers [0, 9]
label = (np.random.rand(16) * 10).astype(np.int32)

workspace.FeedBlob("data", data)
workspace.FeedBlob("label", label)

print label

[3 0 0 8 9 4 8 9 3 1 3 5 1 1 6 6]


然后，采用 model_helper 来创建 init_net 和 exec_net；并接着对 model 采用 FC operator 添加全连接层. 这里 FC op 需要先生成一些随机 fills.

生成随机 fills 后，即可将 fc ops 添加到模型，并使用创建的 weights 和 bias blobs，可以根据其名字进行调用.

Caffe2 中，FC op 包括三部分： input blob，weights 和 bias. Weights 和 bias 可以使用 XavierFill 或 ConstantFill初始化，参数包括三部分： [ ] - 空数组；’fc_w/fc_b’ - 名称；shape - shape=[output, input]. 

In [4]:
# Create model using a model helper
m = model_helper.ModelHelper(name="my first net")

# Create random fills
weight = m.param_init_net.XavierFill([], 'fc_w', shape=[10, 100])
bias = m.param_init_net.ConstantFill([], 'fc_b', shape=[10, ])

fc_1 = m.net.FC(["data", "fc_w", "fc_b"], "fc1")
pred = m.net.Sigmoid(fc_1, "pred")
softmax, loss = m.net.SoftmaxWithLoss([pred, "label"], ["softmax", "loss"])

回顾下创建过程：

*        首先，创建内存里的 input data 和 label blobs；实际应用中，从相应的 database 来加载读取.

*        data 和 label blobs 的 first dim=16，即 batchsize=16.

        >基于 ModelHelper 可以进行处理许多 Caffe2 operators，更多细节参考 ModelHelper’s Operator List.

        >然后，通过定义多个 operators 来创建模型：FC, Sigmoid 和 SoftmaxWithLoss.

        >此时，只是定义了 operators 和 model.

        >ModelHelper 创建了两个 nets：
*            m.param_init_net

        > 只运行一次；初始化参数 blobs；
*            m.net 

        > 训练网络.



网络定义保存为 protobuf 结构，可以通过调用 net.Proto() 来查看网络结构.

In [5]:
print(m.net.Proto())

name: "my first net"
op {
  input: "data"
  input: "fc_w"
  input: "fc_b"
  output: "fc1"
  name: ""
  type: "FC"
}
op {
  input: "fc1"
  output: "pred"
  name: ""
  type: "Sigmoid"
}
op {
  input: "pred"
  input: "label"
  output: "softmax"
  output: "loss"
  name: ""
  type: "SoftmaxWithLoss"
}
external_input: "data"
external_input: "fc_w"
external_input: "fc_b"
external_input: "label"



参数初始化化网络：

print(m.param_init_net.Proto())

# 3. Executing

定义好模型训练 operators 后，可以开始训练模型.

首先，运行一次参数初始化网络：

In [7]:
workspace.RunNetOnce(m.param_init_net)

True

然后，创建训练网络：

In [8]:
workspace.CreateNet(m.net)

True

In [12]:
# Run 100 x 10 iterations
for _ in range(100):
    data = np.random.rand(16, 100).astype(np.float32)
    label = (np.random.rand(16) * 10).astype(np.int32)

    workspace.FeedBlob("data", data)
    workspace.FeedBlob("label", label)

    workspace.RunNet(m.name, 10)   # run for 10 times
    
print workspace.FetchBlob("label")

[1 7 5 7 3 9 0 3 4 9 6 3 7 8 4 9]
