Object Detection based on Region Decomposition and Assembly

R-DAD思路

首先将object region分成很多小的区域，然后提取整个region和小区域的信息。然后学习他们之间的语义关系。

如何学习语义关系？

将多区域特征逐步与 region assembly blocks(RAB),相结合

这篇文章的立足点在于提高检测的正确性，作者提到，检测效果受到物体特征的低分辨率影响，造成这种低分辨率的原因常常是遮挡和不准确的proposal。

正因为遮挡物体的存在，所以作者提到了利用object region的全局信息可能不能准确地进行定位和分类，那么问题来了，DCN能不能解决这种问题呢

为了解决上面的问题，作者提出了(1) multi-scale-based region proposal和(2) multi-region-based appearance model来分别提高rpn的准确率以及物体的多区域信息。

multi-scale-based region proposal layer：

利用rpn产生proposals，然后将他们进行多尺度的变换，这样就会得到很多不同尺度的proposals（那么问题来了，这里和直接用不同尺度的rpn有什么区别）。然后选择合适的proposal用于训练和测试

multi-region based appearance learning:

结合全局和局部的特征，道理很简单，局部特征的高响应值对于辨别物体是有效的。与此同时还要学习全局和局部特征之间的语义关系，这是因为遮挡发生时，没被遮挡部分的特征就应该更值得信赖。提出RAB来集成多区域的信息。

occlusions 闭塞

assemble ensemble 集成

discriminability 分辨率