Object Detection based on Region Decomposition and Assembly
R-DAD思路
首先将object region分成很多小的区域,然后提取整个region和小区域的信息。然后学习他们之间的语义关系。
如何学习语义关系?
将多区域特征逐步与 region assembly blocks(RAB),相结合
这篇文章的立足点在于提高检测的正确性,作者提到,检测效果受到物体特征的低分辨率影响,造成这种低分辨率的原因常常是遮挡和不准确的proposal。
正因为遮挡物体的存在,所以作者提到了利用object region的全局信息可能不能准确地进行定位和分类,那么问题来了,DCN能不能解决这种问题呢
为了解决上面的问题,作者提出了(1) multi-scale-based region proposal和(2) multi-region-based appearance model来分别提高rpn的准确率以及物体的多区域信息。
multi-scale-based region proposal layer:
利用rpn产生proposals,然后将他们进行多尺度的变换,这样就会得到很多不同尺度的proposals(那么问题来了,这里和直接用不同尺度的rpn有什么区别)。然后选择合适的proposal用于训练和测试
multi-region based appearance learning:
结合全局和局部的特征,道理很简单,局部特征的高响应值对于辨别物体是有效的。与此同时还要学习全局和局部特征之间的语义关系,这是因为遮挡发生时,没被遮挡部分的特征就应该更值得信赖。提出RAB来集成多区域的信息。

occlusions 闭塞
assemble ensemble 集成
discriminability 分辨率