博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
mask rcnn和roi-align
阅读量:6211 次
发布时间:2019-06-21

本文共 749 字,大约阅读时间需要 2 分钟。

faster-rcnn的github源码中是round四舍五入

但kaiming he的ppt是直接取整

 

 

 

 

1.讲roi-align和roi-pooling区别并且详细阐述roi-align过程的博客:http://blog.leanote.com/post/afanti/b5f4f526490b,此博主还有另外一篇在rfcn中

使用roi-align的博客:http://blog.leanote.com/post/afanti/Position-Sensitive

2.具体讲解roi-align的计算方式,并且有整个网络的结构图,几个链接也有一些slide,这个博主的文章值得关注:http://blog.csdn.net/u013010889/article/details/78588227

3.Mask RCNN中的RoiAlign源码(caffe2)解读: http://blog.csdn.net/yiyouxian/article/details/79221830

 

roi-align总结:对于每个roi,映射之后坐标保持浮点数,在此基础上再平均切分成k*k个bin,这个时候也保持浮点数。再把每个bin平均分成4个小的空间,然后计算每个小空间的中心点的像素点对应的概率值。这个像素点大概率是一个浮点数,实际上图像的浮点是没有像素值的,但这里假设这个浮点数的位置存储一个概率值,这个值由相邻最近的整数像素点存储的概率值经过双线性插值得到,其实也就是根据这个中心点所在的像素值找到所在的小空间对应的4个整数像素存储的值,然后乘以多个参数进行插值。这些参数其实就是那4个整数像素点和中心点的位置距离关系构成参数。最后再在每个bin中对4个中心点进行max或者mean的pooling。

你可能感兴趣的文章
Centos安装Consul微服务
查看>>
Ubuntu16下Hadoop安装
查看>>
写个自动安装JDK的shell脚本
查看>>
Cocos Creator 初探:修改Engine来调整FPS信息显示
查看>>
2015.4.16-SQL-内连接与外连接
查看>>
Java实现几种常见排序方法
查看>>
win7(windows 7)系统下安装SQL2005(SQL Server 2005)图文教程
查看>>
Android屏幕底部弹出DialogFragment(3)
查看>>
.Net主线程扑捉子线程中的异常
查看>>
图解SQL的inner join、left join、right join、full outer join、union、union all的区别
查看>>
VBA 打开excel
查看>>
leetcode之Remove Duplicates from Sorted List II
查看>>
JSP去空白行
查看>>
【216】◀▶ IDL 字符串操作说明 (黑底)
查看>>
【326】PIL 截图及图片识别
查看>>
jquery中odd和even选择器的用法说明
查看>>
axios 拦截 , 页面跳转, token 验证
查看>>
Windows XP硬盘安装Ubuntu 12.04双系统图文详解
查看>>
Last Position of Target
查看>>
和我一起来学iOS(一)ObjectC的语法
查看>>