SAD是第一个使用SAM直接利用渲染后的深度图提取几何信息的模型。
本月初,Meta推出的一款可以「分割一切」的模型Segment Anything Model (SAM) 已经引起了广泛的关注。今天,我们向大家介绍一款名为「Segment Any RGBD(SAD)」的机器学习模型。与以往所有使用SAM的工具的不同之处在于,SAD读入的图片可以是经过渲染之后的深度图,让SAM直接根据几何信息来分割图像。该项目是由Visual Intelligence Lab@HKUST, HUST, MMLab@NTU, Smiles Lab@XJTU和NUS的同学完成的。如果大家觉得这个项目有意思的话,请大家多多star~
(资料图片仅供参考)
演示程序链接:https://huggingface.co/spaces/jcenaa/Semantic_Segment_AnyRGBD
代码链接:https://github.com/Jun-CEN/SegmentAnyRGBD
人类可以从深度图的可视化中自然地识别物体,所以研究人员首先通过颜色映射函数将深度图([H,W])映射到RGB空间([H,W,3]),然后将渲染的深度图像输入 SAM。
与RGB图像相比,渲染后的深度图像忽略了纹理信息,而侧重于几何信息。
以往基于 SAM 的项目里SAM 的输入图像都是 RGB 图像, 该团队是第一个使用 SAM 直接利用渲染后的深度图提取几何信息的。
下图显示了具有不同颜色图函数的深度图具有不同的 SAM 结果。
模型流程图如下图所示,作者提供了两种选择,包括将 RGB 图像或渲染的深度图像输入到 SAM进行分割,在每种模式下,用户都可以获得Semantic Mask(一种颜色代表一个类别)和带有类别的 SAM Mask。
以输入为深度图为例子进行说明。首先通过颜色映射函数将深度图([H,W])映射到RGB空间([H,W,3]),然后将渲染后的深度图送入SAM进行分割。
同时使用OVSeg对RGB图进行zero-shot语义分割,只需要输入一系列候选类别的名称即可完成类别识别。然后每一个SAM的mask的类别会根据当前mask里面的点的语义分割结果进行投票,选择点数最多的类别当成当前mask的类别。
最终输出可视化有两种形式,一种是Semantic mask,即一种颜色对应一种类别;另一种是SAM mask with classes,即输出的mask仍然是SAM的mask,并且每一个mask都有类别。并且可以根据深度图将2D的结果投影到3D space进行可视化。
作者将RGB送入SAM进行分割与将渲染后的深度图送入SAM进行分割进行了对比。
RGB图像主要表示纹理信息,而深度图像包含几何信息,因此RGB图像比渲染的深度图像色彩更丰富。在这种情况下,SAM 为 RGB 输入提供的掩码比深度输入多得多,如下图所示。渲染的深度图像减轻了 SAM 的过分割。例如,桌子在RGB图像上被分割成四个部分,其中一个在语义结果中被分类为椅子(下图中的黄色圆圈)。相比之下,桌子在深度图像上被视为一个整体对象并被正确分类。人的头部的一部分在RGB图像上被分类为墙壁(下图中的蓝色圆圈),但在深度图像上却被很好地分类。距离很近的两个物体在深度图上可能被分割为一个物体,比如红圈中的椅子。在这种情况下,RGB 图像中的纹理信息对于找出对象比较关键。作者表示,希望SAD模型能够带来更多的启发和创新,也期待着反馈和建议。让我们一起探索这个神奇的机器学习世界吧!
标签:
视点!流行性感冒预防知识有哪些 预防流感的4个重要原则
世界看热讯:怎么保存豆腐不烂不坏 豆腐如何保存
世界快看点丨栗子熟了为什么不是黄色的?
天天微动态丨浙江多地发放春节“就地过年”消费券 支持企业稳岗留工
今日精选:天奈科技: 天奈科技关于召开2023年第一次临时股东大会的通知
【环球新要闻】乌鲁木齐今年粮食作物种植面积较去年增幅26.34% 产量增幅27.21%
天天滚动:航民股份(600987)12月26日主力资金净卖出343.75万元
世界观焦点:今日收涨后是什么虽需再观察但是
环球新消息丨“新十条”全面落地实施 九毛九再捐百万抗疫物资
【全球播资讯】“魔法头像”让人欢喜让人忧
【天天快播报】Meta花7.25亿美元摆平剑桥分析丑闻诉讼:创历史最高金额
环球动态:借呗贷款逾期2个月拖欠多久上征信
天天观点:一路走好!知名导演谢晋儿子因新冠去世,其他三个儿女也英年早逝
每日简讯:盗窃300元应判多久
天天速读:中科环保董秘回复:2022年公司主要项目情况
世界今热点:智慧城市板块12月22日跌0.08%,恒锋信息领跌,北向资金增持6.09亿元
世界消息!4.1GW!全球最大海上风电场刷新
全球快播:大兴·星光城推出二期新品
热资讯!广西谋求将边境一线打造成世界一流旅游目的地
环球报道:云南能投董秘回复:截至2022年12月20日,公司合并普通账户和融资融券信用账户持有人数为36,113