[ 论文][半监督分割]一致性损失

ByteCosmicCipher
• 阅读 1693

Semi-Supervised Semantic Segmentation with Cross-Consistency Training

论文地址:原文

领域基本现状

现存的半监督学习方法分为:

  • 一致性训练
  • pseudo 标签
  • entropy minimization
  • bootstrapping
  • generative modeling

上述大多数方法用于图像分类领域,在语义分割领域大都使用对无标签数据产生pseudo 标签,将带pseudo 标签的数据和少量pixel-levellabel的图片一起训练

论文创新点

  1. 研究了多种扰动方法,并在此基础上提出了对于半监督语义分割的交叉一致性训练方法(cross-consistency training (CCT))
  2. 将此方法拓展到弱标签的数据

网络结构(训练方法)

基本过程

    • 少量有标签的(pixel-level labeled)数据和大量无标签的(unlabeled)数据
      [ 论文][半监督分割]一致性损失

整个网络大致分为上下两个分支,共包含一个encoder, 一个main decoder和 K 个辅助decoder。
有标签的(pixel-level labeled)数据由上分支处理,无标签的数据由上下两个分支共同处理。

对于有标签的数据 \( X^l \), 按照常规方法,通过encoder和main decoder得到分割结果,并和标签 \(y\)对比,使用交叉熵函数计算监督损失 \(L_s\)
[ 论文][半监督分割]一致性损失

对于大量无标签的(unlabeled)数据,图片 \( x^u \) 经过和上分支共享的encoder得到 \( z \)
和main decoder,得到“参照”(main decoder的输出)。同时 \( z \) 分别经过K个扰动并进入对应的辅助decoder中,得到K个输出,这K个输出分别和main decoder的输出对比,并使用均方误差函数计算无监督损失 \(L_u \)
[ 论文][半监督分割]一致性损失

训练总损失:
[ 论文][半监督分割]一致性损失
其中,\(w_u \) 从0增长到固定值

扰动函数

提出三种不同类型的扰动函数:基于特征的扰动,基于预测的扰动以及随机扰动

基于特征的扰动
  1. 在样本上添加高斯分布的噪声
  2. 随机丢弃通道,mask部分活跃特征区域
基于预测的扰动

随机扰动

空间drop out

对于弱标签的探索

利用CAM将image-level label转换为pseudo label,并将此类数据先通过共享的encoder得到 \(z \),再分别受到K个扰动,通过对应的K个辅助decoder,得到K个输出,这K和输出分别和pseudo label对比,用交叉熵函数计算损失:
[ 论文][半监督分割]一致性损失

实验

Table1: CCT在数据集Pascal VOC上的表现

[ 论文][半监督分割]一致性损失

Table2: CCT在CS和CVD数据集上同时训练后分别测试的表现,n为labeled examples的数目**

[ 论文][半监督分割]一致性损失

Table3: CCT在CS和SUN上同时训练,并在CS和CVD上测试的表现

[ 论文][半监督分割]一致性损失

消融实验

1. CVD上的消融实验:对比不同的扰动方法对实验结果的影响

[ 论文][半监督分割]一致性损失

2. Pascal VOC上的消融实验:对比不同的扰动方法对实验结果的影响

[ 论文][半监督分割]一致性损失

Trick

用于避免过拟合———在训练阶段只计算像素对应概率低于闸值 \(n \) 的损失,其中\(n \)从 1/c 增大到0.9

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
美凌格栋栋酱 美凌格栋栋酱
6个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
待兔 待兔
1年前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Stella981 Stella981
3年前
28篇论文、6大主题带你一览CVPR2020研究趋势
  !(http://dingyue.ws.126.net/2020/0625/c176bdbej00qchkrg001ld200p000ang00it0080.jpg)  编译|陈大鑫  编辑|丛末  首度于线上召开的CVPR2020会议已经落下帷幕。今年,大会共有1467篇论文被接收,共举办了29个Tutorial、64
Stella981 Stella981
3年前
Raft论文《 In Search of an Understandable Consensus Algorithm (Extended Version) 》研读
Raft论文研读说明:本文为论文《InSearchofanUnderstandableConsensusAlgorithm(ExtendedVersion)》的个人理解,难免有理解不到位之处,欢迎交流与指正。论文地址:RaftPaper(https://www.oschin
Stella981 Stella981
3年前
ACL2020更新录取率,中国未进前五,机器学习提交量一骑绝尘
  !(http://dingyue.ws.126.net/2020/0607/d0197abep00qbjkdi0071c000m8009gc.png)  作者|蒋宝尚  编辑|丛末  ACL组委会真是肝!  5月19日刚刚公布了2020年被收录的论文,昨日又发博客分析了大会论文的录取领域。并且与2019年的ACL会议
Stella981 Stella981
3年前
PCANet
前言论文网站:http://arxiv.org/abs/1404.3606(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Farxiv.org%2Fabs%2F1404.3606)论文下载地址:PCANet:ASimpleDeepLearningBaseline
Wesley13 Wesley13
3年前
RGB
论文阅读:AdaptiveFusionforRGBDSalientObjectDetection这篇代码的创新点在于使用了SW层,使用SW\_logits\img\_logits(1SW\_logits)\(1depth\_logits)来获得最终的预测结果另外一个关键点是使用了3种loss损失值
Stella981 Stella981
3年前
Android蓝牙连接汽车OBD设备
//设备连接public class BluetoothConnect implements Runnable {    private static final UUID CONNECT_UUID  UUID.fromString("0000110100001000800000805F9B34FB");
Stella981 Stella981
3年前
Dubbo爆出严重漏洞!可导致网站被控制、数据泄露!附解决方案
http://dy.163.com/v2/article/detail/F5FPIFRU0511Q1AF.html  !(http://dingyue.ws.126.net/2020/0216/125ec4c4p00q5rcrs0019d200ig009qg00ig009q.png)  来源:华为云  原文地址:https://w
Stella981 Stella981
3年前
FunTester测试项目架构图初探
之前写了一篇FunTester测试框架架构图初探(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzU4MTE2NDEyMQ%3D%3D%26mid%3D2247489981%26idx%3D1%26sn%3Dbf5f34d