VSCode-v2通过引入混合提示专家层(MoPE)和两阶段训练优化视觉语义分割与隐蔽物体检测任务,结合知识蒸馏和对比学习机制提升多模态处理能力,在六项任务中实现性能平衡提升,并具备零样本泛化至RGB-D视频分割等新任务的能力。 摘要: 显著对象检测(SOD)和 ...