在计算机视觉领域,上下文依赖概念指那些一旦没有特定背景环境的空间上下文信息衬托,就无法被明确认知和理解的概念,如视觉显著性、视觉伪装、工业缺陷和医学病灶等。这些概念依赖全局和局部背景信息,在不同环境下可能失去识别性,要求算法具备强大的上下文理解能力。因而,与上下文依赖概念相关的目标分割方法研究一直是计算机视觉领域的热门课题之一,并在智能医学诊断、自动驾驶、工业质量评估等诸多实际问题中都有Brief Pathological Narcissism Inventory着重要的应用。随着深度学习、计算机算力及多场景数据集的发展,以及Chat GPT等人工智能通用大模型的影响,推动了学术界对特性场景下的专家模型与通用场景下的统一模型的研究热度。然而,距离完美地分割一切目标这一最终期望仍面临众多挑战,包括如何在特性场景中挖掘有效的多维度互补线索,如何实现有效的多线索特征融合;如何开发适用于多种场景及概念的高泛化性网络结构,如何设计高效的多场景-多概念统一分割模型。针对上述难题,本文以上下文依赖概念的目标分割为研究导向,基于多场景的实现条件出发,分别开展适应特性场景与通用场景的分割算法模型设计。本文主要的贡献和创新点如下:(1)针对自然场景中显著目标检测模型对深度信息的依赖问题,本文提出了一个多任务-多模态滤波Transformer模型,首次实现了显著目标检测、深度估计、轮廓提取的多任务联合学习。通过内嵌的多模态Transformer组件,网络有效融合了三种模态线索。为了避免跨模态注意力稀释特征,设计了模态特定滤波器,突出每个模态与任务相关的特征表达。最终,多任务-多模态滤波Transformer模型无需深度信息输入即可完成精准的显著目标分割,解决了高质量深度传感器的高成本和低质量传感器的噪声问题。实验结果表明,该模型在多个显著目标检测数据集上取得了领先性能,并凭借能够同时预测高质量深度与显著性图的能力,显示出良好的图像虚化应用潜力。(2)针对工业场景数据集稀有、图像背景干扰多样、目标极小化问题,本文研究X射线工业图像中的动力电池极片这一上下文依赖概念,构建了领域内首个高质量的多样化X射线图像动力电池检测数据集,设计了基于多维线索协同学习算法。通过发掘电池极片的点、线、数量三个维度的结构化线索,综合不同维度信息的优势,增强电池极片的微弱特征,进而实现有效地捕获极小电池片的位置信息。为了提升算法对于非标极片外观的抗干扰能力,引入了清晰无干扰的纯净类型极片及其深层特征作为锚参考信息,从而引导算法对极片外观规则定义的正确理解。实验结果表明,该算法面对动力电池检测这一新工业挑战,实现了超过95%准确率的常规电池检测效果。(3)为探索具有概念通用性的分割模型,本文总结了三个基本需求:突出前景抑制背景、捕获多尺度目标、清晰分割目标主体及边缘,进而提出了通用门控分割模型。该模型通过多级门控单元自适应控制编码器块向解码器的信息流,抑制背景特征。针对多尺度Fulvestrant配制问题,设计了即插即用的折叠空洞卷积,依靠对邻近区域的像素捕获,实现了在传统卷积高参数与空洞卷积高稀疏之间的平衡,提升了现有多尺度模块关于细微结构的感知能力。最后,门控分割模型采用双分支残差结构,结合渐进式和并行式优点,实现精准主体定位与锐利边缘分割。实验结果表明,该模型在显著、伪装、阴影、透明、肠息肉、肺部感染、乳腺及皮肤病灶等8个不同的上下文依赖概念的目标分割任务中,均取得了优异的分割性能,展现出强大的通用性与泛化性。(4)为探索适用于多概念理解的参数统一分割模型,本文提出了基于概念提示的参数统一模型——确认细节Spider,其在完成多种概念的目标分割任务时,仅需一次训练和推理。与以往前端或中端提示嵌入模型不同,Spider采用尾端提示嵌入方式,最大化通用概念和场景信息的特征挖掘。通过选取图像组、前景掩码组和背景掩码组作为提示信息,凝练图像组-前景组查询和图像组-背景组查询过程中概念匹配的知识,实现目标图像与提示图像之间的特征交互。最后,依靠提出的前馈平衡-反馈统一的训练策略,帮助Spider模型平等的对待训练过程中遇见的每个概念,而不产生概念偏向。实验结果表明,Spider实现了一次训练、一种结构、一套参数、一次推理的高效模型,为统一多场景-多上下文依赖概念的目标分割提供了一个强大基线。