提出兼顾隐私合规与大模型训练效用的跨院放射影像去标识化流水线 在去除隐私信息的同时,确保脱敏数据仍能支撑视觉语言模型训练及跨院域迁移 在多中心数据集上实现高隐私保护,且VLM微调性能与使用原始数据几乎无差异 打破跨院数据孤岛,为合规训练医疗大模型提供数据基础
引入医生眼动数据作为先验,通过视觉注视提示微调大模型生成报告 将眼动注视特征转化为软提示注入LLM,引导模型聚焦与疾病表征高度相关的区域 生成的报告在临床准确性与结构一致性上显著提升,更贴合人类医生的诊断逻辑 融合人类认知先验,提升报告可解释性,加速放射科医生出诊
将伪影去除重构为上下文推理任务,适配视觉语言扩散基础模型实现数据高效去伪影 引入通用视觉语言扩散模型,结合LoRA参数高效微调,利用丰富视觉先验替代大量配对数据 在极少配对数据下达到SOTA去伪影效果,有效恢复被金属遮挡的解剖结构 降低去伪影对大量配对数据的依赖,提升植入物患者CT诊断质量
提出单步块扩散模型实现低延迟的X光报告并行生成 将多步去噪压缩为单步,结合块级扩散机制,在保证文本连贯性的同时大幅降低推理延迟 推理速度显著超越自回归与多步扩散模型,且报告文本质量与临床指标保持优异 有效缓解放射科医生报告撰写压力,具备嵌入PACS系统的实时潜力