ECCV 2026 · CCF B · Accepted

Dynamic-V2C: Editable and Continual Vision-to-Concept Bottleneck Models via Influence Functions

中文项目页

概览方法结果

TL;DR

Dynamic-V2C 将 CBM 变成可编辑、可持续学习的视觉系统：用视觉落地的 V2C tokenization 表示概念，并用 influence-function 引擎支持快速模型编辑、伪相关调试、遗忘和概念词表扩展。

作者： Songning Lai, Shaofeng Liang, Jiayu Yang, Ninghui Feng, Yuxuan Fan, Wenshuo Chen
会议： European Conference on Computer Vision (ECCV 2026, CCF B), accepted
发布说明： 论文、引用和代码链接将在终稿（camera-ready）与开源制品（artifact release）流程完成后补充。

概览

Motivation of Dynamic-V2C

概念瓶颈模型（CBMs）通过人类可理解的概念路由预测，使模型决策可检查。然而，现有 CBM 在部署后维护困难：文本驱动概念可能缺乏视觉落地，伪相关通常需要完整重训才能修正，连续任务还可能覆盖已有概念知识。

Dynamic-V2C 用统一的可编辑与持续学习 Vision-to-Concept Bottleneck Model 解决这些限制。它构建视觉落地的概念 tokenizer，在低维概念瓶颈中应用 influence functions 实现无需重训的快速编辑，并在持续学习中扩展概念词表，同时保护历史概念。

方法

Dynamic-V2C pipeline

Dynamic-V2C 包含三个核心组件：

Vision-to-Concept Tokenization： 将冻结视觉骨干网络的密集视觉特征投影到离散视觉概念词表，降低对抽象或非视觉 LLM 生成概念的依赖。
Influence-Function Editing： 在瓶颈层内部计算近似 inverse-Hessian 更新，无需完整重训即可进行目标数据级遗忘和概念级调试。
Interpretable Continual Learning： 当新任务无法由已有词表表示时加入新视觉概念，并用 influence-guided 正交投影保护历史概念知识。

关键设计是将昂贵的曲率计算限制在紧凑的概念瓶颈内，使编辑路径足够快，适合部署后的定向修复，同时保留透明的概念层推理。

结果

Dynamic-V2C 在 CUB、CelebA、OAI 和 Split-CIFAR100 上评估，关注预测效用、模型编辑速度、伪相关调试、面向隐私的输出级遗忘和持续学习。

快速数据级编辑

数据集	编辑目标	Dynamic-V2C 效用	Dynamic-V2C 运行时间
CUB	数据级遗忘	0.7963 ± 0.003 F1	39s
OAI	数据级遗忘	0.8808 ± 0.002 F1	141s

在 CUB 上，Dynamic-V2C 将完整重训所需的 5133 秒编辑时间降低到 39 秒，约 131× 更快，同时保持相当的效用。

伪相关调试

设置	平均准确率	最差组准确率	运行时间
CelebA 性别调试	94.0 ± 0.2	81.5 ± 0.7	< 2s

Dynamic-V2C 识别导致伪相关行为的训练样本和概念路径，并通过 influence-function 更新抑制这些路径，无需重训整个模型。

Spurious correlation debugging with Dynamic-V2C

持续概念学习

设置	最终平均准确率	反向迁移
Split-CIFAR100（10 个任务）	78.5 ± 0.6	-3.1 ± 0.4

持续学习结果表明，Dynamic-V2C 能够为新任务扩展概念词表，并显著减少灾难性遗忘。

Continual learning curve for Dynamic-V2C

概念可视化

Dynamic-V2C concept visualization

Dynamic-V2C 将预测落地到可检查的视觉概念中。定性示例展示了细粒度鸟类识别和人脸属性预测中的概念贡献，使正向与负向概念证据都更加明确。

发布

论文已被 ECCV 2026 接收。公开 PDF、引用元数据和代码仓库链接将在终稿（camera-ready）与开源制品（artifact release）流程就绪后补充。

← 返回首页