盖世汽车讯 据外媒报道,在中国科学院合肥物质科学研究院刘勇教授的带领下,研究人员提出新框架,即基于视频片段的知识转移和关系上下文挖掘(Clip-based Knowledge Transfer and Relational Context Mining,CKT-RCM),以解决计算机视觉中的长尾分布问题。

中科院研究人员通过创新框架改善场景感知

图片来源:中科院

全景场景图(PSG)是场景图生成中的一个突出研究方向,需要图像中所有关系的全面输出以及目标定位的精确分割。PSG旨在通过计算机视觉模型提高对场景的理解,并支持场景描述和视觉推理等下游任务。